Los procesos “zombie” o “defunct” (difunto) son procesos que se han ejecutado completamente pero aún están en la tabla de procesos, permitiendo a quien lo ha creado leer su estado de salida. El proceso ha terminado, pero su resultado no ha sido leído. Podéis leer más en la wiki: http://es.wikipedia.org/wiki/Proceso_zombie
Estos procesos se crean básicamente por dos razones: mala programación o lentitud del sistema.
En el caso de servidores Nagios, lamentablemente se trata de lentitud del sistema.
Para saber los procesos zombie de nuestro servidor basta con entrar por SSH y lanzar un TOP
: top - 11:31:52 up 33 min, 2 users, load average: 0.37, 0.63, 0.81
Tasks: 186 total, 1 running, 185 sleeping, 0 stopped, 0 zombie
Cpu(s): 11.9%us, 1.7%sy, 0.0%ni, 86.2%id, 0.1%wa, 0.1%hi, 0.1%si, 0.0%st
Mem: 3917212k total, 745504k used, 3171708k free, 24472k buffers
Swap: 2064376k total, 0k used, 2064376k free, 243748k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1804 nagios 20 0 148m 13m 2280 S 5.0 0.3 0:00.15 check_wmi_plus.
1805 nagios 20 0 148m 13m 2288 S 5.0 0.3 0:00.15 check_wmi_plus.
1428 apache 20 0 434m 21m 4412 S 4.3 0.6 0:22.87 httpd
1515 apache 20 0 434m 21m 4412 S 4.3 0.6 0:20.46 httpd
1433 apache 20 0 434m 21m 4412 S 4.0 0.6 0:22.41 httpd
1022 postgres 20 0 210m 7740 5384 S 1.0 0.2 0:00.45 postmaster
1005 nagios 20 0 223m 28m 7984 S 0.7 0.7 0:00.40 php
36 root 20 0 0 0 0 S 0.3 0.0 0:00.66 kblockd/0
1004 nagios 20 0 216m 21m 7756 S 0.3 0.6 0:00.11 php
1020 postgres 20 0 210m 6004 3736 S 0.3 0.2 0:00.05 postmaster
1257 mysql 20 0 2174m 38m 6056 S 0.3 1.0 0:14.01 mysqld
1434 ajaxterm 20 0 163m 7712 1400 S 0.3 0.2 0:00.60 python
1472 nagios 20 0 31564 4664 988 S 0.3 0.1 0:08.73 nagios
1746 root 20 0 15148 1436 1008 R 0.3 0.0 0:04.47 top
1 root 20 0 19228 1492 1224 S 0.0 0.0 0:00.97 init
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
3 root RT 0 0 0 0 S 0.0 0.0 0:00.11 migration/0
4 root 20 0 0 0 0 S 0.0 0.0 0:00.03 ksoftirqd/0
5 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
6 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
Si queremos listar los procesos zombie podemos hacer:
ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
En caso de tener muchos procesos zombie en nuestro servidor Nagios, lo más probable es que tengas que aumentar los recursos del servidor (podéis utilizar las tablas suministradas por Nagios).
"