Los procesos “zombie” o “defunct” (difunto) son procesos que se han ejecutado completamente pero aún están en la tabla de procesos, permitiendo a quien lo ha creado leer su estado de salida. El proceso ha terminado, pero su resultado no ha sido leído. Podéis leer más en la wiki: http://es.wikipedia.org/wiki/Proceso_zombie

Estos procesos se crean básicamente por dos razones: mala programación o lentitud del sistema.

En el caso de servidores Nagios, lamentablemente se trata de lentitud del sistema.

Para saber los procesos zombie de nuestro servidor basta con entrar por SSH y lanzar un TOP

: top - 11:31:52 up 33 min, 2 users, load average: 0.37, 0.63, 0.81

Tasks: 186 total, 1 running, 185 sleeping, 0 stopped, 0 zombie

Cpu(s): 11.9%us, 1.7%sy, 0.0%ni, 86.2%id, 0.1%wa, 0.1%hi, 0.1%si, 0.0%st

Mem: 3917212k total, 745504k used, 3171708k free, 24472k buffers

Swap: 2064376k total, 0k used, 2064376k free, 243748k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1804 nagios 20 0 148m 13m 2280 S 5.0 0.3 0:00.15 check_wmi_plus.

1805 nagios 20 0 148m 13m 2288 S 5.0 0.3 0:00.15 check_wmi_plus.

1428 apache 20 0 434m 21m 4412 S 4.3 0.6 0:22.87 httpd

1515 apache 20 0 434m 21m 4412 S 4.3 0.6 0:20.46 httpd

1433 apache 20 0 434m 21m 4412 S 4.0 0.6 0:22.41 httpd

1022 postgres 20 0 210m 7740 5384 S 1.0 0.2 0:00.45 postmaster

1005 nagios 20 0 223m 28m 7984 S 0.7 0.7 0:00.40 php

36 root 20 0 0 0 0 S 0.3 0.0 0:00.66 kblockd/0

1004 nagios 20 0 216m 21m 7756 S 0.3 0.6 0:00.11 php

1020 postgres 20 0 210m 6004 3736 S 0.3 0.2 0:00.05 postmaster

1257 mysql 20 0 2174m 38m 6056 S 0.3 1.0 0:14.01 mysqld

1434 ajaxterm 20 0 163m 7712 1400 S 0.3 0.2 0:00.60 python

1472 nagios 20 0 31564 4664 988 S 0.3 0.1 0:08.73 nagios

1746 root 20 0 15148 1436 1008 R 0.3 0.0 0:04.47 top

1 root 20 0 19228 1492 1224 S 0.0 0.0 0:00.97 init

2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd

3 root RT 0 0 0 0 S 0.0 0.0 0:00.11 migration/0

4 root 20 0 0 0 0 S 0.0 0.0 0:00.03 ksoftirqd/0

5 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0

6 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0

Si queremos listar los procesos zombie podemos hacer:

ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'

En caso de tener muchos procesos zombie en nuestro servidor Nagios, lo más probable es que tengas que aumentar los recursos del servidor (podéis utilizar las tablas suministradas por Nagios).

"