kirpich 14.11.2012 20:25
Есть проблема! — Ребут раз в час
Добрый день. Имеется проблема с которой разобраться уже не в силах, и понять в чем проблема не могу. Может уже глаз замылился.Есть шлюзик на арче раздающий интернет и делающий бэкапы. При этом раз в час происходит ребут. Что примечательно, если я обновляю его, перезагружаю руками, то он какое то время работает нормально. Может так работать неделю-две, потом снова ребуты. Подскажите куда копать?
P.S. Шлюзов аналогичных по софту и задачам несколько, проблема только с одним.
UPD. кусок выхлопа last
reboot system boot 3.6.3-1-ARCH Wed Nov 14 17:37 - 21:06 (03:29)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 16:37 - 21:06 (04:29)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 15:36 - 21:06 (05:30)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 14:36 - 21:06 (06:30)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 13:36 - 21:06 (07:30)
kernel.log на стыке перезагрузки
Nov 13 23:31:39 kpd-gw kernel: [ 19.646040] nf_conntrack version 0.5.0 (16384 buckets, 65536 max)
Nov 14 00:32:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpuset
uptime 50 минут - температура в норме. load average 2
thebeetlebum 14.11.2012 20:52 #
+ 0 -
Посмотрите в крон. Помониторьте системные метрики. Можно в т.ч. sensors. Возможно кто-то перегружается или перегревается.
cron обсмотрен до дыр. выключался нафиг, так же выключался бэкап дабы не грузить файловую подсистему - все бесполезно. Сенсоры не смотрел, надо мониторить, но странно ровно час.
Такие проблемы обычно связаны с перегревом под нагрузкой.
когда выключал backup - нагрузки 0. Проблемы те же. Да и интервал ровно в час для меня непонятен.
а в логах обычная работа шлюза до определенного времени, а потом лог загрузки. и дальше все как обычно
Как обычно - это как?
Если система выключается штатно, там должно быть написано что-то типа
От того, есть подобные записи или нет, зависит дальнейшее направление поисков. Если есть - надо искать того, кто даёт команду на выключение, если нет - надо искать причину аварийного выключения.
Если система выключается штатно, там должно быть написано что-то типа
Nov 14 00:57:42 damned kdm: :0[1303]: pam_unix(kde:session): session closed for user cppmm
Nov 13 23:57:43 damned shutdown[1833]: shutting down for system reboot
Nov 13 23:57:43 damned init: Switching to runlevel: 6
Nov 13 23:57:44 damned sshd[1219]: Received signal 15; terminating.
Nov 13 23:57:50 damned syslog-ng[949]: Termination requested via signal, terminating;
Nov 13 23:57:50 damned syslog-ng[949]: syslog-ng shutting down; version='3.2.5'
Nov 13 23:57:43 damned shutdown[1833]: shutting down for system reboot
Nov 13 23:57:43 damned init: Switching to runlevel: 6
Nov 13 23:57:44 damned sshd[1219]: Received signal 15; terminating.
Nov 13 23:57:50 damned syslog-ng[949]: Termination requested via signal, terminating;
Nov 13 23:57:50 damned syslog-ng[949]: syslog-ng shutting down; version='3.2.5'
От того, есть подобные записи или нет, зависит дальнейшее направление поисков. Если есть - надо искать того, кто даёт команду на выключение, если нет - надо искать причину аварийного выключения.
Покажи последние строк 20 перед ребутом из messages. Так же надо таки смотреть крон. Возможно он там дёргает какую-нибудь незначительную программку, которая в свою очередь создаёт проблемы. Не знаю, как там у вас в арче, в большинстве дистров помимо непосредственно crontab'а есть ещё всяик cron.d/cron.hourly и т.д. Так же стоит заглянуть в личные кронзаписи пользователей(если такие есть) и рута - crontab -e.
Ну и до кучи давай список процессов(ps waux). Если в процессах имеются какие-то специфичные самописные программы, не помешает краткое пояснение.
Ну и до кучи давай список процессов(ps waux). Если в процессах имеются какие-то специфичные самописные программы, не помешает краткое пояснение.
Настрой atop, что бы он тебе дампил состояние системы почаще, потом проанализируй, что было в момент перед перезагрузкой.
Не забудь проверить ротацию логов атопа, а то сожрет дисковое пространство.
Рекомендую проверить на битость оперативную память, если еще не делал.
Не забудь проверить ротацию логов атопа, а то сожрет дисковое пространство.
Рекомендую проверить на битость оперативную память, если еще не делал.
смущает интервал перезагрузок. Если проблемы с железом ну не будет периодичность одинаковой. Опять же обновление софта с перезагрузкой шлюза помогает на неделю.
Исключать необходимо по порядку. Начинать хотя бы простенькую проверку в таких случаях именно с железа неплохо. Ибо если проблема именно в самом железе, то плюхаться с попыткой найти козлячее место в ПО будешь долго, а так проверил, убедился что все ОК, пошел дальше.
Какова конфигурация сервера? Уверен, что памяти хватает?
Какова конфигурация сервера? Уверен, что памяти хватает?
пройдись memcheckом, полчаса времени, а уверенность в железе будет.
шлюз удаленный. В пятницу временно воткну роутер и заберу железку на диагностику, вот только как диагностировать если после нормального ребута он живёт неделю я хз...
ps waux
[root@kpd-gw log]# ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 364 ? Ss 20:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 20:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 20:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 20:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 20:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 20:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 20:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 20:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 20:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 20:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 20:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 20:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 20:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 20:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 20:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 20:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 20:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/0:2]
root 33 0.0 0.0 0 0 ? S< 20:38 0:00 [deferwq]
root 69 0.0 0.0 0 0 ? S 20:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 20:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_1]
root 78 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:2]
root 80 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:5]
root 92 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:1H]
root 94 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:1H]
root 104 0.0 0.0 0 0 ? S 20:38 0:02 [jbd2/sda2-8]
root 105 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 148 0.0 0.0 5080 780 ? Ss 20:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 204 0.3 0.0 0 0 ? S 20:38 0:10 [flush-8:0]
root 236 0.0 0.0 0 0 ? S< 20:38 0:00 [kpsmoused]
root 237 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/1:2]
root 238 0.0 0.0 0 0 ? S< 20:38 0:00 [firewire]
root 240 0.0 0.0 0 0 ? S< 20:38 0:00 [kvm-irqfd-clean]
root 241 0.0 0.0 0 0 ? S 20:38 0:00 [irq/47-mei]
root 243 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio0]
root 244 0.0 0.0 0 0 ? S< 20:38 0:00 [ttm_swap]
root 249 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio1]
root 263 0.0 0.0 0 0 ? S< 20:38 0:00 [kdmflush]
root 277 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 278 0.0 0.0 0 0 ? S 20:38 0:01 [jbd2/dm-0-8]
root 279 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 285 0.2 0.0 0 0 ? S 20:38 0:07 [flush-254:0]
root 345 0.0 0.0 4420 196 ? S 20:38 0:00 supervising syslog-ng
root 346 0.0 0.0 7352 1304 ? Ss 20:38 0:00 /usr/sbin/syslog-ng
root 728 0.0 0.0 5084 1056 ? Ss 20:38 0:00 /usr/sbin/crond
root 759 0.0 0.0 6516 860 ? Ss 20:38 0:00 /usr/sbin/sshd
urbackup 786 32.6 1.8 174980 61028 ? Sl 20:38 18:00 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 866 0.0 0.1 14632 5208 ? Ss 20:38 0:00 /usr/sbin/named -4 -u named
root 915 0.0 0.0 7744 504 ? Ss 20:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 916 0.0 0.0 7920 844 ? S 20:38 0:00 nginx: worker process
root 941 0.0 0.0 2204 364 ? Ss 20:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 957 0.0 0.0 3788 392 tty1 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 958 0.0 0.0 3788 384 tty2 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 959 0.0 0.0 3788 388 tty3 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 960 0.0 0.0 3788 388 tty4 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 961 0.0 0.0 3788 376 tty5 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 962 0.0 0.0 3788 380 tty6 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 5884 1728 ? S 21:01 0:00 /USR/SBIN/CROND
root 967 0.0 0.0 0 0 ? Zs 21:01 0:00 [run-parts]
root 976 0.0 0.0 2684 964 ? S 21:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 988 0.0 0.0 4732 1336 pts/0 S 21:07 0:00 su
root 989 0.0 0.0 5244 2068 pts/0 S 21:07 0:00 bash
root 1007 0.0 0.0 4644 1204 pts/0 R+ 21:33 0:00 ps waux
Крон смотрен. Мне известно про cron.hourly weekly monthly...Крон выключался - ребуты оставались.
А так же искались руткиты и прочая нечисть.
[root@kpd-gw log]# ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 364 ? Ss 20:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 20:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 20:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 20:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 20:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 20:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 20:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 20:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 20:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 20:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 20:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 20:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 20:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 20:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 20:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 20:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 20:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/0:2]
root 33 0.0 0.0 0 0 ? S< 20:38 0:00 [deferwq]
root 69 0.0 0.0 0 0 ? S 20:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 20:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_1]
root 78 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:2]
root 80 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:5]
root 92 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:1H]
root 94 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:1H]
root 104 0.0 0.0 0 0 ? S 20:38 0:02 [jbd2/sda2-8]
root 105 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 148 0.0 0.0 5080 780 ? Ss 20:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 204 0.3 0.0 0 0 ? S 20:38 0:10 [flush-8:0]
root 236 0.0 0.0 0 0 ? S< 20:38 0:00 [kpsmoused]
root 237 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/1:2]
root 238 0.0 0.0 0 0 ? S< 20:38 0:00 [firewire]
root 240 0.0 0.0 0 0 ? S< 20:38 0:00 [kvm-irqfd-clean]
root 241 0.0 0.0 0 0 ? S 20:38 0:00 [irq/47-mei]
root 243 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio0]
root 244 0.0 0.0 0 0 ? S< 20:38 0:00 [ttm_swap]
root 249 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio1]
root 263 0.0 0.0 0 0 ? S< 20:38 0:00 [kdmflush]
root 277 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 278 0.0 0.0 0 0 ? S 20:38 0:01 [jbd2/dm-0-8]
root 279 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 285 0.2 0.0 0 0 ? S 20:38 0:07 [flush-254:0]
root 345 0.0 0.0 4420 196 ? S 20:38 0:00 supervising syslog-ng
root 346 0.0 0.0 7352 1304 ? Ss 20:38 0:00 /usr/sbin/syslog-ng
root 728 0.0 0.0 5084 1056 ? Ss 20:38 0:00 /usr/sbin/crond
root 759 0.0 0.0 6516 860 ? Ss 20:38 0:00 /usr/sbin/sshd
urbackup 786 32.6 1.8 174980 61028 ? Sl 20:38 18:00 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 866 0.0 0.1 14632 5208 ? Ss 20:38 0:00 /usr/sbin/named -4 -u named
root 915 0.0 0.0 7744 504 ? Ss 20:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 916 0.0 0.0 7920 844 ? S 20:38 0:00 nginx: worker process
root 941 0.0 0.0 2204 364 ? Ss 20:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 957 0.0 0.0 3788 392 tty1 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 958 0.0 0.0 3788 384 tty2 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 959 0.0 0.0 3788 388 tty3 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 960 0.0 0.0 3788 388 tty4 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 961 0.0 0.0 3788 376 tty5 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 962 0.0 0.0 3788 380 tty6 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 5884 1728 ? S 21:01 0:00 /USR/SBIN/CROND
root 967 0.0 0.0 0 0 ? Zs 21:01 0:00 [run-parts]
root 976 0.0 0.0 2684 964 ? S 21:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 988 0.0 0.0 4732 1336 pts/0 S 21:07 0:00 su
root 989 0.0 0.0 5244 2068 pts/0 S 21:07 0:00 bash
root 1007 0.0 0.0 4644 1204 pts/0 R+ 21:33 0:00 ps waux
Крон смотрен. Мне известно про cron.hourly weekly monthly...Крон выключался - ребуты оставались.
А так же искались руткиты и прочая нечисть.
Лог вечерний. шлюз простаивает в messages только логи загрузки каждый час =)
кусок лога
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 255.255.255.255.IN-ADDR.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: D.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 9.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: A.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: B.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.B.D.0.1.0.0.2.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: command channel listening on 127.0.0.1#953
Nov 14 19:38:07 kpd-gw named[859]: managed-keys-zone: loaded serial 0
Nov 14 19:38:07 kpd-gw named[859]: zone 0.0.127.in-addr.arpa/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: zone localhost/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: all zones loaded
Nov 14 19:38:07 kpd-gw named[859]: running
Nov 14 19:38:07 kpd-gw pptpd[933]: MGR: Maximum of 100 connections reduced to 15, not enough IP addresses given
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Manager process started
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Maximum of 15 connections available
Nov 14 19:58:29 kpd-gw -- MARK --
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: Start Script
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: End script
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpuset
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpu
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Linux version 3.6.3-1-ARCH (tobias@testing) (gcc version 4.7.2 (GCC) ) #2 SMP PREEMPT Mon Oct 22 12:55:44 CEST 2012
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] e820: BIOS-provided physical RAM map:
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000000000-0x0000000000097fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000098000-0x000000000009ffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000cfd14fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd15000-0x00000000cfd16fff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd17000-0x00000000cfdf0fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfdf1000-0x00000000cfee9fff] ACPI NVS
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeea000-0x00000000cfeedfff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeee000-0x00000000cfef2fff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef3000-0x00000000cfef3fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef4000-0x00000000cfefefff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeff000-0x00000000cfefffff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cff00000-0x00000000cfffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000f0000000-0x00000000f7ffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000fff00000-0x00000000ffffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000100000000-0x000000012bffffff] usable
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] Notice: NX (Execute Disable) protection cannot be enabled: non-PAE kernel!
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] DMI 2.4 present.
кусок лога
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 255.255.255.255.IN-ADDR.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: D.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 9.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: A.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: B.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.B.D.0.1.0.0.2.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: command channel listening on 127.0.0.1#953
Nov 14 19:38:07 kpd-gw named[859]: managed-keys-zone: loaded serial 0
Nov 14 19:38:07 kpd-gw named[859]: zone 0.0.127.in-addr.arpa/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: zone localhost/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: all zones loaded
Nov 14 19:38:07 kpd-gw named[859]: running
Nov 14 19:38:07 kpd-gw pptpd[933]: MGR: Maximum of 100 connections reduced to 15, not enough IP addresses given
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Manager process started
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Maximum of 15 connections available
Nov 14 19:58:29 kpd-gw -- MARK --
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: Start Script
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: End script
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpuset
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpu
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Linux version 3.6.3-1-ARCH (tobias@testing) (gcc version 4.7.2 (GCC) ) #2 SMP PREEMPT Mon Oct 22 12:55:44 CEST 2012
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] e820: BIOS-provided physical RAM map:
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000000000-0x0000000000097fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000098000-0x000000000009ffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000cfd14fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd15000-0x00000000cfd16fff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd17000-0x00000000cfdf0fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfdf1000-0x00000000cfee9fff] ACPI NVS
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeea000-0x00000000cfeedfff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeee000-0x00000000cfef2fff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef3000-0x00000000cfef3fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef4000-0x00000000cfefefff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeff000-0x00000000cfefffff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cff00000-0x00000000cfffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000f0000000-0x00000000f7ffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000fff00000-0x00000000ffffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000100000000-0x000000012bffffff] usable
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] Notice: NX (Execute Disable) protection cannot be enabled: non-PAE kernel!
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] DMI 2.4 present.
Вот это кто-то дёрнул крона.
А вот тут, похоже, крон(или его ребёнок) почему-то помер.
Что говорит pstree -p ?
root 966 0.0 0.0 5884 1728 ? S 21:01 0:00 /USR/SBIN/CROND
А вот тут, похоже, крон(или его ребёнок) почему-то помер.
root 967 0.0 0.0 0 0 ? Zs 21:01 0:00 [run-parts]
Что говорит pstree -p ?
pstree -p
Сейчас крон включен. и в выхлопе ps естественнен ибо демон он.
pstree -p
init(1)─┬─agetty(945)
├─agetty(946)
├─agetty(947)
├─agetty(948)
├─agetty(949)
├─agetty(950)
├─crond(716)───crond(994)───run-parts(995)
├─named(854)
├─nginx(903)───nginx(904)
├─pptpd(929)
├─sadc(1004)
├─sshd(747)───sshd(957)───sshd(959)───bash(960)───su(966)───bash(967)───pstree(1005)
├─syslog-ng(333)───syslog-ng(334)
├─systemd-udevd(166)
└─urbackup_srv(774)─┬─{urbackup_srv}(799)
├─{urbackup_srv}(812)
├─{urbackup_srv}(850)
├─{urbackup_srv}(851)
├─{urbackup_srv}(852)
├─{urbackup_srv}(853)
├─{urbackup_srv}(932)
├─{urbackup_srv}(933)
├─{urbackup_srv}(934)
├─{urbackup_srv}(935)
├─{urbackup_srv}(936)
├─{urbackup_srv}(937)
└─{urbackup_srv}(939)
init(1)─┬─agetty(945)
├─agetty(946)
├─agetty(947)
├─agetty(948)
├─agetty(949)
├─agetty(950)
├─crond(716)───crond(994)───run-parts(995)
├─named(854)
├─nginx(903)───nginx(904)
├─pptpd(929)
├─sadc(1004)
├─sshd(747)───sshd(957)───sshd(959)───bash(960)───su(966)───bash(967)───pstree(1005)
├─syslog-ng(333)───syslog-ng(334)
├─systemd-udevd(166)
└─urbackup_srv(774)─┬─{urbackup_srv}(799)
├─{urbackup_srv}(812)
├─{urbackup_srv}(850)
├─{urbackup_srv}(851)
├─{urbackup_srv}(852)
├─{urbackup_srv}(853)
├─{urbackup_srv}(932)
├─{urbackup_srv}(933)
├─{urbackup_srv}(934)
├─{urbackup_srv}(935)
├─{urbackup_srv}(936)
├─{urbackup_srv}(937)
└─{urbackup_srv}(939)
Сейчас крон включен. и в выхлопе ps естественнен ибо демон он.
Я немного не про то. То, что он включён и висит демоном - это процесс с PID'ом 728.
А вот тот, у которого PID 966 - это выполнение какой-то задачи. И судя по всему при работе run-parts(PID 967) что-то то ли виснет, то ли просто падает и становится зомбом. (все PID'ы взял из вывода ps waux, потому как смотрю перед pstree, видимо, ребут был). Т.е. как минимум что-то в нём уже работает не так. Какая-то задача вешается.
А вот тот, у которого PID 966 - это выполнение какой-то задачи. И судя по всему при работе run-parts(PID 967) что-то то ли виснет, то ли просто падает и становится зомбом. (все PID'ы взял из вывода ps waux, потому как смотрю перед pstree, видимо, ребут был). Т.е. как минимум что-то в нём уже работает не так. Какая-то задача вешается.
После выключения крона, но до ребута было бы не плохо ещё раз список процессов глянуть.
ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 352 ? Ss 21:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 21:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 21:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 21:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 21:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 21:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 21:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 21:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 21:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 21:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 21:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 21:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 21:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 21:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 21:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 21:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 21:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/1:2]
root 33 0.0 0.0 0 0 ? S< 21:38 0:00 [deferwq]
root 74 0.0 0.0 0 0 ? S 21:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 21:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_1]
root 80 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:5]
root 89 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:7]
root 105 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:1H]
root 109 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:1H]
root 122 0.1 0.0 0 0 ? S 21:38 0:03 [jbd2/sda2-8]
root 123 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 166 0.0 0.0 5136 836 ? Ss 21:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 219 0.3 0.0 0 0 ? S 21:38 0:10 [flush-8:0]
root 224 0.0 0.0 0 0 ? S< 21:38 0:00 [firewire]
root 228 0.0 0.0 0 0 ? S< 21:38 0:00 [kpsmoused]
root 229 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/0:2]
root 230 0.0 0.0 0 0 ? S< 21:38 0:00 [ttm_swap]
root 231 0.0 0.0 0 0 ? S 21:38 0:00 [irq/49-mei]
root 233 0.0 0.0 0 0 ? S< 21:38 0:00 [kvm-irqfd-clean]
root 234 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio0]
root 237 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio1]
root 251 0.0 0.0 0 0 ? S< 21:38 0:00 [kdmflush]
root 265 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 266 0.0 0.0 0 0 ? S 21:38 0:00 [jbd2/dm-0-8]
root 267 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 273 0.3 0.0 0 0 ? S 21:38 0:12 [flush-254:0]
root 333 0.0 0.0 4420 196 ? S 21:38 0:00 supervising syslog-ng
root 334 0.0 0.0 7352 1192 ? Ss 21:38 0:00 /usr/sbin/syslog-ng
root 747 0.0 0.0 6516 808 ? Ss 21:38 0:00 /usr/sbin/sshd
urbackup 774 37.1 0.6 139960 21160 ? Sl 21:38 19:41 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 854 0.0 0.1 14632 5092 ? Ss 21:38 0:00 /usr/sbin/named -4 -u named
root 903 0.0 0.0 7744 504 ? Ss 21:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 904 0.0 0.0 7920 844 ? S 21:38 0:00 nginx: worker process
root 929 0.0 0.0 2204 360 ? Ss 21:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 945 0.0 0.0 3788 360 tty1 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 946 0.0 0.0 3788 360 tty2 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 947 0.0 0.0 3788 360 tty3 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 948 0.0 0.0 3788 364 tty4 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 949 0.0 0.0 3788 360 tty5 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 950 0.0 0.0 3788 360 tty6 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 4732 688 pts/0 S 21:47 0:00 su
root 967 0.0 0.0 5232 1508 pts/0 S 21:47 0:00 bash
root 1004 0.0 0.0 2684 688 ? S 22:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 1047 0.0 0.0 4644 1196 pts/0 R+ 22:31 0:00 ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 352 ? Ss 21:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 21:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 21:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 21:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 21:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 21:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 21:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 21:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 21:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 21:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 21:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 21:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 21:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 21:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 21:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 21:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 21:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/1:2]
root 33 0.0 0.0 0 0 ? S< 21:38 0:00 [deferwq]
root 74 0.0 0.0 0 0 ? S 21:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 21:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_1]
root 80 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:5]
root 89 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:7]
root 105 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:1H]
root 109 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:1H]
root 122 0.1 0.0 0 0 ? S 21:38 0:03 [jbd2/sda2-8]
root 123 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 166 0.0 0.0 5136 836 ? Ss 21:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 219 0.3 0.0 0 0 ? S 21:38 0:10 [flush-8:0]
root 224 0.0 0.0 0 0 ? S< 21:38 0:00 [firewire]
root 228 0.0 0.0 0 0 ? S< 21:38 0:00 [kpsmoused]
root 229 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/0:2]
root 230 0.0 0.0 0 0 ? S< 21:38 0:00 [ttm_swap]
root 231 0.0 0.0 0 0 ? S 21:38 0:00 [irq/49-mei]
root 233 0.0 0.0 0 0 ? S< 21:38 0:00 [kvm-irqfd-clean]
root 234 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio0]
root 237 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio1]
root 251 0.0 0.0 0 0 ? S< 21:38 0:00 [kdmflush]
root 265 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 266 0.0 0.0 0 0 ? S 21:38 0:00 [jbd2/dm-0-8]
root 267 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 273 0.3 0.0 0 0 ? S 21:38 0:12 [flush-254:0]
root 333 0.0 0.0 4420 196 ? S 21:38 0:00 supervising syslog-ng
root 334 0.0 0.0 7352 1192 ? Ss 21:38 0:00 /usr/sbin/syslog-ng
root 747 0.0 0.0 6516 808 ? Ss 21:38 0:00 /usr/sbin/sshd
urbackup 774 37.1 0.6 139960 21160 ? Sl 21:38 19:41 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 854 0.0 0.1 14632 5092 ? Ss 21:38 0:00 /usr/sbin/named -4 -u named
root 903 0.0 0.0 7744 504 ? Ss 21:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 904 0.0 0.0 7920 844 ? S 21:38 0:00 nginx: worker process
root 929 0.0 0.0 2204 360 ? Ss 21:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 945 0.0 0.0 3788 360 tty1 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 946 0.0 0.0 3788 360 tty2 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 947 0.0 0.0 3788 360 tty3 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 948 0.0 0.0 3788 364 tty4 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 949 0.0 0.0 3788 360 tty5 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 950 0.0 0.0 3788 360 tty6 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 4732 688 pts/0 S 21:47 0:00 su
root 967 0.0 0.0 5232 1508 pts/0 S 21:47 0:00 bash
root 1004 0.0 0.0 2684 688 ? S 22:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 1047 0.0 0.0 4644 1196 pts/0 R+ 22:31 0:00 ps waux
pstree -p
pstree -p
init(1)─┬─agetty(945)
├─agetty(946)
├─agetty(947)
├─agetty(948)
├─agetty(949)
├─agetty(950)
├─named(854)
├─nginx(903)───nginx(904)
├─pptpd(929)
├─sadc(1004)
├─sshd(747)───sshd(957)───sshd(959)───bash(960)───su(966)───bash(967)───pstree(1048)
├─syslog-ng(333)───syslog-ng(334)
├─systemd-udevd(166)
└─urbackup_srv(774)─┬─{urbackup_srv}(799)
├─{urbackup_srv}(812)
├─{urbackup_srv}(850)
├─{urbackup_srv}(851)
├─{urbackup_srv}(852)
├─{urbackup_srv}(853)
├─{urbackup_srv}(932)
├─{urbackup_srv}(933)
├─{urbackup_srv}(934)
├─{urbackup_srv}(935)
├─{urbackup_srv}(936)
├─{urbackup_srv}(937)
└─{urbackup_srv}(939)
Да, странно. Надо тогда вырубать всех и искать, кто останется с ребутами. :)
Но раз такая точность, то кто-то должен работать периодически. Это может быть, например syslog(периодически ротатит логи) и named(дёргает зоны). nginx вроде не должен ничего такого творить, если только на нём нет каких-то кривых скриптов, sshd вообще не вариант, что делает этот бекап - я не знаю, но ты говорил, что уже выключал его. Ещё там этот sadc висит - с ним я ни разу не работал, так что вообще ничего не скажу.
Но раз такая точность, то кто-то должен работать периодически. Это может быть, например syslog(периодически ротатит логи) и named(дёргает зоны). nginx вроде не должен ничего такого творить, если только на нём нет каких-то кривых скриптов, sshd вообще не вариант, что делает этот бекап - я не знаю, но ты говорил, что уже выключал его. Ещё там этот sadc висит - с ним я ни разу не работал, так что вообще ничего не скажу.
nginx там просто заглушка. sadc повесил коллега следить что ж происходит. сейчас потушу все навесное, посмотрим как себя поведет.
Ну, не знаю. У меня осталась только одна дурная идея. На случайный баг железа не похоже - слишком точно. Я бы попробовал сбросить в ноль биос - там в некоторых бывают свои таймеры, мало ли, может какой-то заглючил.
Я бы проверил Power Supplier. Была схожая проблема, только интервалы не были такими "точными". Я бы проверил. Решил просто - подключил еще один Power Supplier и к нему все hdd.
попробуй еще на счет nmi_whatchdog поколбаситься
и заблеклистить iTCO_wdt
может в биосе баг а модули реагируют
и заблеклистить iTCO_wdt
может в биосе баг а модули реагируют
сделал rmmod iTCO_wdt
через час аптайма меня дисконнектнуло с сессии. ну и оно больше не поднимается. с утра мчу туда =)
через час аптайма меня дисконнектнуло с сессии. ну и оно больше не поднимается. с утра мчу туда =)
арч на роутере с бекапами да ты смельчак
арч не на роутере, а в качестве роутера, на нормальном железе. работает ещё 5 таких роутеров и проблем никаких в течении 2 лет. Это первая проблема и на единственном шлюзе.
Поднялся он через 15 минут. ребуты продолжаются. В логах пусто. посмотрим что скажет nmi_whatchdog