Видео ролики бесплатно онлайн

Смотреть на русском языке видео

Официальный сайт fresher 24/7/365

Смотреть видео бесплатно

kirpich 14.11.2012 20:25

Есть проблема!Ребут раз в час

Добрый день. Имеется проблема с которой разобраться уже не в силах, и понять в чем проблема не могу. Может уже глаз замылился.

Есть шлюзик на арче раздающий интернет и делающий бэкапы. При этом раз в час происходит ребут. Что примечательно, если я обновляю его, перезагружаю руками, то он какое то время работает нормально. Может так работать неделю-две, потом снова ребуты. Подскажите куда копать?

P.S. Шлюзов аналогичных по софту и задачам несколько, проблема только с одним.

UPD. кусок выхлопа last

reboot system boot 3.6.3-1-ARCH Wed Nov 14 17:37 - 21:06 (03:29)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 16:37 - 21:06 (04:29)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 15:36 - 21:06 (05:30)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 14:36 - 21:06 (06:30)
reboot system boot 3.6.3-1-ARCH Wed Nov 14 13:36 - 21:06 (07:30)

kernel.log на стыке перезагрузки

Nov 13 23:31:39 kpd-gw kernel: [ 19.646040] nf_conntrack version 0.5.0 (16384 buckets, 65536 max)
Nov 14 00:32:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpuset

uptime 50 минут - температура в норме. load average 2


Тэги:
+ 0 -
Похожие Поделиться

thebeetlebum 14.11.2012 20:52 #
+ 0 -
Посмотрите в крон. Помониторьте системные метрики. Можно в т.ч. sensors. Возможно кто-то перегружается или перегревается.
kirpich 14.11.2012 21:14 #
+ 0 -
cron обсмотрен до дыр. выключался нафиг, так же выключался бэкап дабы не грузить файловую подсистему - все бесполезно. Сенсоры не смотрел, надо мониторить, но странно ровно час.
linuxmaster 14.11.2012 21:02 #
+ 0 -
Такие проблемы обычно связаны с перегревом под нагрузкой.
kirpich 14.11.2012 21:14 #
+ 0 -
когда выключал backup - нагрузки 0. Проблемы те же. Да и интервал ровно в час для меня непонятен.
cppmm 14.11.2012 21:15 #
+ 0 -
Ну а в логах что?
kirpich 14.11.2012 21:16 #
+ 0 -
а в логах обычная работа шлюза до определенного времени, а потом лог загрузки. и дальше все как обычно
cppmm 14.11.2012 21:22 #
+ 0 -
Как обычно - это как?
Если система выключается штатно, там должно быть написано что-то типа
Nov 14 00:57:42 damned kdm: :0[1303]: pam_unix(kde:session): session closed for user cppmm
Nov 13 23:57:43 damned shutdown[1833]: shutting down for system reboot
Nov 13 23:57:43 damned init: Switching to runlevel: 6
Nov 13 23:57:44 damned sshd[1219]: Received signal 15; terminating.
Nov 13 23:57:50 damned syslog-ng[949]: Termination requested via signal, terminating;
Nov 13 23:57:50 damned syslog-ng[949]: syslog-ng shutting down; version='3.2.5'

От того, есть подобные записи или нет, зависит дальнейшее направление поисков. Если есть - надо искать того, кто даёт команду на выключение, если нет - надо искать причину аварийного выключения.
kirpich 14.11.2012 21:26 #
+ 0 -
выше кусок ласта. перезагрузка аварийная.
cppmm 14.11.2012 21:32 #
+ 0 -
Покажи последние строк 20 перед ребутом из messages. Так же надо таки смотреть крон. Возможно он там дёргает какую-нибудь незначительную программку, которая в свою очередь создаёт проблемы. Не знаю, как там у вас в арче, в большинстве дистров помимо непосредственно crontab'а есть ещё всяик cron.d/cron.hourly и т.д. Так же стоит заглянуть в личные кронзаписи пользователей(если такие есть) и рута - crontab -e.
Ну и до кучи давай список процессов(ps waux). Если в процессах имеются какие-то специфичные самописные программы, не помешает краткое пояснение.
cppmm 14.11.2012 21:33 #
+ 0 -
И да.LA 2 - это великовато для "простого рутера".
kirpich 14.11.2012 21:39 #
+ 0 -
просто роутер ещё и backup server вроде упоминал.
le087 14.11.2012 21:37 #
+ 2 -
Настрой atop, что бы он тебе дампил состояние системы почаще, потом проанализируй, что было в момент перед перезагрузкой.

Не забудь проверить ротацию логов атопа, а то сожрет дисковое пространство.

Рекомендую проверить на битость оперативную память, если еще не делал.
kirpich 14.11.2012 21:41 #
+ 0 -
смущает интервал перезагрузок. Если проблемы с железом ну не будет периодичность одинаковой. Опять же обновление софта с перезагрузкой шлюза помогает на неделю.
le087 14.11.2012 21:51 #
+ 0 -
Исключать необходимо по порядку. Начинать хотя бы простенькую проверку в таких случаях именно с железа неплохо. Ибо если проблема именно в самом железе, то плюхаться с попыткой найти козлячее место в ПО будешь долго, а так проверил, убедился что все ОК, пошел дальше.

Какова конфигурация сервера? Уверен, что памяти хватает?
kirpich 14.11.2012 21:54 #
+ 0 -
4gb kingston, Core2 Duo E6550

thebeetlebum 14.11.2012 21:57 #
+ 0 -
пройдись memcheckом, полчаса времени, а уверенность в железе будет.
kirpich 14.11.2012 21:59 #
+ 0 -
шлюз удаленный. В пятницу временно воткну роутер и заберу железку на диагностику, вот только как диагностировать если после нормального ребута он живёт неделю я хз...
kirpich 14.11.2012 21:39 #
+ 0 -
ps waux

[root@kpd-gw log]# ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 364 ? Ss 20:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 20:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 20:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 20:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 20:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 20:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 20:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 20:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 20:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 20:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 20:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 20:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 20:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 20:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 20:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 20:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 20:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 20:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 20:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 20:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/0:2]
root 33 0.0 0.0 0 0 ? S< 20:38 0:00 [deferwq]
root 69 0.0 0.0 0 0 ? S 20:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 20:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_1]
root 78 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:2]
root 80 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 20:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/u:5]
root 92 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/0:1H]
root 94 0.0 0.0 0 0 ? S< 20:38 0:00 [kworker/1:1H]
root 104 0.0 0.0 0 0 ? S 20:38 0:02 [jbd2/sda2-8]
root 105 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 148 0.0 0.0 5080 780 ? Ss 20:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 204 0.3 0.0 0 0 ? S 20:38 0:10 [flush-8:0]
root 236 0.0 0.0 0 0 ? S< 20:38 0:00 [kpsmoused]
root 237 0.0 0.0 0 0 ? S 20:38 0:00 [kworker/1:2]
root 238 0.0 0.0 0 0 ? S< 20:38 0:00 [firewire]
root 240 0.0 0.0 0 0 ? S< 20:38 0:00 [kvm-irqfd-clean]
root 241 0.0 0.0 0 0 ? S 20:38 0:00 [irq/47-mei]
root 243 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio0]
root 244 0.0 0.0 0 0 ? S< 20:38 0:00 [ttm_swap]
root 249 0.0 0.0 0 0 ? S< 20:38 0:00 [hd-audio1]
root 263 0.0 0.0 0 0 ? S< 20:38 0:00 [kdmflush]
root 277 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 278 0.0 0.0 0 0 ? S 20:38 0:01 [jbd2/dm-0-8]
root 279 0.0 0.0 0 0 ? S< 20:38 0:00 [ext4-dio-unwrit]
root 285 0.2 0.0 0 0 ? S 20:38 0:07 [flush-254:0]
root 345 0.0 0.0 4420 196 ? S 20:38 0:00 supervising syslog-ng
root 346 0.0 0.0 7352 1304 ? Ss 20:38 0:00 /usr/sbin/syslog-ng
root 728 0.0 0.0 5084 1056 ? Ss 20:38 0:00 /usr/sbin/crond
root 759 0.0 0.0 6516 860 ? Ss 20:38 0:00 /usr/sbin/sshd
urbackup 786 32.6 1.8 174980 61028 ? Sl 20:38 18:00 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 866 0.0 0.1 14632 5208 ? Ss 20:38 0:00 /usr/sbin/named -4 -u named
root 915 0.0 0.0 7744 504 ? Ss 20:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 916 0.0 0.0 7920 844 ? S 20:38 0:00 nginx: worker process
root 941 0.0 0.0 2204 364 ? Ss 20:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 957 0.0 0.0 3788 392 tty1 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 958 0.0 0.0 3788 384 tty2 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 959 0.0 0.0 3788 388 tty3 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 960 0.0 0.0 3788 388 tty4 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 961 0.0 0.0 3788 376 tty5 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 962 0.0 0.0 3788 380 tty6 Ss+ 20:38 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 5884 1728 ? S 21:01 0:00 /USR/SBIN/CROND
root 967 0.0 0.0 0 0 ? Zs 21:01 0:00 [run-parts]
root 976 0.0 0.0 2684 964 ? S 21:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 988 0.0 0.0 4732 1336 pts/0 S 21:07 0:00 su
root 989 0.0 0.0 5244 2068 pts/0 S 21:07 0:00 bash
root 1007 0.0 0.0 4644 1204 pts/0 R+ 21:33 0:00 ps waux

Крон смотрен. Мне известно про cron.hourly weekly monthly...Крон выключался - ребуты оставались.
А так же искались руткиты и прочая нечисть.
kirpich 14.11.2012 21:51 #
+ 0 -
Лог вечерний. шлюз простаивает в messages только логи загрузки каждый час =)
кусок лога

Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 255.255.255.255.IN-ADDR.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: D.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 9.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: A.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: B.E.F.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: automatic empty zone: 8.B.D.0.1.0.0.2.IP6.ARPA
Nov 14 19:38:07 kpd-gw named[859]: command channel listening on 127.0.0.1#953
Nov 14 19:38:07 kpd-gw named[859]: managed-keys-zone: loaded serial 0
Nov 14 19:38:07 kpd-gw named[859]: zone 0.0.127.in-addr.arpa/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: zone localhost/IN: loaded serial 42
Nov 14 19:38:07 kpd-gw named[859]: all zones loaded
Nov 14 19:38:07 kpd-gw named[859]: running
Nov 14 19:38:07 kpd-gw pptpd[933]: MGR: Maximum of 100 connections reduced to 15, not enough IP addresses given
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Manager process started
Nov 14 19:38:07 kpd-gw pptpd[934]: MGR: Maximum of 15 connections available
Nov 14 19:58:29 kpd-gw -- MARK --
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: Start Script
Nov 14 20:01:02 kpd-gw NAMED-HINTUPDATE: End script
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpuset
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Initializing cgroup subsys cpu
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] Linux version 3.6.3-1-ARCH (tobias@testing) (gcc version 4.7.2 (GCC) ) #2 SMP PREEMPT Mon Oct 22 12:55:44 CEST 2012
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] e820: BIOS-provided physical RAM map:
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000000000-0x0000000000097fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000098000-0x000000000009ffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000cfd14fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd15000-0x00000000cfd16fff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfd17000-0x00000000cfdf0fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfdf1000-0x00000000cfee9fff] ACPI NVS
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeea000-0x00000000cfeedfff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeee000-0x00000000cfef2fff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef3000-0x00000000cfef3fff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfef4000-0x00000000cfefefff] ACPI data
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cfeff000-0x00000000cfefffff] usable
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000cff00000-0x00000000cfffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000f0000000-0x00000000f7ffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x00000000fff00000-0x00000000ffffffff] reserved
Nov 14 20:38:10 kpd-gw kernel: [ 0.000000] BIOS-e820: [mem 0x0000000100000000-0x000000012bffffff] usable
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] Notice: NX (Execute Disable) protection cannot be enabled: non-PAE kernel!
Nov 14 20:38:11 kpd-gw kernel: [ 0.000000] DMI 2.4 present.

cppmm 14.11.2012 22:11 #
+ 0 -
Вот это кто-то дёрнул крона.
root 966 0.0 0.0 5884 1728 ? S 21:01 0:00 /USR/SBIN/CROND

А вот тут, похоже, крон(или его ребёнок) почему-то помер.
root 967 0.0 0.0 0 0 ? Zs 21:01 0:00 [run-parts]

Что говорит pstree -p ?
kirpich 14.11.2012 22:18 #
+ 0 -
pstree -p
pstree -p
init(1)─┬─agetty(945)
├─agetty(946)
├─agetty(947)
├─agetty(948)
├─agetty(949)
├─agetty(950)
├─crond(716)───crond(994)───run-parts(995)
├─named(854)
├─nginx(903)───nginx(904)
├─pptpd(929)
├─sadc(1004)
├─sshd(747)───sshd(957)───sshd(959)───bash(960)───su(966)───bash(967)───pstree(1005)
├─syslog-ng(333)───syslog-ng(334)
├─systemd-udevd(166)
└─urbackup_srv(774)─┬─{urbackup_srv}(799)
├─{urbackup_srv}(812)
├─{urbackup_srv}(850)
├─{urbackup_srv}(851)
├─{urbackup_srv}(852)
├─{urbackup_srv}(853)
├─{urbackup_srv}(932)
├─{urbackup_srv}(933)
├─{urbackup_srv}(934)
├─{urbackup_srv}(935)
├─{urbackup_srv}(936)
├─{urbackup_srv}(937)
└─{urbackup_srv}(939)


Сейчас крон включен. и в выхлопе ps естественнен ибо демон он.
cppmm 14.11.2012 22:23 #
+ 0 -
Я немного не про то. То, что он включён и висит демоном - это процесс с PID'ом 728.
А вот тот, у которого PID 966 - это выполнение какой-то задачи. И судя по всему при работе run-parts(PID 967) что-то то ли виснет, то ли просто падает и становится зомбом. (все PID'ы взял из вывода ps waux, потому как смотрю перед pstree, видимо, ребут был). Т.е. как минимум что-то в нём уже работает не так. Какая-то задача вешается.
kirpich 14.11.2012 22:28 #
+ 0 -
Снова вырубил crond. up 49 min. Ждать осталось 11 =)
cppmm 14.11.2012 22:30 #
+ 0 -
После выключения крона, но до ребута было бы не плохо ещё раз список процессов глянуть.
kirpich 14.11.2012 22:33 #
+ 0 -
ps waux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2164 352 ? Ss 21:38 0:00 init [3]
root 2 0.0 0.0 0 0 ? S 21:38 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/u:0H]
root 8 0.0 0.0 0 0 ? S 21:38 0:00 [migration/0]
root 9 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/0]
root 10 0.0 0.0 0 0 ? S 21:38 0:00 [migration/1]
root 12 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:0H]
root 13 0.0 0.0 0 0 ? S 21:38 0:00 [ksoftirqd/1]
root 14 0.0 0.0 0 0 ? S 21:38 0:00 [watchdog/1]
root 15 0.0 0.0 0 0 ? S< 21:38 0:00 [cpuset]
root 16 0.0 0.0 0 0 ? S< 21:38 0:00 [khelper]
root 17 0.0 0.0 0 0 ? S 21:38 0:00 [kdevtmpfs]
root 18 0.0 0.0 0 0 ? S< 21:38 0:00 [netns]
root 19 0.0 0.0 0 0 ? S 21:38 0:00 [bdi-default]
root 20 0.0 0.0 0 0 ? S< 21:38 0:00 [kblockd]
root 21 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/0:1]
root 22 0.0 0.0 0 0 ? S 21:38 0:01 [kworker/1:1]
root 23 0.0 0.0 0 0 ? S 21:38 0:00 [khungtaskd]
root 24 0.2 0.0 0 0 ? S 21:38 0:08 [kswapd0]
root 25 0.0 0.0 0 0 ? SN 21:38 0:00 [ksmd]
root 26 0.0 0.0 0 0 ? SN 21:38 0:00 [khugepaged]
root 27 0.0 0.0 0 0 ? S 21:38 0:00 [fsnotify_mark]
root 28 0.0 0.0 0 0 ? S< 21:38 0:00 [crypto]
root 31 0.0 0.0 0 0 ? S< 21:38 0:00 [kthrotld]
root 32 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/1:2]
root 33 0.0 0.0 0 0 ? S< 21:38 0:00 [deferwq]
root 74 0.0 0.0 0 0 ? S 21:38 0:00 [khubd]
root 75 0.0 0.0 0 0 ? S< 21:38 0:00 [ata_sff]
root 76 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_0]
root 77 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_1]
root 80 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_2]
root 81 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_3]
root 82 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_4]
root 83 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_5]
root 84 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_6]
root 85 0.0 0.0 0 0 ? S 21:38 0:00 [scsi_eh_7]
root 87 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:5]
root 89 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/u:7]
root 105 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/1:1H]
root 109 0.0 0.0 0 0 ? S< 21:38 0:00 [kworker/0:1H]
root 122 0.1 0.0 0 0 ? S 21:38 0:03 [jbd2/sda2-8]
root 123 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 166 0.0 0.0 5136 836 ? Ss 21:38 0:00 /usr/lib/systemd/systemd-udevd --daemon
root 219 0.3 0.0 0 0 ? S 21:38 0:10 [flush-8:0]
root 224 0.0 0.0 0 0 ? S< 21:38 0:00 [firewire]
root 228 0.0 0.0 0 0 ? S< 21:38 0:00 [kpsmoused]
root 229 0.0 0.0 0 0 ? S 21:38 0:00 [kworker/0:2]
root 230 0.0 0.0 0 0 ? S< 21:38 0:00 [ttm_swap]
root 231 0.0 0.0 0 0 ? S 21:38 0:00 [irq/49-mei]
root 233 0.0 0.0 0 0 ? S< 21:38 0:00 [kvm-irqfd-clean]
root 234 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio0]
root 237 0.0 0.0 0 0 ? S< 21:38 0:00 [hd-audio1]
root 251 0.0 0.0 0 0 ? S< 21:38 0:00 [kdmflush]
root 265 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 266 0.0 0.0 0 0 ? S 21:38 0:00 [jbd2/dm-0-8]
root 267 0.0 0.0 0 0 ? S< 21:38 0:00 [ext4-dio-unwrit]
root 273 0.3 0.0 0 0 ? S 21:38 0:12 [flush-254:0]
root 333 0.0 0.0 4420 196 ? S 21:38 0:00 supervising syslog-ng
root 334 0.0 0.0 7352 1192 ? Ss 21:38 0:00 /usr/sbin/syslog-ng
root 747 0.0 0.0 6516 808 ? Ss 21:38 0:00 /usr/sbin/sshd
urbackup 774 37.1 0.6 139960 21160 ? Sl 21:38 19:41 /usr/bin/urbackup_srv --daemon --plugin /usr/lib/liburbackupserver_urlplugin.so --plugin /usr/lib/liburbackupserver_down
named 854 0.0 0.1 14632 5092 ? Ss 21:38 0:00 /usr/sbin/named -4 -u named
root 903 0.0 0.0 7744 504 ? Ss 21:38 0:00 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
http 904 0.0 0.0 7920 844 ? S 21:38 0:00 nginx: worker process
root 929 0.0 0.0 2204 360 ? Ss 21:38 0:00 pptpd -c /etc/pptpd.conf -p /var/run/pptpd.pid
root 945 0.0 0.0 3788 360 tty1 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty1 linux
root 946 0.0 0.0 3788 360 tty2 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty2 linux
root 947 0.0 0.0 3788 360 tty3 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty3 linux
root 948 0.0 0.0 3788 364 tty4 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty4 linux
root 949 0.0 0.0 3788 360 tty5 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty5 linux
root 950 0.0 0.0 3788 360 tty6 Ss+ 21:39 0:00 /sbin/agetty -8 -s 38400 tty6 linux
root 966 0.0 0.0 4732 688 pts/0 S 21:47 0:00 su
root 967 0.0 0.0 5232 1508 pts/0 S 21:47 0:00 bash
root 1004 0.0 0.0 2684 688 ? S 22:01 0:00 /usr/lib/sa/sadc -F -L 600 6 -
root 1047 0.0 0.0 4644 1196 pts/0 R+ 22:31 0:00 ps waux

pstree -p

pstree -p
init(1)─┬─agetty(945)
├─agetty(946)
├─agetty(947)
├─agetty(948)
├─agetty(949)
├─agetty(950)
├─named(854)
├─nginx(903)───nginx(904)
├─pptpd(929)
├─sadc(1004)
├─sshd(747)───sshd(957)───sshd(959)───bash(960)───su(966)───bash(967)───pstree(1048)
├─syslog-ng(333)───syslog-ng(334)
├─systemd-udevd(166)
└─urbackup_srv(774)─┬─{urbackup_srv}(799)
├─{urbackup_srv}(812)
├─{urbackup_srv}(850)
├─{urbackup_srv}(851)
├─{urbackup_srv}(852)
├─{urbackup_srv}(853)
├─{urbackup_srv}(932)
├─{urbackup_srv}(933)
├─{urbackup_srv}(934)
├─{urbackup_srv}(935)
├─{urbackup_srv}(936)
├─{urbackup_srv}(937)
└─{urbackup_srv}(939)

kirpich 14.11.2012 22:42 #
+ 0 -
Все по часам =) up 3 min
cppmm 14.11.2012 23:01 #
+ 0 -
Да, странно. Надо тогда вырубать всех и искать, кто останется с ребутами. :)
Но раз такая точность, то кто-то должен работать периодически. Это может быть, например syslog(периодически ротатит логи) и named(дёргает зоны). nginx вроде не должен ничего такого творить, если только на нём нет каких-то кривых скриптов, sshd вообще не вариант, что делает этот бекап - я не знаю, но ты говорил, что уже выключал его. Ещё там этот sadc висит - с ним я ни разу не работал, так что вообще ничего не скажу.
kirpich 14.11.2012 23:12 #
+ 0 -
nginx там просто заглушка. sadc повесил коллега следить что ж происходит. сейчас потушу все навесное, посмотрим как себя поведет.
kirpich 14.11.2012 23:43 #
+ 0 -
а пофиг. оставил тока ssh все равно ребут.
cppmm 15.11.2012 00:04 #
+ 0 -
Ну, не знаю. У меня осталась только одна дурная идея. На случайный баг железа не похоже - слишком точно. Я бы попробовал сбросить в ноль биос - там в некоторых бывают свои таймеры, мало ли, может какой-то заглючил.
kirpich 15.11.2012 08:22 #
+ 0 -
интересная идея. нужно попробовать.
sKwa 15.11.2012 13:08 #
+ 0 -
Я бы проверил Power Supplier. Была схожая проблема, только интервалы не были такими "точными". Я бы проверил. Решил просто - подключил еще один Power Supplier и к нему все hdd.
dront78 15.11.2012 15:05 #
+ 1 -
попробуй еще на счет nmi_whatchdog поколбаситься
и заблеклистить iTCO_wdt

может в биосе баг а модули реагируют
kirpich 15.11.2012 20:32 #
+ 0 -
сделал rmmod iTCO_wdt
через час аптайма меня дисконнектнуло с сессии. ну и оно больше не поднимается. с утра мчу туда =)
maksimrussia 15.11.2012 20:42 #
+ 0 -
а просто выгрузить модуль низя было да?
kirpich 15.11.2012 23:13 #
+ 0 -
ну как бы rmmod и выгружает модули.
dront78 15.11.2012 20:50 #
+ 0 -
смотри логи на экране. заодно починишь )
kirpich 15.11.2012 23:13 #
+ 0 -
да да, с утра крэшдамп и погляжу.
maksimrussia 15.11.2012 20:41 #
+ 0 -
лучший совет
kirpich 15.11.2012 23:18 #
+ 0 -
Упс. Шлюзик снова в строю. пол часа аптайма. странно.
maksimrussia 15.11.2012 20:43 #
+ 0 -
арч на роутере с бекапами да ты смельчак
kirpich 15.11.2012 23:15 #
+ 0 -
арч не на роутере, а в качестве роутера, на нормальном железе. работает ещё 5 таких роутеров и проблем никаких в течении 2 лет. Это первая проблема и на единственном шлюзе.
kirpich 15.11.2012 23:26 #
+ 0 -
Поднялся он через 15 минут. ребуты продолжаются. В логах пусто. посмотрим что скажет nmi_whatchdog
kirpich 16.11.2012 12:03 #
+ 0 -
а nmi_whatchdog молчит =( забираю шлюзик на диагностику, о диагнозе отпишусь.

В хорошем качестве hd видео

Онлайн видео бесплатно


Смотреть русское с разговорами видео

Online video HD

Видео скачать на телефон

Русские фильмы бесплатно

Full HD video online

Смотреть видео онлайн

Смотреть HD видео бесплатно

School смотреть онлайн