From: Ivan Adzhubey <iadzhubey@rics.bwh.harvard.edu> To: hardware@altlinux.ru Subject: Re: [Hardware] Кто-нибудь имеет статистику по эффективности nmi_watchdog? Date: Mon, 5 Jul 2004 13:39:14 -0400 Message-ID: <200407051339.14679.iadzhubey@rics.bwh.harvard.edu> (raw) In-Reply-To: <20040705102439.GA1283@master.mivlgu.local> On Monday 05 July 2004 06:24 am, Sergey Vlasov wrote: > On Sun, Jul 04, 2004 at 08:56:52PM -0400, Ivan Adzhubey wrote: > > Это все так, в теории, но вот я неполенился сходить на работу посмотреть > > на умершую ноду. На консоли написано: NMI Watchdog detected lockup on > > CPU0, потом идет дамп регистров и в конце: Shutting up console... И все, > > висим. То есть watchdog вроде бы сработал, но почему машину не > > перегрузил?? В параметрах загрузки ядра стоит: panic=30, то есть должны > > через тридцать секунд после oops'а перегрузиться автоматом. Фиг вам. И > > как это понимать? > > Там делается не panic, а do_exit(SIGSEGV) - т.е., если зависание произошло > в контексте какого-либо процесса, убивается только этот процесс. Впрочем, > убивается он достаточно грубо, так что система всё равно вряд ли продолжит > работу после этого. Угу, я уже сам слазил в исходники и посмотрел. А документация на сайте RedHat врет... > nmi_watchdog - это в первую очередь отладочный инструмент; по выданному в > результате его срабатывания backtrace нужно смотреть, на чём именно > повисло (как правило, это какой-то spinlock), и по этим данным искать > ошибку. Значит попробуем softdog. Но как я понимаю, к модулю кернеля нужен еще и userspace daemon, а в Сизифе ничего такого нет. Да и вообще, кроме старого дебиановского проекта watchdog я ничего в сети не нашел, как не старался. Не ставить же HA-linux только ради этого демона. Грустная картина. Неужто ни у кого серверы не виснут? -- Иван
next prev parent reply other threads:[~2004-07-05 17:39 UTC|newest] Thread overview: 8+ messages / expand[flat|nested] mbox.gz Atom feed top 2004-07-04 3:48 Ivan Adzhubey 2004-07-04 13:17 ` Sergey Vlasov 2004-07-05 0:56 ` Ivan Adzhubey 2004-07-05 10:24 ` Sergey Vlasov 2004-07-05 17:39 ` Ivan Adzhubey [this message] 2004-07-07 6:11 ` Michael Shigorin 2004-07-07 6:33 ` Ivan Adzhubey 2004-07-07 8:09 ` Michael Shigorin
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=200407051339.14679.iadzhubey@rics.bwh.harvard.edu \ --to=iadzhubey@rics.bwh.harvard.edu \ --cc=hardware@altlinux.ru \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux hardware support This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \ hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org public-inbox-index hardware Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.hardware AGPL code for this site: git clone https://public-inbox.org/public-inbox.git