* [Hardware] overruns
@ 2006-05-31 12:35 Anton Gorlov
2006-05-31 13:02 ` Konstantin A. Lepikhov
` (2 more replies)
0 siblings, 3 replies; 14+ messages in thread
From: Anton Gorlov @ 2006-05-31 12:35 UTC (permalink / raw)
To: hardware
Что-то на 1 сервере..который работает в качестве роутера и игрового
сервера недавно стал замечать ошибки на сетевом интерфейсе:
[root@zeon root]# ifconfig
eth0 Link encap:Ethernet HWaddr 00:02:B3:3F:BE:82
...
RX packets:9012965 errors:0 dropped:0 overruns:0 frame:0
TX packets:6344815 errors:0 dropped:0 overruns:208 carrier:0
collisions:0 txqueuelen:1000
RX bytes:2260591529 (2155.8 Mb) TX bytes:3324664021 (3170.6 Mb)
Interrupt:17 Base address:0xd000 Memory:e6301000-e6301038
eth1 Link encap:Ethernet HWaddr 00:02:B3:38:91:30
inet addr:192.168.0.1 Bcast:192.168.0.255 Mask:255.255.255.0
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:4187453 errors:0 dropped:0 overruns:34 frame:0
TX packets:5679251 errors:0 dropped:0 overruns:1089 carrier:0
collisions:0 txqueuelen:1000
RX bytes:3131182150 (2986.1 Mb) TX bytes:1304391003 (1243.9 Mb)
Interrupt:18 Base address:0xd400 Memory:e6300000-e6300038
Сетёвки- интелы
00:0a.0 Ethernet controller: Intel Corp. 82557/8/9 [Ethernet Pro 100]
(rev 08)
Subsystem: Intel Corp. EtherExpress PRO/100+ Management Adapter
with Alert On LAN*
Flags: bus master, medium devsel, latency 32, IRQ 17
Memory at e6301000 (32-bit, non-prefetchable) [size=4K]
I/O ports at d000 [size=64]
Memory at e6000000 (32-bit, non-prefetchable) [size=1M]
Expansion ROM at <unassigned> [disabled] [size=1M]
Capabilities: [dc] Power Management version 2
Модуль e100. Вопрос -как лечить?
--
np: Dark Princess - The Skin Of The Universe [paused]
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 12:35 [Hardware] overruns Anton Gorlov
@ 2006-05-31 13:02 ` Konstantin A. Lepikhov
2006-05-31 13:13 ` Anton Gorlov
2006-05-31 14:04 ` Sergey Vlasov
2006-06-01 7:05 ` Serg Rychka
2 siblings, 1 reply; 14+ messages in thread
From: Konstantin A. Lepikhov @ 2006-05-31 13:02 UTC (permalink / raw)
To: hardware
<цитата от="Anton Gorlov">
> Что-то на 1 сервере..который работает в качестве роутера и игрового
> сервера недавно стал замечать ошибки на сетевом интерфейсе:
>
> [root@zeon root]# ifconfig
> eth0 Link encap:Ethernet HWaddr 00:02:B3:3F:BE:82
> ...
> RX packets:9012965 errors:0 dropped:0 overruns:0 frame:0
> TX packets:6344815 errors:0 dropped:0 overruns:208 carrier:0
> collisions:0 txqueuelen:1000
> RX bytes:2260591529 (2155.8 Mb) TX bytes:3324664021 (3170.6 Mb)
> Interrupt:17 Base address:0xd000 Memory:e6301000-e6301038
Чего-то с прерываниями не то. Если только с apic/noapic попробовать
загрузиться.
--
WBR et al.
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 13:02 ` Konstantin A. Lepikhov
@ 2006-05-31 13:13 ` Anton Gorlov
0 siblings, 0 replies; 14+ messages in thread
From: Anton Gorlov @ 2006-05-31 13:13 UTC (permalink / raw)
To: hardware
Konstantin A. Lepikhov пишет:
> Чего-то с прерываниями не то. Если только с apic/noapic попробовать
> загрузиться.
Хм.там в общем-то был переезд с 266 пня на атлонXP. Но вроде проблем
небыло.. иначались буквально вчера. Единственное что помню менял после
пеерезда -эт аспи и друзей расскоментировал в модулях.
[root@zeon root]# cat /proc/interrupts
CPU0
0: 6848421 IO-APIC-edge timer
1: 4 IO-APIC-edge keyboard
8: 2 IO-APIC-edge rtc
9: 0 IO-APIC-level acpi
12: 8 IO-APIC-edge PS/2 Mouse
14: 159903 IO-APIC-edge ide0
17: 14522484 IO-APIC-level eth0
18: 4524411 IO-APIC-level eth1
19: 0 IO-APIC-level CMI8738-MC6
21: 0 IO-APIC-level usb-uhci, usb-uhci
NMI: 0
LOC: 6848381
ERR: 0
MIS: 0
--
np: Forgive-Me-Not - Опуститься В Рай
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 12:35 [Hardware] overruns Anton Gorlov
2006-05-31 13:02 ` Konstantin A. Lepikhov
@ 2006-05-31 14:04 ` Sergey Vlasov
2006-05-31 14:42 ` Anton Gorlov
2006-06-01 7:05 ` Serg Rychka
2 siblings, 1 reply; 14+ messages in thread
From: Sergey Vlasov @ 2006-05-31 14:04 UTC (permalink / raw)
To: hardware
[-- Attachment #1: Type: text/plain, Size: 2546 bytes --]
On Wed, May 31, 2006 at 04:35:42PM +0400, Anton Gorlov wrote:
> Что-то на 1 сервере..который работает в качестве роутера и игрового
> сервера недавно стал замечать ошибки на сетевом интерфейсе:
>
> [root@zeon root]# ifconfig
> eth0 Link encap:Ethernet HWaddr 00:02:B3:3F:BE:82
> ...
> RX packets:9012965 errors:0 dropped:0 overruns:0 frame:0
> TX packets:6344815 errors:0 dropped:0 overruns:208 carrier:0
> collisions:0 txqueuelen:1000
> RX bytes:2260591529 (2155.8 Mb) TX bytes:3324664021 (3170.6 Mb)
> Interrupt:17 Base address:0xd000 Memory:e6301000-e6301038
>
> eth1 Link encap:Ethernet HWaddr 00:02:B3:38:91:30
> inet addr:192.168.0.1 Bcast:192.168.0.255 Mask:255.255.255.0
> UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
> RX packets:4187453 errors:0 dropped:0 overruns:34 frame:0
> TX packets:5679251 errors:0 dropped:0 overruns:1089 carrier:0
> collisions:0 txqueuelen:1000
> RX bytes:3131182150 (2986.1 Mb) TX bytes:1304391003 (1243.9 Mb)
> Interrupt:18 Base address:0xd400 Memory:e6300000-e6300038
А какие-нибудь сообщения в dmesg при этом появляются? Ядро там какое?
> Сетёвки- интелы
>
> 00:0a.0 Ethernet controller: Intel Corp. 82557/8/9 [Ethernet Pro 100]
> (rev 08)
> Subsystem: Intel Corp. EtherExpress PRO/100+ Management Adapter
> with Alert On LAN*
> Flags: bus master, medium devsel, latency 32, IRQ 17
> Memory at e6301000 (32-bit, non-prefetchable) [size=4K]
> I/O ports at d000 [size=64]
> Memory at e6000000 (32-bit, non-prefetchable) [size=1M]
> Expansion ROM at <unassigned> [disabled] [size=1M]
> Capabilities: [dc] Power Management version 2
>
> Модуль e100. Вопрос -как лечить?
Вообще tx underrun возникает, когда адаптер начинает передачу пакета до
полного завершения чтения всех его данных из памяти, а потом не успевает
вовремя прочитать данные (например, из-за занятости шины PCI другим
устройством). Однако вроде бы драйвер e100 в ядрах 2.6.x выставляет
tx_threshold таким образом, что подобная ситуация возникнуть не может
(поскольку значение этого параметра превышает максимальный размер пакета
Ethernet при стандартном MTU). А вот драйвер e100 в 2.4.x пытается
динамически подстраивать этот параметр - повышает при появлении ошибок и
опять снижает, когда ошибки перестают обнаруживаться, и средств для
управления этим параметром там не предусмотрено.
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 14:04 ` Sergey Vlasov
@ 2006-05-31 14:42 ` Anton Gorlov
2006-05-31 15:00 ` Sergey Vlasov
0 siblings, 1 reply; 14+ messages in thread
From: Anton Gorlov @ 2006-05-31 14:42 UTC (permalink / raw)
To: hardware
Sergey Vlasov пишет:
> А какие-нибудь сообщения в dmesg при этом появляются? Ядро там какое?
были..пока там был модуль ee100 (не вспомню точно его имя).. заменил на
e100 - сутки простоял без прболем, а потом появились опять ошибки.
uname -r
2.4.26-std-up-alt6
>> Модуль e100. Вопрос -как лечить?
> Вообще tx underrun возникает, когда адаптер начинает передачу пакета до
> полного завершения чтения всех его данных из памяти, а потом не успевает
> вовремя прочитать данные (например, из-за занятости шины PCI другим
> устройством).
Это знаем.
>Однако вроде бы драйвер e100 в ядрах 2.6.x выставляет
> tx_threshold таким образом, что подобная ситуация возникнуть не может
> (поскольку значение этого параметра превышает максимальный размер пакета
> Ethernet при стандартном MTU). А вот драйвер e100 в 2.4.x пытается
> динамически подстраивать этот параметр - повышает при появлении ошибок и
> опять снижает, когда ошибки перестают обнаруживаться, и средств для
> управления этим параметром там не предусмотрено.
Плохо.. собрать что-ли 2.6 ядро под мастер. Только вот много чего ещё
тащить придётся боюсь.
--
np: Forgive-Me-Not - Петля
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 14:42 ` Anton Gorlov
@ 2006-05-31 15:00 ` Sergey Vlasov
2006-05-31 17:51 ` Anton Gorlov
0 siblings, 1 reply; 14+ messages in thread
From: Sergey Vlasov @ 2006-05-31 15:00 UTC (permalink / raw)
To: hardware
[-- Attachment #1: Type: text/plain, Size: 662 bytes --]
On Wed, May 31, 2006 at 06:42:18PM +0400, Anton Gorlov wrote:
> Sergey Vlasov пишет:
>
> > А какие-нибудь сообщения в dmesg при этом появляются? Ядро там какое?
> были..пока там был модуль ee100 (не вспомню точно его имя).. заменил на
> e100 - сутки простоял без прболем, а потом появились опять ошибки.
Ну можно опять вернуть eepro100 - он хотя бы не пытается понижать
tx_threshold, поэтому через некоторое время ошибки должны прекратиться.
http://www.ussg.iu.edu/hypermail/linux/kernel/0401.1/0610.html
http://www.ussg.iu.edu/hypermail/linux/kernel/0401.1/0707.html
Либо пытаться смотреть, кто же так занимает шину, подстраивать latency...
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 15:00 ` Sergey Vlasov
@ 2006-05-31 17:51 ` Anton Gorlov
2006-06-01 5:29 ` Anton Gorlov
0 siblings, 1 reply; 14+ messages in thread
From: Anton Gorlov @ 2006-05-31 17:51 UTC (permalink / raw)
To: hardware
Sergey Vlasov пишет:
>>> А какие-нибудь сообщения в dmesg при этом появляются? Ядро там какое?
>> были..пока там был модуль ee100 (не вспомню точно его имя).. заменил на
>> e100 - сутки простоял без прболем, а потом появились опять ошибки.
> Ну можно опять вернуть eepro100 - он хотя бы не пытается понижать
> tx_threshold, поэтому через некоторое время ошибки должны прекратиться.
Хм. с e100 ошибок гораздо меньше..и бегать стало шустрее.
> Либо пытаться смотреть, кто же так занимает шину, подстраивать latency...
Догадываюсь -там 2 сетевых интерфейса -1 к првоайдеру со сокростью
100MB/S fullduplex. Вторя сетёвка в локалку с такой же скоростью.
Проблемы начались после устанвоки на комп сепрвера cs и отрубания в
iptables лишних хостов,с которых трафик платный. Загрузка почти
круглосуточно на максимум.
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 17:51 ` Anton Gorlov
@ 2006-06-01 5:29 ` Anton Gorlov
2006-06-01 10:47 ` Konstantin A. Lepikhov
0 siblings, 1 reply; 14+ messages in thread
From: Anton Gorlov @ 2006-06-01 5:29 UTC (permalink / raw)
To: hardware
Ставили на сервер ещё пару винтов... единственное что сказал dmesg - это
eth0: OEM i82557/i82558 10/100 Ethernet, 00:02:B3:3F:BE:82, IRQ 17.
Board assembly 734938-005, Physical connectors present: RJ45
Primary interface chip i82555 PHY #1.
General self-test: passed.
Serial sub-system self-test: passed.
Internal registers self-test: passed.
ROM checksum self-test: passed (0x04f4518b).
divert: allocating divert_blk for eth0
e100: selftest OK.
e100: eth0: Intel(R) PRO/100 Network Connection
Hardware receive checksums enabled
cpu cycle saver enabled
--
np: silence ( Winamp ушел в Партизаны ;-)
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-05-31 12:35 [Hardware] overruns Anton Gorlov
2006-05-31 13:02 ` Konstantin A. Lepikhov
2006-05-31 14:04 ` Sergey Vlasov
@ 2006-06-01 7:05 ` Serg Rychka
2006-06-01 7:12 ` Anton Gorlov
2 siblings, 1 reply; 14+ messages in thread
From: Serg Rychka @ 2006-06-01 7:05 UTC (permalink / raw)
To: hardware
On Wed, 31 May 2006, Anton Gorlov wrote:
> Что-то на 1 сервере..который работает в качестве роутера и
> игрового
> сервера недавно стал замечать ошибки на сетевом интерфейсе:
>
> [root@zeon root]# ifconfig
> eth0 Link encap:Ethernet HWaddr 00:02:B3:3F:BE:82
> ...
> RX packets:9012965 errors:0 dropped:0 overruns:0
> frame:0
> TX packets:6344815 errors:0 dropped:0 overruns:208
> carrier:0
> collisions:0 txqueuelen:1000
а вы не замчеали динамику увеличения ошибок относительно времени?
и в чем в реальной работе выражаются данные ошибки (в смысле
заметили бы вы чтото неладное, если бы не показания ifconfig)?
--
С наилучшими пожеланиями,
_ _
Сергей Рычка | ДонНТУ, Системный/сетевой администратор
[ RSV0-UANIC ] _|_ тел. +38 062 3355701, e-mail: rsv@donntu.edu.ua
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-06-01 7:05 ` Serg Rychka
@ 2006-06-01 7:12 ` Anton Gorlov
2006-06-01 12:44 ` Serg Rychka
0 siblings, 1 reply; 14+ messages in thread
From: Anton Gorlov @ 2006-06-01 7:12 UTC (permalink / raw)
To: hardware
Serg Rychka пишет:
> а вы не замчеали динамику увеличения ошибок относительно времени?
Нет.. оно може ти сразу начаться..и после суток свободного полёта
> и в чем в реальной работе выражаются данные ошибки (в смысле
> заметили бы вы чтото неладное, если бы не показания ifconfig)?
Всё началсоь с того..что мне пожаловались на увеличение времени пинга
сервера и повышения загрузки cpu в этот момент до 70%. Единственное что
менялось недавно -это установка апача на сервер.
--
np: Forgive-Me-Not - Петля [stopped]
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-06-01 5:29 ` Anton Gorlov
@ 2006-06-01 10:47 ` Konstantin A. Lepikhov
2006-06-01 11:06 ` Anton Gorlov
0 siblings, 1 reply; 14+ messages in thread
From: Konstantin A. Lepikhov @ 2006-06-01 10:47 UTC (permalink / raw)
To: hardware
<цитата от="Anton Gorlov">
> Ставили на сервер ещё пару винтов... единственное что сказал dmesg - это
>
> eth0: OEM i82557/i82558 10/100 Ethernet, 00:02:B3:3F:BE:82, IRQ 17.
> Board assembly 734938-005, Physical connectors present: RJ45
> Primary interface chip i82555 PHY #1.
> General self-test: passed.
> Serial sub-system self-test: passed.
> Internal registers self-test: passed.
> ROM checksum self-test: passed (0x04f4518b).
> divert: allocating divert_blk for eth0
> e100: selftest OK.
> e100: eth0: Intel(R) PRO/100 Network Connection
> Hardware receive checksums enabled
> cpu cycle saver enabled
А вот это фигня какая-то - предыдущее сообщение от eepro100, а потом e100.
Или они там по времени разнесены?
--
WBR et al.
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-06-01 10:47 ` Konstantin A. Lepikhov
@ 2006-06-01 11:06 ` Anton Gorlov
0 siblings, 0 replies; 14+ messages in thread
From: Anton Gorlov @ 2006-06-01 11:06 UTC (permalink / raw)
To: hardware
Konstantin A. Lepikhov пишет:
> А вот это фигня какая-то - предыдущее сообщение от eepro100, а потом e100.
> Или они там по времени разнесены?
Судя по всему этоя лишнего закопипейстил -кусок старого лога.
Сейчас в логах только
Jun 1 12:02:55 zeon kernel: divert: allocating divert_blk for eth0
Jun 1 12:02:55 zeon kernel: e100: selftest OK.
Jun 1 12:02:55 zeon kernel: e100: eth0: Intel(R) PRO/100 Network Connection
Jun 1 12:02:55 zeon kernel: Hardware receive checksums enabled
Jun 1 12:02:55 zeon kernel: cpu cycle saver enabled
Jun 1 12:02:55 zeon kernel:
Jun 1 12:02:55 zeon kernel: divert: allocating divert_blk for eth1
Jun 1 12:02:55 zeon kernel: e100: selftest OK.
Jun 1 12:02:55 zeon kernel: e100: eth1: Intel(R) PRO/100 Network Connection
Jun 1 12:02:55 zeon kernel: Hardware receive checksums enabled
Jun 1 12:02:55 zeon kernel: cpu cycle saver enabled
и
lsmod |grep 100
e100 48908 2 (autoclean)
--
np: Dark Princess - Living In Me [paused]
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-06-01 7:12 ` Anton Gorlov
@ 2006-06-01 12:44 ` Serg Rychka
2006-06-01 12:52 ` Anton Gorlov
0 siblings, 1 reply; 14+ messages in thread
From: Serg Rychka @ 2006-06-01 12:44 UTC (permalink / raw)
To: hardware
On Thu, 1 Jun 2006, Anton Gorlov wrote:
> Serg Rychka пишет:
>
> > а вы не замчеали динамику увеличения ошибок относительно
> времени?
> Нет.. оно може ти сразу начаться..и после суток свободного
> полёта
>
> > и в чем в реальной работе выражаются данные ошибки (в смысле
> > заметили бы вы чтото неладное, если бы не показания
> ifconfig)?
>
> Всё началсоь с того..что мне пожаловались на увеличение
> времени пинга
> сервера и повышения загрузки cpu в этот момент до 70%.
> Единственное что
> менялось недавно -это установка апача на сервер.
>
В случае если есть много соединений с р2р сетями, может
зашкаливать количество одновременных соединений. смотрите
cat /proc/net/ip_conntrack |wc -l и если там больше 8000 то
увеличте ip_conntrack_max, так как по умолчанию там 4096 помоему.
--
С наилучшими пожеланиями,
_ _
Сергей Рычка | ДонНТУ, Системный/сетевой администратор
[ RSV0-UANIC ] _|_ тел. +38 062 3355701, e-mail: rsv@donntu.edu.ua
^ permalink raw reply [flat|nested] 14+ messages in thread
* Re: [Hardware] overruns
2006-06-01 12:44 ` Serg Rychka
@ 2006-06-01 12:52 ` Anton Gorlov
0 siblings, 0 replies; 14+ messages in thread
From: Anton Gorlov @ 2006-06-01 12:52 UTC (permalink / raw)
To: hardware
Serg Rychka пишет:
> В случае если есть много соединений с р2р сетями, может
> зашкаливать количество одновременных соединений. смотрите
> cat /proc/net/ip_conntrack |wc -l и если там больше 8000 то
> увеличте ip_conntrack_max, так как по умолчанию там 4096 помоему.
[root@zeon root]# sysctl -a |grep ip_conntrack_max
net.ipv4.ip_conntrack_max = 16376
net.ipv4.netfilter.ip_conntrack_max = 16376
[root@zeon root]# cat /proc/net/ip_conntrack |wc -l
23
p2p ..как и dc+ нету..пров даже dc+ внутри своей сети запретил..сказли
циску перегружает им это. ну ещёб..подключили почти всю пензу на
скорости 100MB. А ресурсы не резиновые оказались.
--
np: Dark Princess - Lost Sunrise
^ permalink raw reply [flat|nested] 14+ messages in thread
end of thread, other threads:[~2006-06-01 12:52 UTC | newest]
Thread overview: 14+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-05-31 12:35 [Hardware] overruns Anton Gorlov
2006-05-31 13:02 ` Konstantin A. Lepikhov
2006-05-31 13:13 ` Anton Gorlov
2006-05-31 14:04 ` Sergey Vlasov
2006-05-31 14:42 ` Anton Gorlov
2006-05-31 15:00 ` Sergey Vlasov
2006-05-31 17:51 ` Anton Gorlov
2006-06-01 5:29 ` Anton Gorlov
2006-06-01 10:47 ` Konstantin A. Lepikhov
2006-06-01 11:06 ` Anton Gorlov
2006-06-01 7:05 ` Serg Rychka
2006-06-01 7:12 ` Anton Gorlov
2006-06-01 12:44 ` Serg Rychka
2006-06-01 12:52 ` Anton Gorlov
ALT Linux hardware support
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
public-inbox-index hardware
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.hardware
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git