* [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
@ 2011-04-07 10:19 Alex Moskalenko
2011-04-07 15:31 ` Vitaly Kuznetsov
0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-07 10:19 UTC (permalink / raw)
To: sysadmins, hardware
[-- Attachment #1: Type: text/plain, Size: 1328 bytes --]
Здравствуйте!
Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб оперативной
памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0 из
сизифа. Без опции acpi=off получаю стабильное падение ядра dom0, при наличии
опции acpi=off загрузиться удается, но не работают многие устройства (точнее,
работают только RAID-контроллер и сетевая карта). Во вложениях два протокола
загрузки - c acpi=off и без нее.
Так как собственных знаний в области отладки ядра в достаточных количествах не
имею, прошу помочь разобраться - что и куда можно покопать в этом случае. В
идеале хотелось бы получить обычную загрузку без acpi=off и других подобных
подпорок.
Заранее спасибо.
PS Ядро std-def грузится и работает без каких-либо видимых проблем.
--
WBR, Alex Moskalenko
[-- Attachment #2: minicom.cap.acpi.bz2 --]
[-- Type: application/x-bzip2, Size: 7909 bytes --]
[-- Attachment #3: minicom.cap.noacpi.bz2 --]
[-- Type: application/x-bzip2, Size: 7843 bytes --]
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-07 10:19 [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
@ 2011-04-07 15:31 ` Vitaly Kuznetsov
2011-04-07 16:19 ` Vitaly Kuznetsov
0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-07 15:31 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion; +Cc: hardware
Alex Moskalenko <mav@elserv.msk.su> writes:
> Здравствуйте!
>
> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
> оперативной
> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
> из сизифа.
В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
alt33 из архива (например тут:
ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_64/RPMS.classic/)
--
Vitaly Kuznetsov, ALT Linux
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-07 15:31 ` Vitaly Kuznetsov
@ 2011-04-07 16:19 ` Vitaly Kuznetsov
2011-04-12 6:19 ` Alex Moskalenko
0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-07 16:19 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion; +Cc: hardware
Vitaly Kuznetsov <vitty@altlinux.ru> writes:
> Alex Moskalenko <mav@elserv.msk.su> writes:
>
>> Здравствуйте!
>>
>> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
>> оперативной
>> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
>> из сизифа.
>
> В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
> kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
> alt33 из архива (например тут:
> ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_64/RPMS.classic/)
К сожалению этого будет недостаточно. Ядро без гипервизора у вас
загрузится, с гипервизором - нет. Я попробую разобраться в данной
проблеме, благо такое железо под руками есть.
--
Vitaly Kuznetsov, ALT Linux
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-07 16:19 ` Vitaly Kuznetsov
@ 2011-04-12 6:19 ` Alex Moskalenko
2011-04-12 11:11 ` Vitaly Kuznetsov
2011-04-13 16:01 ` Vitaly Kuznetsov
0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-12 6:19 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
On Thursday 07 April 2011 20:19:15 Vitaly Kuznetsov wrote:
> >> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
> >> оперативной
> >> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
> >> из сизифа.
> >
> > В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
> > kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
> > alt33 из архива (например тут:
> > ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_
> >64/RPMS.classic/)
>
> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
> загрузится, с гипервизором - нет. Я попробую разобраться в данной
> проблеме, благо такое железо под руками есть.
Здравствуйте!
Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу помочь с
тестированием, если требуется.
Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для работы klogd
со стандартными ALT-настройками - не работает он от пользователя в чруте
(Cannot read proc file system: 1 - Operation not permitted.). Стоит багу
вешать?
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-12 6:19 ` Alex Moskalenko
@ 2011-04-12 11:11 ` Vitaly Kuznetsov
2011-04-12 11:28 ` Alex Moskalenko
2011-04-13 16:01 ` Vitaly Kuznetsov
1 sibling, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-12 11:11 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Alex Moskalenko <mav@elserv.msk.su> writes:
>> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
>> загрузится, с гипервизором - нет. Я попробую разобраться в данной
>> проблеме, благо такое железо под руками есть.
> Здравствуйте!
>
> Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу
> помочь с тестированием, если требуется.
>
Мы занимаемся дебагом этой проблемы. x3400 у нас есть, так что
тестирование пока не требуется.
> Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для
> работы klogd со стандартными ALT-настройками - не работает он от
> пользователя в чруте
> (Cannot read proc file system: 1 - Operation not permitted.). Стоит
> багу вешать?
Повесьте, пожалуйста. Я проверю.
--
Vitaly Kuznetsov, ALT Linux
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-12 11:11 ` Vitaly Kuznetsov
@ 2011-04-12 11:28 ` Alex Moskalenko
0 siblings, 0 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-12 11:28 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
On Tuesday 12 April 2011 15:11:04 Vitaly Kuznetsov wrote:
> > Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для
> > работы klogd со стандартными ALT-настройками - не работает он от
> > пользователя в чруте
> > (Cannot read proc file system: 1 - Operation not permitted.). Стоит
> > багу вешать?
>
> Повесьте, пожалуйста. Я проверю.
#25434
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-12 6:19 ` Alex Moskalenko
2011-04-12 11:11 ` Vitaly Kuznetsov
@ 2011-04-13 16:01 ` Vitaly Kuznetsov
2011-04-14 8:16 ` Alex Moskalenko
1 sibling, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-13 16:01 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Alex Moskalenko <mav@elserv.msk.su> writes:
>> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
>> загрузится, с гипервизором - нет. Я попробую разобраться в данной
>> проблеме, благо такое железо под руками есть.
> Здравствуйте!
>
> Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу
> помочь с тестированием, если требуется.
В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
вас заработать. Как соберётся - можете начинать тестировать.
--
Vitaly Kuznetsov, ALT Linux
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-13 16:01 ` Vitaly Kuznetsov
@ 2011-04-14 8:16 ` Alex Moskalenko
2011-04-14 16:22 ` Vitaly Kuznetsov
2011-04-15 8:15 ` Michail Yakushin
0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-14 8:16 UTC (permalink / raw)
To: Vitaly Kuznetsov; +Cc: ALT Linux sysadmins' discussion
On Wednesday 13 April 2011 20:01:07 you wrote:
> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
> вас заработать. Как соберётся - можете начинать тестировать.
Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. klogd также
запускается в чруте от пользователя.
Есть несколько настораживающих сообщений в протоколах загрузки ядра и
гипервизора, привожу их далее:
гипервизор
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
ядро
[ 0.067405] ACPI: No dock devices found.
[ 0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
(ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
[ 0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
to 80000000fec80473
[ 0.068000] set_pte_at 0xffff88003fc87140 failed 1
[ 0.068008] ACPI Error: Could not map memory at 00000000FEC80000, size 100
(20090903/exregion-180)
[ 0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
[SystemMemory] (20090903/evregion-424)
[ 0.068533] ACPI Error (psparse-0537): Method parse/execution failed
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[ 0.068850] ACPI Error (uteval-0250): Method execution failed
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[ 0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
[ 0.196719] ACPI: bus type pnp registered
[ 0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
(ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
[ 0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
to 80000000fec80473
[ 0.197491] set_pte_at 0xffff88003fc87140 failed 1
[ 0.197616] ACPI Error: Could not map memory at 00000000FEC80000, size 100
(20090903/exregion-180)
[ 0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
[SystemMemory] (20090903/evregion-424)
[ 0.198173] ACPI Error (psparse-0537): Method parse/execution failed
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[ 0.198523] ACPI Error (uteval-0250): Method execution failed
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[ 0.198845] pnp 00:00: can't evaluate _CRS: 4
[ 0.215212] PM-Timer failed consistency check (0x0xffffff) - aborting.
[ 0.422136] Freeing unused kernel memory: 548k freed
[ 0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003d6030f0
to 80000004c0564145
[ 0.438260] input: AT Translated Set 2 keyboard
as /devices/platform/i8042/serio0/input/input1
[ 5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
[ 5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 return -22
(ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
[ 5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 return -22
(ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
[ 5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 return -22
(ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
[ 5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 return -22
(ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
[ 5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 return -22
(ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
[ 5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 return -22
(ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
[ 5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 return -22
(ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
[ 5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 return -22
(ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
[ 5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
[ 14.289531] XENBUS: Unable to read cpu state
[ 14.289688] XENBUS: Unable to read cpu state
[ 14.289849] XENBUS: Unable to read cpu state
[ 14.290056] XENBUS: Unable to read cpu state
[ 14.290218] XENBUS: Unable to read cpu state
[ 14.290396] XENBUS: Unable to read cpu state
[ 14.290538] XENBUS: Unable to read cpu state
[ 14.290692] XENBUS: Unable to read cpu state
С этим можно жить или лучше подождать?
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-14 8:16 ` Alex Moskalenko
@ 2011-04-14 16:22 ` Vitaly Kuznetsov
2011-04-15 8:15 ` Michail Yakushin
1 sibling, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-14 16:22 UTC (permalink / raw)
To: Alex Moskalenko; +Cc: ALT Linux sysadmins' discussion
Alex Moskalenko <mav@elserv.msk.su> writes:
>
> С этим можно жить или лучше подождать?
>
ACPI, конечно, глючный, но если всё работает, то живите.
--
Vitaly Kuznetsov, ALT Linux
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-14 8:16 ` Alex Moskalenko
2011-04-14 16:22 ` Vitaly Kuznetsov
@ 2011-04-15 8:15 ` Michail Yakushin
2011-05-11 6:57 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
2012-02-21 3:07 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
1 sibling, 2 replies; 20+ messages in thread
From: Michail Yakushin @ 2011-04-15 8:15 UTC (permalink / raw)
To: sysadmins
14.04.2011 12:16, Alex Moskalenko пишет:
> On Wednesday 13 April 2011 20:01:07 you wrote:
>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
>> вас заработать. Как соберётся - можете начинать тестировать.
> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. klogd также
> запускается в чруте от пользователя.
>
> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
> гипервизора, привожу их далее:
>
> гипервизор
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>
> ядро
> [ 0.067405] ACPI: No dock devices found.
> [ 0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [ 0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [ 0.068000] set_pte_at 0xffff88003fc87140 failed 1
> [ 0.068008] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [ 0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [ 0.068533] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [ 0.068850] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [ 0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>
> [ 0.196719] ACPI: bus type pnp registered
> [ 0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [ 0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [ 0.197491] set_pte_at 0xffff88003fc87140 failed 1
> [ 0.197616] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [ 0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [ 0.198173] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [ 0.198523] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [ 0.198845] pnp 00:00: can't evaluate _CRS: 4
>
> [ 0.215212] PM-Timer failed consistency check (0x0xffffff) - aborting.
>
> [ 0.422136] Freeing unused kernel memory: 548k freed
> [ 0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003d6030f0
> to 80000004c0564145
> [ 0.438260] input: AT Translated Set 2 keyboard
> as /devices/platform/i8042/serio0/input/input1
>
> [ 5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
> [ 5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 return -22
> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
> [ 5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 return -22
> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
> [ 5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 return -22
> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
> [ 5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 return -22
> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
> [ 5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 return -22
> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
> [ 5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 return -22
> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
> [ 5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 return -22
> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
> [ 5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 return -22
> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
> [ 5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
Суть этих сообщений warningи из за того что xen и dom0 подрались за
область памяти, которая нужна ACPI и APIC. Но оно должно работать, да
ядро не смогло кое-что сделать, но это делаетет сам xen.
Падения были вызваны тем, что ядро не правильно обрабатывало эту ошибку
и наобум лезло туда куда xen его не пускал. П
Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим,
подобная ситуация может быть и на другом железе.
^ permalink raw reply [flat|nested] 20+ messages in thread
* [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-04-15 8:15 ` Michail Yakushin
@ 2011-05-11 6:57 ` Alex Moskalenko
2011-05-13 11:52 ` Vitaly Kuznetsov
2012-02-21 3:07 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
1 sibling, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-05-11 6:57 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Здравствуйте!
Снова подниму тему о x3400 и kernel-image-xen-dom0. Поставил ядро
kernel-image-xen-dom0-2.6.32-alt38 (последнее на текущий момент). Система
загрузилась, но весь лог забит следующими сообщениями:
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070322]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cabcfa0 to
80000004371c0145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070329]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cabcfa8 to
80000004ff16a145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070343]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d890 to
8000000436c80145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070352]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d898 to
80000004369ad145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070360]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d8a0 to
80000004371bf145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070366]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d8a8 to
8000000436944145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070680]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca7390 to
80000004376eb145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070699]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca7398 to
8000000436c8f145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070741]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73a0 to
8000000436fac145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070749]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73a8 to
80000004379fe145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070756]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73b0 to
80000004ca839145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070773]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73b8 to
80000004cab2b145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070781]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73c0 to
80000004ceb2f145
May 10 17:34:59 mainsrv-dom0 kernel: [ 24.070791]
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73c8 to
8000000436410145
За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
периодичностью, а при какой-либо активности в dom0, то есть работа в domU
сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
Если требуется какая-либо еще информация, готов ее предоставить.
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-05-11 6:57 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
@ 2011-05-13 11:52 ` Vitaly Kuznetsov
2011-05-16 7:38 ` Alex Moskalenko
0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-05-13 11:52 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Alex Moskalenko <mav@elserv.msk.su> writes:
> За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> периодичностью, а при какой-либо активности в dom0, то есть работа в
> domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>
В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.
--
Vitaly Kuznetsov
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-05-13 11:52 ` Vitaly Kuznetsov
@ 2011-05-16 7:38 ` Alex Moskalenko
2011-07-11 6:12 ` Alex Moskalenko
0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-05-16 7:38 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
On Friday 13 May 2011 15:52:06 Vitaly Kuznetsov wrote:
> Alex Moskalenko <mav@elserv.msk.su> writes:
> > За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> > периодичностью, а при какой-либо активности в dom0, то есть работа в
> > domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>
> В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.
Спасибо, с alt39 сообщения не беспокоят. :)
Один раз поймал следующее:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415333] BUG: soft lockup - CPU#1
stuck for 65s! [swapper:0]
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415349] Modules linked in:
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416113] CPU 1:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416137] Modules linked in:
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416898] Pid: 0, comm: swapper Not
tainted 2.6.32-xen-dom0-alt39 #1 IBM eServer x3400-[7976L2G]-
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416912] RIP: e030:
[<ffffffff810093aa>] [<ffffffff810093aa>] hypercall_page+0x3aa/0x1010
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416944] RSP: e02b:ffff88003fcadee8
EFLAGS: 00000246
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416959] RAX: 0000000000000000 RBX:
ffff88003fcadfd8 RCX: ffffffff810093aa
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416975] RDX: 0000000000000000 RSI:
0000000000000000 RDI: 0000000000000001
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416989] RBP: ffff88003fcadf00 R08:
0000000000000000 R09: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417004] R10: 0000000000000000 R11:
0000000000000246 R12: ffffffff815a1a20
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417017] R13: 0000000000000000 R14:
0000000000000000 R15: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417035] FS: 00007f676217e700
(0000) GS:ffff880028054000(0000) knlGS:0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417049] CS: e033 DS: 002b ES:
002b CR0: 000000008005003b
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417063] CR2: 00007f020ba76008 CR3:
000000003eb75000 CR4: 0000000000002660
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417079] DR0: 0000000000000000 DR1:
0000000000000000 DR2: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417093] DR3: 0000000000000000 DR6:
00000000ffff0ff0 DR7: 0000000000000400
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417108] Call Trace:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417134] [<ffffffff81010cc0>] ?
xen_safe_halt+0x10/0x30
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417162] [<ffffffff8101db20>]
default_idle+0x40/0xb0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417188] [<ffffffff81014349>]
cpu_idle+0x79/0xc0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417215] [<ffffffff8138c65d>]
cpu_bringup_and_idle+0xe/0x10
И то же самое сообщение для каждого из ядер в это же время. Как это отразилось
на работе сервера (было ни "подвисание" на 65 сек) - сказать не могу, не
следил за ним в это время.
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-05-16 7:38 ` Alex Moskalenko
@ 2011-07-11 6:12 ` Alex Moskalenko
2011-07-11 6:24 ` Vitaly Kuznetsov
2011-08-10 10:55 ` Alex Moskalenko
0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-07-11 6:12 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Здравствуйте!
Снова подниму тему работы нашего xen-dom0 на eServer x3400. На данный момент
на сервере установлены xen 4.1.1 и ядро 2.6.32-xen-dom0-alt41. В качетсве
гостевых систем - 4 hvm-домена с Windows и 2 pv с Linux (2.6.39-std-def-alt2.
За время тестирования накопилась следующая статистика:
1) Несмотря на "глючный ACPI" все устройства работают;
2) Периодически появляются сообщения от ядра:
=== cut ===
[44022.366517] BUG: soft lockup - CPU#0 stuck for 74s! [swapper:0]
[44022.366532] Modules linked in: xt_physdev ipt_MASQUERADE iptable_nat nf_nat
nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT
iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables coretemp ipmi_si
bridge stp vfat fat usb_storage usb_libusual dm_multipath scsi_dh dm_mod
joydev usbhid hid ide_cd_mod cdrom ata_generic ide_pci_generic pata_acpi
ata_piix ehci_hcd uhci_hcd usbcore edac_core psmouse ahci piix i5k_amb
i2c_i801 hwmon pcspkr nls_base libata tg3 ide_core i2c_core serio_raw evdev
8250_pnp rtc_cmos 8250 rtc_core serial_core rtc_lib ses container enclosure
sg thermal button processor parport_pc aksparlnx(P) parport ipmi_devintf
ipmi_msghandler tun xen_gntdev ext3 jbd mbcache sd_mod crc_t10dif aacraid
scsi_mod [last unloaded: i5000_edac]
[44022.367667] CPU 0:
[44022.367704] Modules linked in: xt_physdev ipt_MASQUERADE iptable_nat nf_nat
nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT
iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables coretemp ipmi_si
bridge stp vfat fat usb_storage usb_libusual dm_multipath scsi_dh dm_mod
joydev usbhid hid ide_cd_mod cdrom ata_generic ide_pci_generic pata_acpi
ata_piix ehci_hcd uhci_hcd usbcore edac_core psmouse ahci piix i5k_amb
i2c_i801 hwmon pcspkr nls_base libata tg3 ide_core i2c_core serio_raw evdev
8250_pnp rtc_cmos 8250 rtc_core serial_core rtc_lib ses container enclosure
sg thermal button processor parport_pc aksparlnx(P) parport ipmi_devintf
ipmi_msghandler tun xen_gntdev ext3 jbd mbcache sd_mod crc_t10dif aacraid
scsi_mod [last unloaded: i5000_edac]
[44022.369119] Pid: 0, comm: swapper Tainted: P
2.6.32-xen-dom0-alt41 #1 IBM eServer x3400-[7976L2G]-
[44022.369139] RIP: e030:[<ffffffff810093aa>] [<ffffffff810093aa>]
hypercall_page+0x3aa/0x1010
[44022.369186] RSP: e02b:ffffffff8154fef0 EFLAGS: 00000246
[44022.369205] RAX: 0000000000000000 RBX: ffffffff8154ffd8 RCX:
ffffffff810093aa
[44022.369224] RDX: 0000000000000000 RSI: 0000000000000000 RDI:
0000000000000001
[44022.369246] RBP: ffffffff8154ff08 R08: 0000000000000000 R09:
0000000000000000
[44022.369265] R10: 0000000000000000 R11: 0000000000000246 R12:
ffffffff815a1b60
[44022.369285] R13: 0000000000000000 R14: 0000000000000000 R15:
0000000000000000
[44022.369308] FS: 00007f9eaa00c700(0000) GS:ffff880028038000(0000)
knlGS:0000000000000000
[44022.369327] CS: e033 DS: 0000 ES: 0000 CR0: 000000008005003b
[44022.369346] CR2: 00007f1ddcd5c000 CR3: 000000003c797000 CR4:
0000000000002660
[44022.369362] DR0: 0000000000000000 DR1: 0000000000000000 DR2:
0000000000000000
[44022.369382] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7:
0000000000000400
[44022.369401] Call Trace:
[44022.369436] [<ffffffff81010cc0>] ? xen_safe_halt+0x10/0x30
[44022.369472] [<ffffffff8101db20>] default_idle+0x40/0xb0
[44022.369507] [<ffffffff81014349>] cpu_idle+0x79/0xc0
[44022.369542] [<ffffffff81382d2d>] rest_init+0x6d/0x80
[44022.369576] [<ffffffff815bce55>] start_kernel+0x3f6/0x492
[44022.369613] [<ffffffff815bc2b9>] x86_64_start_reservations+0x99/0xb9
[44022.369651] [<ffffffff815c07f9>] xen_start_kernel+0x5d2/0x6b9
=== cut===
Периодичность сообщений случайная. От 2 раз в сутки до раза в неделю.
Количество "подвисших" процессоров также может быть как один, так и восемь
(количество ядер в системе). Больше всего беспокоит то, что после этих
сообщений и dom0, и domU, на которые попали подвисшие CPU, дейсвительно
полностью подвисают на время, указанное в строке "BUG: soft lockup - CPU##
stuck for ##s!". Это видно по сообщениям ядра в linux ([43965.911454]
Clocksource tsc unstable (delta = -42949673037 ns)) и следующих за ним
сообщениях от ntpd о коррекции времени; и по сообщениям от службы w32time в
Windows;
3) Очень редко в dom0 появляется сообщение ядра
===cut===
EDAC MC0: UE row 1, channel-a= 0 channel-b= 1 labels "-": (Branch=0
DRAM-Bank=4 RDWR=Write RAS=5926 CAS=0 FATAL Err=0x4 (>Tmid Thermal event with
intelligent throttling disabled))
===cut===
На работе не отражается никак. Тесты памяти ошибок не выявляют, сбоев нет,
перегрева не наблюдается.
Из вышеперечисленного более всего беспокоит проблема (2). В BIOS все, что мог,
перепробовал - отключил Enhanced C-States, поддержку S3 - ситуация не
меняется.
В связи с этим вопрос к Виталию Кузнецову: не могли бы Вы поделиться патчем на
ACPI к нашему 2.6.32-xen-dom0? Я хотел попробовать наложить его на ядро
xen-stable-2.6.39 из
git://git.kernel.org/pub/scm/linux/kernel/git/konrad/xen.git и попробовать в
работе его. Сейчас оно к сожалению падает при загрузке, как
2.6.32-xen-dom0-alt < alt36.2.
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-07-11 6:12 ` Alex Moskalenko
@ 2011-07-11 6:24 ` Vitaly Kuznetsov
2011-08-10 10:55 ` Alex Moskalenko
1 sibling, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-07-11 6:24 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Alex Moskalenko <mav@elserv.msk.su> writes:
> В связи с этим вопрос к Виталию Кузнецову: не могли бы Вы поделиться
> патчем на ACPI к нашему 2.6.32-xen-dom0? Я хотел попробовать наложить его на
> ядро
> xen-stable-2.6.39 из
> git://git.kernel.org/pub/scm/linux/kernel/git/konrad/xen.git и
> попробовать в
> работе его. Сейчас оно к сожалению падает при загрузке, как
> 2.6.32-xen-dom0-alt < alt36.2.
Четыре верхних коммита из
http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0
--
Vitaly Kuznetsov
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
2011-07-11 6:12 ` Alex Moskalenko
2011-07-11 6:24 ` Vitaly Kuznetsov
@ 2011-08-10 10:55 ` Alex Moskalenko
1 sibling, 0 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-08-10 10:55 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
Здравствуйте!
Хочу сообщить сообществу, что проблемы с часами и сообщениями о подвисании
процессоров в логах (см. предыдущее письмо) решились добавлением опции
гипервизора clocksource=pit. Без этой опции Xen использует ACPI PM Timer,
который, видимо, какой-то неправильный, как и все ACPI на этом сервере.
При использовании PIT сообщений о скачках времени и подвисаниях не
наблюдается.
PS Приложить ACPI-патчи от нашего 2.6.32 на 3.0 не осилил. :) Знаний и времени
не хватило на изучение всех изменений кода. Жду 3.1 для тестирования - по
функционалу должно быть не хуже, чем 2.6.32, вот только поддержку xen из него
похоже выкинули...
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2011-04-15 8:15 ` Michail Yakushin
2011-05-11 6:57 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
@ 2012-02-21 3:07 ` Alex Moskalenko
2012-02-21 14:42 ` Vitaly Kuznetsov
1 sibling, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2012-02-21 3:07 UTC (permalink / raw)
To: sysadmins
15.04.2011 12:15, Michail Yakushin пишет:
> 14.04.2011 12:16, Alex Moskalenko пишет:
>> On Wednesday 13 April 2011 20:01:07 you wrote:
>>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое
>>> должно у
>>> вас заработать. Как соберётся - можете начинать тестировать.
>> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают.
>> klogd также
>> запускается в чруте от пользователя.
>> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
>> гипервизора, привожу их далее:
>>
>> гипервизор
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>>
>> ядро
>> [ 0.067405] ACPI: No dock devices found.
>> [ 0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [ 0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting
>> ffff88003fc87140
>> to 80000000fec80473
>> [ 0.068000] set_pte_at 0xffff88003fc87140 failed 1
>> [ 0.068008] ACPI Error: Could not map memory at 00000000FEC80000,
>> size 100
>> (20090903/exregion-180)
>> [ 0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [ 0.068533] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [ 0.068850] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [ 0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>>
>> [ 0.196719] ACPI: bus type pnp registered
>> [ 0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [ 0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting
>> ffff88003fc87140
>> to 80000000fec80473
>> [ 0.197491] set_pte_at 0xffff88003fc87140 failed 1
>> [ 0.197616] ACPI Error: Could not map memory at 00000000FEC80000,
>> size 100
>> (20090903/exregion-180)
>> [ 0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [ 0.198173] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [ 0.198523] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [ 0.198845] pnp 00:00: can't evaluate _CRS: 4
>>
>> [ 0.215212] PM-Timer failed consistency check (0x0xffffff) -
>> aborting.
>>
>> [ 0.422136] Freeing unused kernel memory: 548k freed
>> [ 0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting
>> ffff88003d6030f0
>> to 80000004c0564145
>> [ 0.438260] input: AT Translated Set 2 keyboard
>> as /devices/platform/i8042/serio0/input/input1
>>
>> [ 5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
>> [ 5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000
>> return -22
>> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
>> [ 5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000
>> return -22
>> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
>> [ 5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000
>> return -22
>> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
>> [ 5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000
>> return -22
>> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
>> [ 5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000
>> return -22
>> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
>> [ 5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000
>> return -22
>> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
>> [ 5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000
>> return -22
>> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
>> [ 5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000
>> return -22
>> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
>> [ 5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
> Суть этих сообщений warningи из за того что xen и dom0 подрались за
> область памяти, которая нужна ACPI и APIC. Но оно должно работать, да
> ядро не смогло кое-что сделать, но это делаетет сам xen.
> Падения были вызваны тем, что ядро не правильно обрабатывало эту
> ошибку и наобум лезло туда куда xen его не пускал. П
> Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим,
> подобная ситуация может быть и на другом железе.
> _______________________________________________
Здравствуйте!
Подскажите пожалуйста, пытались ли контактировать с апстримом на предмет
этого патча? Я до сих пор заинтересован в запуске xen на x3400, а ядра
3.1.х и 3.2.х продолжают падать в dom0. Наше патченое xen-dom0 при этом
работает. Поэтому, если с апстримом не контактировали, хочу сам
попробовать пообщаться в рассылках/повесить баг на эту тему.
PS Неужели больше никто не пытался запускать pvops ядра в dom0 на x3400?
Я единственный из всех пользователей xen, кто поймал эту проблему? Или у
меня какой-то неправильный сервер?...
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2012-02-21 3:07 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
@ 2012-02-21 14:42 ` Vitaly Kuznetsov
2012-02-22 8:01 ` Alex Moskalenko
0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2012-02-21 14:42 UTC (permalink / raw)
To: sysadmins
On Tue, 21 Feb 2012 07:07:13 +0400, Alex Moskalenko wrote:
>
> Здравствуйте!
>
> Подскажите пожалуйста, пытались ли контактировать с апстримом на
> предмет этого патча? Я до сих пор заинтересован в запуске xen на
> x3400, а ядра 3.1.х и 3.2.х продолжают падать в dom0. Наше патченое
> xen-dom0 при этом работает. Поэтому, если с апстримом не
> контактировали, хочу сам попробовать пообщаться в рассылках/повесить
> баг на эту тему.
>
> PS Неужели больше никто не пытался запускать pvops ядра в dom0 на
> x3400? Я единственный из всех пользователей xen, кто поймал эту
> проблему? Или у меня какой-то неправильный сервер?...
Это всё очень похоже на глючный биос одной конкретной железки (там,
насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной
проблеме не общались.
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2012-02-21 14:42 ` Vitaly Kuznetsov
@ 2012-02-22 8:01 ` Alex Moskalenko
2012-02-25 18:39 ` Vitaly Kuznetsov
0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2012-02-22 8:01 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
21.02.2012 18:42, Vitaly Kuznetsov пишет:
> On Tue, 21 Feb 2012 07:07:13 +0400, Alex Moskalenko wrote:
>>
>> Здравствуйте!
>>
>> Подскажите пожалуйста, пытались ли контактировать с апстримом на
>> предмет этого патча? Я до сих пор заинтересован в запуске xen на
>> x3400, а ядра 3.1.х и 3.2.х продолжают падать в dom0. Наше патченое
>> xen-dom0 при этом работает. Поэтому, если с апстримом не
>> контактировали, хочу сам попробовать пообщаться в рассылках/повесить
>> баг на эту тему.
>>
>> PS Неужели больше никто не пытался запускать pvops ядра в dom0 на
>> x3400? Я единственный из всех пользователей xen, кто поймал эту
>> проблему? Или у меня какой-то неправильный сервер?...
>
> Это всё очень похоже на глючный биос одной конкретной железки (там,
> насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной
> проблеме не общались.
Да, проблемы там в районе ACPI, причем так фатально они проявляются
только при запуске ядра под Xen. При отсутствии xen ядро грузится и
работает.
Насколько я понял суть Ваших исправлений в git (
http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0
), Вы добавили обработку ошибок при доступе ядра к областям памяти через
функции xen. В исходном варианте ядро не проверяет результат своих
действий, и никак не ожидает получить отказ от гипервизора, вследствие
чего падает. Так что, возможно железка и глючная, но мне кажется, что
ядро должно работать одинаково независимо от наличия/отсутствия
гипервизора. Вот по поводу отсутствия корректной обработки ошибок и
хотел пообщаться с апстримом. В праздники постараюсь получить логи с
этого сервера с последним 3.х ядром в 3х вариантах - bare metal, xen,
xen/noacpi и как-нибудь донести ситуацию до апстрима.
Не подскажете, откуда лучше начинать? xen-devel@, bugzilla.xen.org, ...?
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 20+ messages in thread
* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
2012-02-22 8:01 ` Alex Moskalenko
@ 2012-02-25 18:39 ` Vitaly Kuznetsov
0 siblings, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2012-02-25 18:39 UTC (permalink / raw)
To: sysadmins
On Wed, 22 Feb 2012 12:01:17 +0400, Alex Moskalenko wrote:
>> Это всё очень похоже на глючный биос одной конкретной железки (там,
>> насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной
>> проблеме не общались.
>
> Да, проблемы там в районе ACPI, причем так фатально они проявляются
> только при запуске ядра под Xen. При отсутствии xen ядро грузится и
> работает.
>
> Насколько я понял суть Ваших исправлений в git (
>
>
> http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0
>
> ), Вы добавили обработку ошибок при доступе ядра к областям памяти
> через функции xen. В исходном варианте ядро не проверяет результат
> своих действий, и никак не ожидает получить отказ от гипервизора,
> вследствие чего падает. Так что, возможно железка и глючная, но мне
> кажется, что ядро должно работать одинаково независимо от
> наличия/отсутствия гипервизора. Вот по поводу отсутствия корректной
> обработки ошибок и хотел пообщаться с апстримом. В праздники
> постараюсь получить логи с этого сервера с последним 3.х ядром в 3х
> вариантах - bare metal, xen, xen/noacpi и как-нибудь донести ситуацию
> до апстрима.
>
> Не подскажете, откуда лучше начинать? xen-devel@, bugzilla.xen.org,
> ...?
Я бы начал с xen-devel@
^ permalink raw reply [flat|nested] 20+ messages in thread
end of thread, other threads:[~2012-02-25 18:39 UTC | newest]
Thread overview: 20+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-04-07 10:19 [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
2011-04-07 15:31 ` Vitaly Kuznetsov
2011-04-07 16:19 ` Vitaly Kuznetsov
2011-04-12 6:19 ` Alex Moskalenko
2011-04-12 11:11 ` Vitaly Kuznetsov
2011-04-12 11:28 ` Alex Moskalenko
2011-04-13 16:01 ` Vitaly Kuznetsov
2011-04-14 8:16 ` Alex Moskalenko
2011-04-14 16:22 ` Vitaly Kuznetsov
2011-04-15 8:15 ` Michail Yakushin
2011-05-11 6:57 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
2011-05-13 11:52 ` Vitaly Kuznetsov
2011-05-16 7:38 ` Alex Moskalenko
2011-07-11 6:12 ` Alex Moskalenko
2011-07-11 6:24 ` Vitaly Kuznetsov
2011-08-10 10:55 ` Alex Moskalenko
2012-02-21 3:07 ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
2012-02-21 14:42 ` Vitaly Kuznetsov
2012-02-22 8:01 ` Alex Moskalenko
2012-02-25 18:39 ` Vitaly Kuznetsov
ALT Linux sysadmins discussion
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sysadmins/0 sysadmins/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sysadmins sysadmins/ http://lore.altlinux.org/sysadmins \
sysadmins@lists.altlinux.org sysadmins@lists.altlinux.ru sysadmins@lists.altlinux.com
public-inbox-index sysadmins
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sysadmins
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git