ALT Linux sysadmins discussion
 help / color / mirror / Atom feed
* [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
@ 2011-04-07 10:19 Alex Moskalenko
  2011-04-07 15:31 ` Vitaly Kuznetsov
  0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-07 10:19 UTC (permalink / raw)
  To: sysadmins, hardware

[-- Attachment #1: Type: text/plain, Size: 1328 bytes --]

Здравствуйте!

Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб оперативной 
памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0 из 
сизифа. Без опции acpi=off получаю стабильное падение ядра dom0, при наличии 
опции acpi=off загрузиться удается, но не работают многие устройства (точнее, 
работают только RAID-контроллер и сетевая карта). Во вложениях два протокола 
загрузки - c acpi=off и без нее.

Так как собственных знаний в области отладки ядра в достаточных количествах не 
имею, прошу помочь разобраться - что и куда можно покопать в этом случае. В 
идеале хотелось бы получить обычную загрузку без acpi=off и других подобных 
подпорок.

Заранее спасибо.

PS Ядро std-def грузится и работает без каких-либо видимых проблем.

-- 
WBR, Alex Moskalenko

[-- Attachment #2: minicom.cap.acpi.bz2 --]
[-- Type: application/x-bzip2, Size: 7909 bytes --]

[-- Attachment #3: minicom.cap.noacpi.bz2 --]
[-- Type: application/x-bzip2, Size: 7843 bytes --]

^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-07 10:19 [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
@ 2011-04-07 15:31 ` Vitaly Kuznetsov
  2011-04-07 16:19   ` Vitaly Kuznetsov
  0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-07 15:31 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion; +Cc: hardware

Alex Moskalenko <mav@elserv.msk.su> writes:

> Здравствуйте!
>
> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
> оперативной
> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
> из сизифа. 

В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
alt33 из архива (например тут:
ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_64/RPMS.classic/)

-- 
Vitaly Kuznetsov, ALT Linux


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-07 15:31 ` Vitaly Kuznetsov
@ 2011-04-07 16:19   ` Vitaly Kuznetsov
  2011-04-12  6:19     ` Alex Moskalenko
  0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-07 16:19 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion; +Cc: hardware

Vitaly Kuznetsov <vitty@altlinux.ru> writes:

> Alex Moskalenko <mav@elserv.msk.su> writes:
>
>> Здравствуйте!
>>
>> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
>> оперативной
>> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
>> из сизифа. 
>
> В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
> kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
> alt33 из архива (например тут:
> ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_64/RPMS.classic/)

К сожалению этого будет недостаточно. Ядро без гипервизора у вас
загрузится, с гипервизором - нет. Я попробую разобраться в данной
проблеме, благо такое железо под руками есть.

-- 
Vitaly Kuznetsov, ALT Linux


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-07 16:19   ` Vitaly Kuznetsov
@ 2011-04-12  6:19     ` Alex Moskalenko
  2011-04-12 11:11       ` Vitaly Kuznetsov
  2011-04-13 16:01       ` Vitaly Kuznetsov
  0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-12  6:19 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

On Thursday 07 April 2011 20:19:15 Vitaly Kuznetsov wrote:
> >> Есть в наличии железка - IBM eServer x3400 (2 4ядерных Xeon, 20 гб
> >> оперативной
> >> памяти). Пытаюсь запустить на нем текущие версии Xen и ядра xen-dom0
> >> из сизифа.
> >
> > В kernel-image-xen-dom0-2.6.32-alt36 вкралась ошибка, дождитесь
> > kernel-image-xen-dom0-2.6.32-alt36.1 (будет сегодня) или откатитесь на
> > alt33 из архива (например тут:
> > ftp://ftp.altlinux.org/pub/distributions/archive/Sisyphus/2011/04/01/x86_
> >64/RPMS.classic/)
>
> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
> загрузится, с гипервизором - нет. Я попробую разобраться в данной
> проблеме, благо такое железо под руками есть.
Здравствуйте!

Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу помочь с 
тестированием, если требуется.

Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для работы klogd 
со стандартными ALT-настройками - не работает он от пользователя в чруте 
(Cannot read proc file system: 1 - Operation not permitted.). Стоит багу 
вешать?

-- 
WBR, Alex Moskalenko

^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-12  6:19     ` Alex Moskalenko
@ 2011-04-12 11:11       ` Vitaly Kuznetsov
  2011-04-12 11:28         ` Alex Moskalenko
  2011-04-13 16:01       ` Vitaly Kuznetsov
  1 sibling, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-12 11:11 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Alex Moskalenko <mav@elserv.msk.su> writes:

>> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
>> загрузится, с гипервизором - нет. Я попробую разобраться в данной
>> проблеме, благо такое железо под руками есть.
> Здравствуйте!
>
> Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу
> помочь с тестированием, если требуется.
>

Мы занимаемся дебагом этой проблемы. x3400 у нас есть, так что
тестирование пока не требуется.

> Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для
> работы klogd со стандартными ALT-настройками - не работает он от
> пользователя в чруте
> (Cannot read proc file system: 1 - Operation not permitted.). Стоит
> багу вешать?

Повесьте, пожалуйста. Я проверю.

-- 
Vitaly Kuznetsov, ALT Linux


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-12 11:11       ` Vitaly Kuznetsov
@ 2011-04-12 11:28         ` Alex Moskalenko
  0 siblings, 0 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-12 11:28 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

On Tuesday 12 April 2011 15:11:04 Vitaly Kuznetsov wrote:
> > Также, похоже что в ядрах xen-dom0 не приложен/отвалился патч для
> > работы klogd со стандартными ALT-настройками - не работает он от
> > пользователя в чруте
> > (Cannot read proc file system: 1 - Operation not permitted.). Стоит
> > багу вешать?
>
> Повесьте, пожалуйста. Я проверю.
#25434

-- 
WBR, Alex Moskalenko

^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-12  6:19     ` Alex Moskalenko
  2011-04-12 11:11       ` Vitaly Kuznetsov
@ 2011-04-13 16:01       ` Vitaly Kuznetsov
  2011-04-14  8:16         ` Alex Moskalenko
  1 sibling, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-13 16:01 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Alex Moskalenko <mav@elserv.msk.su> writes:

>> К сожалению этого будет недостаточно. Ядро без гипервизора у вас
>> загрузится, с гипервизором - нет. Я попробую разобраться в данной
>> проблеме, благо такое железо под руками есть.
> Здравствуйте!
>
> Извиняюсь за назойливость, не виден ли свет в конце тоннеля? :) Могу
> помочь с тестированием, если требуется.

В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
вас заработать. Как соберётся - можете начинать тестировать.

-- 
Vitaly Kuznetsov, ALT Linux


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-13 16:01       ` Vitaly Kuznetsov
@ 2011-04-14  8:16         ` Alex Moskalenko
  2011-04-14 16:22           ` Vitaly Kuznetsov
  2011-04-15  8:15           ` Michail Yakushin
  0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-04-14  8:16 UTC (permalink / raw)
  To: Vitaly Kuznetsov; +Cc: ALT Linux sysadmins' discussion

On Wednesday 13 April 2011 20:01:07 you wrote:
> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
> вас заработать. Как соберётся - можете начинать тестировать.
Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. klogd также 
запускается в чруте от пользователя.

Есть несколько настораживающих сообщений в протоколах загрузки ядра и 
гипервизора, привожу их далее:

гипервизор
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
(XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()

ядро
[    0.067405] ACPI: No dock devices found.
[    0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
(ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
[    0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140 
to 80000000fec80473
[    0.068000] set_pte_at 0xffff88003fc87140 failed 1
[    0.068008] ACPI Error: Could not map memory at 00000000FEC80000, size 100 
(20090903/exregion-180)
[    0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for 
[SystemMemory] (20090903/evregion-424)
[    0.068533] ACPI Error (psparse-0537): Method parse/execution failed 
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[    0.068850] ACPI Error (uteval-0250): Method execution failed 
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[    0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)

[    0.196719] ACPI: bus type pnp registered
[    0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
(ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
[    0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140 
to 80000000fec80473
[    0.197491] set_pte_at 0xffff88003fc87140 failed 1
[    0.197616] ACPI Error: Could not map memory at 00000000FEC80000, size 100 
(20090903/exregion-180)
[    0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for 
[SystemMemory] (20090903/evregion-424)
[    0.198173] ACPI Error (psparse-0537): Method parse/execution failed 
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[    0.198523] ACPI Error (uteval-0250): Method execution failed 
[\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
[    0.198845] pnp 00:00: can't evaluate _CRS: 4

[    0.215212] PM-Timer failed consistency check  (0x0xffffff) - aborting.

[    0.422136] Freeing unused kernel memory: 548k freed
[    0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003d6030f0 
to 80000004c0564145
[    0.438260] input: AT Translated Set 2 keyboard 
as /devices/platform/i8042/serio0/input/input1

[    5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
[    5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 return -22
(ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
[    5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 return -22
(ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
[    5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 return -22
(ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
[    5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 return -22
(ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
[    5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 return -22
(ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
[    5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 return -22
(ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
[    5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 return -22
(ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
[    5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 return -22
(ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
[    5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0

[   14.289531] XENBUS: Unable to read cpu state
[   14.289688] XENBUS: Unable to read cpu state
[   14.289849] XENBUS: Unable to read cpu state
[   14.290056] XENBUS: Unable to read cpu state
[   14.290218] XENBUS: Unable to read cpu state
[   14.290396] XENBUS: Unable to read cpu state
[   14.290538] XENBUS: Unable to read cpu state
[   14.290692] XENBUS: Unable to read cpu state

С этим можно жить или лучше подождать?

--
WBR, Alex Moskalenko


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-14  8:16         ` Alex Moskalenko
@ 2011-04-14 16:22           ` Vitaly Kuznetsov
  2011-04-15  8:15           ` Michail Yakushin
  1 sibling, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-04-14 16:22 UTC (permalink / raw)
  To: Alex Moskalenko; +Cc: ALT Linux sysadmins' discussion

Alex Moskalenko <mav@elserv.msk.su> writes:

>
> С этим можно жить или лучше подождать?
>

ACPI, конечно, глючный, но если всё работает, то живите.

-- 
Vitaly Kuznetsov, ALT Linux


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-14  8:16         ` Alex Moskalenko
  2011-04-14 16:22           ` Vitaly Kuznetsov
@ 2011-04-15  8:15           ` Michail Yakushin
  2011-05-11  6:57             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
  2012-02-21  3:07             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
  1 sibling, 2 replies; 20+ messages in thread
From: Michail Yakushin @ 2011-04-15  8:15 UTC (permalink / raw)
  To: sysadmins

14.04.2011 12:16, Alex Moskalenko пишет:
> On Wednesday 13 April 2011 20:01:07 you wrote:
>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое должно у
>> вас заработать. Как соберётся - можете начинать тестировать.
> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. klogd также
> запускается в чруте от пользователя.
>
> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
> гипервизора, привожу их далее:
>
> гипервизор
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>
> ядро
> [    0.067405] ACPI: No dock devices found.
> [    0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [    0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [    0.068000] set_pte_at 0xffff88003fc87140 failed 1
> [    0.068008] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [    0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [    0.068533] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.068850] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>
> [    0.196719] ACPI: bus type pnp registered
> [    0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 return -22
> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
> [    0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003fc87140
> to 80000000fec80473
> [    0.197491] set_pte_at 0xffff88003fc87140 failed 1
> [    0.197616] ACPI Error: Could not map memory at 00000000FEC80000, size 100
> (20090903/exregion-180)
> [    0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
> [SystemMemory] (20090903/evregion-424)
> [    0.198173] ACPI Error (psparse-0537): Method parse/execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.198523] ACPI Error (uteval-0250): Method execution failed
> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
> [    0.198845] pnp 00:00: can't evaluate _CRS: 4
>
> [    0.215212] PM-Timer failed consistency check  (0x0xffffff) - aborting.
>
> [    0.422136] Freeing unused kernel memory: 548k freed
> [    0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003d6030f0
> to 80000004c0564145
> [    0.438260] input: AT Translated Set 2 keyboard
> as /devices/platform/i8042/serio0/input/input1
>
> [    5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
> [    5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 return -22
> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
> [    5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 return -22
> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
> [    5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 return -22
> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
> [    5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 return -22
> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
> [    5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 return -22
> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
> [    5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 return -22
> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
> [    5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 return -22
> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
> [    5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 return -22
> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
> [    5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
Суть этих сообщений warningи из за того что xen и dom0 подрались за 
область памяти, которая нужна ACPI и APIC. Но оно должно работать, да 
ядро не смогло кое-что сделать, но это делаетет сам xen.
Падения были вызваны тем, что ядро не правильно обрабатывало эту ошибку 
и наобум лезло туда куда xen его не пускал. П
Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим, 
подобная ситуация может быть и на другом железе.


^ permalink raw reply	[flat|nested] 20+ messages in thread

* [Sysadmins]  IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-04-15  8:15           ` Michail Yakushin
@ 2011-05-11  6:57             ` Alex Moskalenko
  2011-05-13 11:52               ` Vitaly Kuznetsov
  2012-02-21  3:07             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
  1 sibling, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-05-11  6:57 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Здравствуйте!

Снова подниму тему о x3400 и kernel-image-xen-dom0. Поставил ядро 
kernel-image-xen-dom0-2.6.32-alt38 (последнее на текущий момент). Система 
загрузилась, но весь лог забит следующими сообщениями:

May 10 17:34:59 mainsrv-dom0 kernel: [   24.070322] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cabcfa0 to 
80000004371c0145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070329] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cabcfa8 to 
80000004ff16a145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070343] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d890 to 
8000000436c80145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070352] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d898 to 
80000004369ad145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070360] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d8a0 to 
80000004371bf145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070366] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003b91d8a8 to 
8000000436944145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070680] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca7390 to 
80000004376eb145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070699] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca7398 to 
8000000436c8f145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070741] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73a0 to 
8000000436fac145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070749] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73a8 to 
80000004379fe145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070756] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73b0 to 
80000004ca839145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070773] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73b8 to 
80000004cab2b145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070781] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73c0 to 
80000004ceb2f145
May 10 17:34:59 mainsrv-dom0 kernel: [   24.070791] 
arch/x86/xen/mmu.c:xen_set_pte:Error setting ffff88003cca73c8 to 
8000000436410145

За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной 
периодичностью, а при какой-либо активности в dom0, то есть работа в domU 
сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.

Если требуется какая-либо еще информация, готов ее предоставить.

-- 
WBR, Alex Moskalenko


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-05-11  6:57             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
@ 2011-05-13 11:52               ` Vitaly Kuznetsov
  2011-05-16  7:38                 ` Alex Moskalenko
  0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-05-13 11:52 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Alex Moskalenko <mav@elserv.msk.su> writes:

> За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> периодичностью, а при какой-либо активности в dom0, то есть работа в
> domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>

В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.

-- 
  Vitaly Kuznetsov


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-05-13 11:52               ` Vitaly Kuznetsov
@ 2011-05-16  7:38                 ` Alex Moskalenko
  2011-07-11  6:12                   ` Alex Moskalenko
  0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2011-05-16  7:38 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

On Friday 13 May 2011 15:52:06 Vitaly Kuznetsov wrote:
> Alex Moskalenko <mav@elserv.msk.su> writes:
> > За 20 минут работы - 15 Мб лога. Сообщения появляются не с постоянной
> > периодичностью, а при какой-либо активности в dom0, то есть работа в
> > domU сообщений не вызывает. С 2.6.32-alt36.2 этих сообщений нет.
>
> В попавшем сегодня в сизиф -alt39 проблема должна быть исправлена.
Спасибо, с alt39 сообщения не беспокоят. :)

Один раз поймал следующее:

May 15 12:17:05 mainsrv-dom0 kernel: [69672.415333] BUG: soft lockup - CPU#1 
stuck for 65s! [swapper:0]
May 15 12:17:05 mainsrv-dom0 kernel: [69672.415349] Modules linked in: 
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si 
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom 
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata 
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core 
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc 
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal 
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416113] CPU 1:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416137] Modules linked in: 
xen_gntdev xt_physdev iptable_filter ip_tables x_tables coretemp ipmi_si 
ipmi_msghandler bridge stp dm_mod joydev usbhid hid ide_cd_mod cdrom 
ata_generic ide_pci_generic pata_acpi ata_piix ahci rtc_cmos rtc_core libata 
8250_pnp i2c_i801 i2c_core ehci_hcd uhci_hcd psmouse i5000_edac edac_core 
usbcore serio_raw piix i5k_amb ide_core hwmon pcspkr evdev ppdev parport_pc 
parport 8250 serial_core rtc_lib container sg tg3 nls_base button thermal 
processor ses enclosure ext3 jbd mbcache sd_mod crc_t10dif aacraid scsi_mod
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416898] Pid: 0, comm: swapper Not 
tainted 2.6.32-xen-dom0-alt39 #1 IBM eServer x3400-[7976L2G]-
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416912] RIP: e030:
[<ffffffff810093aa>]  [<ffffffff810093aa>] hypercall_page+0x3aa/0x1010
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416944] RSP: e02b:ffff88003fcadee8  
EFLAGS: 00000246
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416959] RAX: 0000000000000000 RBX: 
ffff88003fcadfd8 RCX: ffffffff810093aa
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416975] RDX: 0000000000000000 RSI: 
0000000000000000 RDI: 0000000000000001
May 15 12:17:05 mainsrv-dom0 kernel: [69672.416989] RBP: ffff88003fcadf00 R08: 
0000000000000000 R09: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417004] R10: 0000000000000000 R11: 
0000000000000246 R12: ffffffff815a1a20
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417017] R13: 0000000000000000 R14: 
0000000000000000 R15: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417035] FS:  00007f676217e700
(0000) GS:ffff880028054000(0000) knlGS:0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417049] CS:  e033 DS: 002b ES: 
002b CR0: 000000008005003b
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417063] CR2: 00007f020ba76008 CR3: 
000000003eb75000 CR4: 0000000000002660
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417079] DR0: 0000000000000000 DR1: 
0000000000000000 DR2: 0000000000000000
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417093] DR3: 0000000000000000 DR6: 
00000000ffff0ff0 DR7: 0000000000000400
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417108] Call Trace:
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417134]  [<ffffffff81010cc0>] ? 
xen_safe_halt+0x10/0x30
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417162]  [<ffffffff8101db20>] 
default_idle+0x40/0xb0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417188]  [<ffffffff81014349>] 
cpu_idle+0x79/0xc0
May 15 12:17:05 mainsrv-dom0 kernel: [69672.417215]  [<ffffffff8138c65d>] 
cpu_bringup_and_idle+0xe/0x10

И то же самое сообщение для каждого из ядер в это же время. Как это отразилось 
на работе сервера (было ни "подвисание" на 65 сек) - сказать не могу, не 
следил за ним в это время.


-- 
WBR, Alex Moskalenko


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-05-16  7:38                 ` Alex Moskalenko
@ 2011-07-11  6:12                   ` Alex Moskalenko
  2011-07-11  6:24                     ` Vitaly Kuznetsov
  2011-08-10 10:55                     ` Alex Moskalenko
  0 siblings, 2 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-07-11  6:12 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Здравствуйте!

Снова подниму тему работы нашего xen-dom0 на eServer x3400. На данный момент 
на сервере установлены xen 4.1.1 и ядро 2.6.32-xen-dom0-alt41. В качетсве 
гостевых систем - 4 hvm-домена с Windows и 2 pv с Linux (2.6.39-std-def-alt2. 
За время тестирования накопилась следующая статистика:

1) Несмотря на "глючный ACPI" все устройства работают;

2) Периодически появляются сообщения от ядра:
=== cut === 
[44022.366517] BUG: soft lockup - CPU#0 stuck for 74s! [swapper:0]
[44022.366532] Modules linked in: xt_physdev ipt_MASQUERADE iptable_nat nf_nat 
nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT 
iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables coretemp ipmi_si 
bridge stp vfat fat usb_storage usb_libusual dm_multipath scsi_dh dm_mod 
joydev usbhid hid ide_cd_mod cdrom ata_generic ide_pci_generic pata_acpi 
ata_piix ehci_hcd uhci_hcd usbcore edac_core psmouse ahci piix i5k_amb 
i2c_i801 hwmon pcspkr nls_base libata tg3 ide_core i2c_core serio_raw evdev 
8250_pnp rtc_cmos 8250 rtc_core serial_core rtc_lib ses container enclosure 
sg thermal button processor parport_pc aksparlnx(P) parport ipmi_devintf 
ipmi_msghandler tun xen_gntdev ext3 jbd mbcache sd_mod crc_t10dif aacraid 
scsi_mod [last unloaded: i5000_edac]
[44022.367667] CPU 0:
[44022.367704] Modules linked in: xt_physdev ipt_MASQUERADE iptable_nat nf_nat 
nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT 
iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables coretemp ipmi_si 
bridge stp vfat fat usb_storage usb_libusual dm_multipath scsi_dh dm_mod 
joydev usbhid hid ide_cd_mod cdrom ata_generic ide_pci_generic pata_acpi 
ata_piix ehci_hcd uhci_hcd usbcore edac_core psmouse ahci piix i5k_amb 
i2c_i801 hwmon pcspkr nls_base libata tg3 ide_core i2c_core serio_raw evdev 
8250_pnp rtc_cmos 8250 rtc_core serial_core rtc_lib ses container enclosure 
sg thermal button processor parport_pc aksparlnx(P) parport ipmi_devintf 
ipmi_msghandler tun xen_gntdev ext3 jbd mbcache sd_mod crc_t10dif aacraid 
scsi_mod [last unloaded: i5000_edac]
[44022.369119] Pid: 0, comm: swapper Tainted: P           
2.6.32-xen-dom0-alt41 #1 IBM eServer x3400-[7976L2G]-
[44022.369139] RIP: e030:[<ffffffff810093aa>]  [<ffffffff810093aa>] 
hypercall_page+0x3aa/0x1010
[44022.369186] RSP: e02b:ffffffff8154fef0  EFLAGS: 00000246
[44022.369205] RAX: 0000000000000000 RBX: ffffffff8154ffd8 RCX: 
ffffffff810093aa
[44022.369224] RDX: 0000000000000000 RSI: 0000000000000000 RDI: 
0000000000000001
[44022.369246] RBP: ffffffff8154ff08 R08: 0000000000000000 R09: 
0000000000000000
[44022.369265] R10: 0000000000000000 R11: 0000000000000246 R12: 
ffffffff815a1b60
[44022.369285] R13: 0000000000000000 R14: 0000000000000000 R15: 
0000000000000000
[44022.369308] FS:  00007f9eaa00c700(0000) GS:ffff880028038000(0000) 
knlGS:0000000000000000
[44022.369327] CS:  e033 DS: 0000 ES: 0000 CR0: 000000008005003b
[44022.369346] CR2: 00007f1ddcd5c000 CR3: 000000003c797000 CR4: 
0000000000002660
[44022.369362] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 
0000000000000000
[44022.369382] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 
0000000000000400
[44022.369401] Call Trace:
[44022.369436]  [<ffffffff81010cc0>] ? xen_safe_halt+0x10/0x30
[44022.369472]  [<ffffffff8101db20>] default_idle+0x40/0xb0
[44022.369507]  [<ffffffff81014349>] cpu_idle+0x79/0xc0
[44022.369542]  [<ffffffff81382d2d>] rest_init+0x6d/0x80
[44022.369576]  [<ffffffff815bce55>] start_kernel+0x3f6/0x492
[44022.369613]  [<ffffffff815bc2b9>] x86_64_start_reservations+0x99/0xb9
[44022.369651]  [<ffffffff815c07f9>] xen_start_kernel+0x5d2/0x6b9
=== cut===
Периодичность сообщений случайная. От 2 раз в сутки до раза в неделю. 
Количество "подвисших" процессоров также может быть как один, так и восемь 
(количество ядер в системе). Больше всего беспокоит то, что после этих 
сообщений и dom0, и domU, на которые попали подвисшие CPU, дейсвительно 
полностью подвисают на время, указанное в строке "BUG: soft lockup - CPU## 
stuck for ##s!". Это видно по сообщениям ядра в linux ([43965.911454] 
Clocksource tsc unstable (delta = -42949673037 ns)) и следующих за ним 
сообщениях от ntpd о коррекции времени; и по сообщениям от службы w32time в 
Windows;

3) Очень редко в dom0 появляется сообщение ядра
===cut===
EDAC MC0: UE row 1, channel-a= 0 channel-b= 1 labels "-": (Branch=0 
DRAM-Bank=4 RDWR=Write RAS=5926 CAS=0 FATAL Err=0x4 (>Tmid Thermal event with 
intelligent throttling disabled))
===cut===
На работе не отражается никак. Тесты памяти ошибок не выявляют, сбоев нет, 
перегрева не наблюдается.

Из вышеперечисленного более всего беспокоит проблема (2). В BIOS все, что мог, 
перепробовал - отключил Enhanced C-States, поддержку S3 - ситуация не 
меняется.

В связи с этим вопрос к Виталию Кузнецову: не могли бы Вы поделиться патчем на 
ACPI к нашему 2.6.32-xen-dom0? Я хотел попробовать наложить его на ядро 
xen-stable-2.6.39 из 
git://git.kernel.org/pub/scm/linux/kernel/git/konrad/xen.git и попробовать в 
работе его. Сейчас оно к сожалению падает при загрузке, как 
2.6.32-xen-dom0-alt < alt36.2.

-- 
WBR, Alex Moskalenko

^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-07-11  6:12                   ` Alex Moskalenko
@ 2011-07-11  6:24                     ` Vitaly Kuznetsov
  2011-08-10 10:55                     ` Alex Moskalenko
  1 sibling, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2011-07-11  6:24 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Alex Moskalenko <mav@elserv.msk.su> writes:

> В связи с этим вопрос к Виталию Кузнецову: не могли бы Вы поделиться
> патчем на ACPI к нашему 2.6.32-xen-dom0? Я хотел попробовать наложить его на
> ядро
> xen-stable-2.6.39 из 
> git://git.kernel.org/pub/scm/linux/kernel/git/konrad/xen.git и
> попробовать в
> работе его. Сейчас оно к сожалению падает при загрузке, как 
> 2.6.32-xen-dom0-alt < alt36.2.

Четыре верхних коммита из
http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0

-- 
  Vitaly Kuznetsov


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38
  2011-07-11  6:12                   ` Alex Moskalenko
  2011-07-11  6:24                     ` Vitaly Kuznetsov
@ 2011-08-10 10:55                     ` Alex Moskalenko
  1 sibling, 0 replies; 20+ messages in thread
From: Alex Moskalenko @ 2011-08-10 10:55 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

Здравствуйте!

Хочу сообщить сообществу, что проблемы с часами и сообщениями о подвисании 
процессоров в логах (см. предыдущее письмо) решились добавлением опции 
гипервизора clocksource=pit. Без этой опции Xen использует ACPI PM Timer, 
который, видимо, какой-то неправильный, как и все ACPI на этом сервере.
При использовании PIT сообщений о скачках времени и подвисаниях не 
наблюдается.

PS Приложить ACPI-патчи от нашего 2.6.32 на 3.0 не осилил. :) Знаний и времени 
не хватило на изучение всех изменений кода. Жду 3.1 для тестирования - по 
функционалу должно быть не хуже, чем 2.6.32, вот только поддержку xen из него 
похоже выкинули...

-- 
WBR, Alex Moskalenko

^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2011-04-15  8:15           ` Michail Yakushin
  2011-05-11  6:57             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
@ 2012-02-21  3:07             ` Alex Moskalenko
  2012-02-21 14:42               ` Vitaly Kuznetsov
  1 sibling, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2012-02-21  3:07 UTC (permalink / raw)
  To: sysadmins

15.04.2011 12:15, Michail Yakushin пишет:
> 14.04.2011 12:16, Alex Moskalenko пишет:
>> On Wednesday 13 April 2011 20:01:07 you wrote:
>>> В http://git.altlinux.org/tasks/42643/ собирается ядро, которое 
>>> должно у
>>> вас заработать. Как соберётся - можете начинать тестировать.
>> Спасибо, 2.6.32.2 загрузилось. Устройства вроде бы тоже работают. 
>> klogd также
>> запускается в чруте от пользователя.
>> Есть несколько настораживающих сообщений в протоколах загрузки ядра и
>> гипервизора, привожу их далее:
>>
>> гипервизор
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:825:d0 Non-privileged (0) attempt to map I/O space 000fec80
>> (XEN) mm.c:4967:d0 ptwr_emulate: could not get_page_from_l1e()
>>
>> ядро
>> [    0.067405] ACPI: No dock devices found.
>> [    0.067667] HYPERVISOR_update_va_mapping at 0xffffc90000028000 
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [    0.067872] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003fc87140
>> to 80000000fec80473
>> [    0.068000] set_pte_at 0xffff88003fc87140 failed 1
>> [    0.068008] ACPI Error: Could not map memory at 00000000FEC80000, 
>> size 100
>> (20090903/exregion-180)
>> [    0.068269] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [    0.068533] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.068850] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.069160] ACPI: PCI Root Bridge [PCI0] (0000:00)
>>
>> [    0.196719] ACPI: bus type pnp registered
>> [    0.197082] HYPERVISOR_update_va_mapping at 0xffffc90000028000 
>> return -22
>> (ptep=0xffff88003fc87140 pteval=0x80000000fec80473)
>> [    0.197299] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003fc87140
>> to 80000000fec80473
>> [    0.197491] set_pte_at 0xffff88003fc87140 failed 1
>> [    0.197616] ACPI Error: Could not map memory at 00000000FEC80000, 
>> size 100
>> (20090903/exregion-180)
>> [    0.197893] ACPI Exception: AE_NO_MEMORY, Returned by Handler for
>> [SystemMemory] (20090903/evregion-424)
>> [    0.198173] ACPI Error (psparse-0537): Method parse/execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.198523] ACPI Error (uteval-0250): Method execution failed
>> [\_SB_.PCI0._CRS] (Node ffff88003fc83670), AE_NO_MEMORY
>> [    0.198845] pnp 00:00: can't evaluate _CRS: 4
>>
>> [    0.215212] PM-Timer failed consistency check  (0x0xffffff) - 
>> aborting.
>>
>> [    0.422136] Freeing unused kernel memory: 548k freed
>> [    0.423725] arch/x86/xen/mmu.c:xen_set_pte:Error setting 
>> ffff88003d6030f0
>> to 80000004c0564145
>> [    0.438260] input: AT Translated Set 2 keyboard
>> as /devices/platform/i8042/serio0/input/input1
>>
>> [    5.593467] scsi 0:1:0:0: Attached scsi generic sg3 type 0
>> [    5.593548] HYPERVISOR_update_va_mapping at 0xffffe8fffff1f000 
>> return -22
>> (ptep=0xffff88003d1d38f8 pteval=0x8000000432fd7063)
>> [    5.593560] HYPERVISOR_update_va_mapping at 0xffffe8fffff3b000 
>> return -22
>> (ptep=0xffff88003d1d39d8 pteval=0x8000000435c88063)
>> [    5.593570] HYPERVISOR_update_va_mapping at 0xffffe8fffff57000 
>> return -22
>> (ptep=0xffff88003d1d3ab8 pteval=0x8000000435dfa063)
>> [    5.593581] HYPERVISOR_update_va_mapping at 0xffffe8fffff73000 
>> return -22
>> (ptep=0xffff88003d1d3b98 pteval=0x8000000435df9063)
>> [    5.593591] HYPERVISOR_update_va_mapping at 0xffffe8fffff8f000 
>> return -22
>> (ptep=0xffff88003d1d3c78 pteval=0x80000004356ef063)
>> [    5.593602] HYPERVISOR_update_va_mapping at 0xffffe8fffffab000 
>> return -22
>> (ptep=0xffff88003d1d3d58 pteval=0x80000004356ea063)
>> [    5.593612] HYPERVISOR_update_va_mapping at 0xffffe8fffffc7000 
>> return -22
>> (ptep=0xffff88003d1d3e38 pteval=0x80000004356eb063)
>> [    5.593627] HYPERVISOR_update_va_mapping at 0xffffe8fffffe3000 
>> return -22
>> (ptep=0xffff88003d1d3f18 pteval=0x80000004356ec063)
>> [    5.593725] scsi 0:1:1:0: Attached scsi generic sg4 type 0
> Суть этих сообщений warningи из за того что xen и dom0 подрались за 
> область памяти, которая нужна ACPI и APIC. Но оно должно работать, да 
> ядро не смогло кое-что сделать, но это делаетет сам xen.
> Падения были вызваны тем, что ядро не правильно обрабатывало эту 
> ошибку и наобум лезло туда куда xen его не пускал. П
> Просбсьа понаблюдать, видимо этот пач будем отправлять в апстрим, 
> подобная ситуация может быть и на другом железе.
> _______________________________________________

Здравствуйте!

Подскажите пожалуйста, пытались ли контактировать с апстримом на предмет 
этого патча? Я до сих пор заинтересован в запуске xen на x3400, а ядра 
3.1.х и 3.2.х продолжают падать в dom0. Наше патченое xen-dom0 при этом 
работает. Поэтому, если с апстримом не контактировали, хочу сам 
попробовать пообщаться в рассылках/повесить баг на эту тему.

PS Неужели больше никто не пытался запускать pvops ядра в dom0 на x3400? 
Я единственный из всех пользователей xen, кто поймал эту проблему? Или у 
меня какой-то неправильный сервер?...


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2012-02-21  3:07             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
@ 2012-02-21 14:42               ` Vitaly Kuznetsov
  2012-02-22  8:01                 ` Alex Moskalenko
  0 siblings, 1 reply; 20+ messages in thread
From: Vitaly Kuznetsov @ 2012-02-21 14:42 UTC (permalink / raw)
  To: sysadmins

On Tue, 21 Feb 2012 07:07:13 +0400, Alex Moskalenko wrote:
>
> Здравствуйте!
>
> Подскажите пожалуйста, пытались ли контактировать с апстримом на
> предмет этого патча? Я до сих пор заинтересован в запуске xen на
> x3400, а ядра 3.1.х и 3.2.х продолжают падать в dom0. Наше патченое
> xen-dom0 при этом работает. Поэтому, если с апстримом не
> контактировали, хочу сам попробовать пообщаться в рассылках/повесить
> баг на эту тему.
>
> PS Неужели больше никто не пытался запускать pvops ядра в dom0 на
> x3400? Я единственный из всех пользователей xen, кто поймал эту
> проблему? Или у меня какой-то неправильный сервер?...

Это всё очень похоже на глючный биос одной конкретной железки (там, 
насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной 
проблеме не общались.


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash
  2012-02-21 14:42               ` Vitaly Kuznetsov
@ 2012-02-22  8:01                 ` Alex Moskalenko
  2012-02-25 18:39                   ` Vitaly Kuznetsov
  0 siblings, 1 reply; 20+ messages in thread
From: Alex Moskalenko @ 2012-02-22  8:01 UTC (permalink / raw)
  To: ALT Linux sysadmins' discussion

21.02.2012 18:42, Vitaly Kuznetsov пишет:
> On Tue, 21 Feb 2012 07:07:13 +0400, Alex Moskalenko wrote:
>>
>> Здравствуйте!
>>
>> Подскажите пожалуйста, пытались ли контактировать с апстримом на
>> предмет этого патча? Я до сих пор заинтересован в запуске xen на
>> x3400, а ядра 3.1.х и 3.2.х продолжают падать в dom0. Наше патченое
>> xen-dom0 при этом работает. Поэтому, если с апстримом не
>> контактировали, хочу сам попробовать пообщаться в рассылках/повесить
>> баг на эту тему.
>>
>> PS Неужели больше никто не пытался запускать pvops ядра в dom0 на
>> x3400? Я единственный из всех пользователей xen, кто поймал эту
>> проблему? Или у меня какой-то неправильный сервер?...
>
> Это всё очень похоже на глючный биос одной конкретной железки (там,
> насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной
> проблеме не общались.

Да, проблемы там в районе ACPI, причем так фатально они проявляются 
только при запуске ядра под Xen. При отсутствии xen ядро грузится и 
работает.

Насколько я понял суть Ваших исправлений в git (

http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0

), Вы добавили обработку ошибок при доступе ядра к областям памяти через 
функции xen. В исходном варианте ядро не проверяет результат своих 
действий, и никак не ожидает получить отказ от гипервизора, вследствие 
чего падает. Так что, возможно железка и глючная, но мне кажется, что 
ядро должно работать одинаково независимо от наличия/отсутствия 
гипервизора. Вот по поводу отсутствия корректной обработки ошибок и 
хотел пообщаться с апстримом. В праздники постараюсь получить логи с 
этого сервера с последним 3.х ядром в 3х вариантах - bare metal, xen, 
xen/noacpi и как-нибудь донести ситуацию до апстрима.

Не подскажете, откуда лучше начинать? xen-devel@, bugzilla.xen.org, ...?


-- 
WBR, Alex Moskalenko


^ permalink raw reply	[flat|nested] 20+ messages in thread

* Re: [Sysadmins] IBM eServer x3400 + Xen 4.1.0 +  kernel-image-xen-dom0 = crash
  2012-02-22  8:01                 ` Alex Moskalenko
@ 2012-02-25 18:39                   ` Vitaly Kuznetsov
  0 siblings, 0 replies; 20+ messages in thread
From: Vitaly Kuznetsov @ 2012-02-25 18:39 UTC (permalink / raw)
  To: sysadmins

On Wed, 22 Feb 2012 12:01:17 +0400, Alex Moskalenko wrote:
>> Это всё очень похоже на глючный биос одной конкретной железки (там,
>> насколько я помню, проблемы в районе ACPI). Мы с апстримом по данной
>> проблеме не общались.
>
> Да, проблемы там в районе ACPI, причем так фатально они проявляются
> только при запуске ядра под Xen. При отсутствии xen ядро грузится и
> работает.
>
> Насколько я понял суть Ваших исправлений в git (
>
> 
> http://git.altlinux.org/people/silicium/packages/?p=kernel-image.git;a=shortlog;h=refs/heads/kernel-image-xen-dom0
>
> ), Вы добавили обработку ошибок при доступе ядра к областям памяти
> через функции xen. В исходном варианте ядро не проверяет результат
> своих действий, и никак не ожидает получить отказ от гипервизора,
> вследствие чего падает. Так что, возможно железка и глючная, но мне
> кажется, что ядро должно работать одинаково независимо от
> наличия/отсутствия гипервизора. Вот по поводу отсутствия корректной
> обработки ошибок и хотел пообщаться с апстримом. В праздники
> постараюсь получить логи с этого сервера с последним 3.х ядром в 3х
> вариантах - bare metal, xen, xen/noacpi и как-нибудь донести ситуацию
> до апстрима.
>
> Не подскажете, откуда лучше начинать? xen-devel@, bugzilla.xen.org, 
> ...?

Я бы начал с xen-devel@


^ permalink raw reply	[flat|nested] 20+ messages in thread

end of thread, other threads:[~2012-02-25 18:39 UTC | newest]

Thread overview: 20+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-04-07 10:19 [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
2011-04-07 15:31 ` Vitaly Kuznetsov
2011-04-07 16:19   ` Vitaly Kuznetsov
2011-04-12  6:19     ` Alex Moskalenko
2011-04-12 11:11       ` Vitaly Kuznetsov
2011-04-12 11:28         ` Alex Moskalenko
2011-04-13 16:01       ` Vitaly Kuznetsov
2011-04-14  8:16         ` Alex Moskalenko
2011-04-14 16:22           ` Vitaly Kuznetsov
2011-04-15  8:15           ` Michail Yakushin
2011-05-11  6:57             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0-alt38 Alex Moskalenko
2011-05-13 11:52               ` Vitaly Kuznetsov
2011-05-16  7:38                 ` Alex Moskalenko
2011-07-11  6:12                   ` Alex Moskalenko
2011-07-11  6:24                     ` Vitaly Kuznetsov
2011-08-10 10:55                     ` Alex Moskalenko
2012-02-21  3:07             ` [Sysadmins] IBM eServer x3400 + Xen 4.1.0 + kernel-image-xen-dom0 = crash Alex Moskalenko
2012-02-21 14:42               ` Vitaly Kuznetsov
2012-02-22  8:01                 ` Alex Moskalenko
2012-02-25 18:39                   ` Vitaly Kuznetsov

ALT Linux sysadmins discussion

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sysadmins/0 sysadmins/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sysadmins sysadmins/ http://lore.altlinux.org/sysadmins \
		sysadmins@lists.altlinux.org sysadmins@lists.altlinux.ru sysadmins@lists.altlinux.com
	public-inbox-index sysadmins

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sysadmins


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git