From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.4.1 (2015-04-28) on sa.local.altlinux.org X-Spam-Level: X-Spam-Status: No, score=-2.0 required=5.0 tests=BAYES_00,DKIM_SIGNED, DKIM_VALID,DKIM_VALID_AU,FREEMAIL_FROM autolearn=ham autolearn_force=no version=3.4.1 DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=20120113; h=to:from:subject:message-id:date:user-agent:mime-version :content-transfer-encoding; bh=wg0z4JWh7shgk8VaeBm0tcsUkZkNnpMwPnu59qNUDFc=; b=vIX1B/5ebjFTq4WdFwtXvGIVLIcsT4Q84pr4dtKt/jLumE2WYAOWBpx7Hr8opzjalf a+CUkZtzLnzahVZMm9FkfIOzDkWKJCBnb3FXixYidZkEQymcX5q6dB4IKtcaXegub644 EX0NRDxxxcTkRJAvxy0dXgvmtIx2V697Ug3vGxaA2MK2Q4Io13bhZogtOvyPfa2dEHjm MM12FwsaG96UJus6s/VRXsibA+YlIqLWyVQcpmuWkr9rxX5DiNpsXl455RWyL0E7udLr Ag29MJI8CTGycYmUXEiuxay7jAWinQTWVWmXrKg8SkdmhaXWj0oVufcrRpKPgvtVhfvc txTw== X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=1e100.net; s=20130820; h=x-gm-message-state:to:from:subject:message-id:date:user-agent :mime-version:content-transfer-encoding; bh=wg0z4JWh7shgk8VaeBm0tcsUkZkNnpMwPnu59qNUDFc=; b=MssKuwIJLSjwVQWe/nKYDV6xmDyM5R3+V5kjxoGEdG2RLqLAvAo0M6QcNLiUEqIqMv 81JksTjFhnghJS7+kCjcCZ+rLWbdjEYpxGlOdfEV/aw+MV8eZc125GI8BG9L/VotyCdz YrzSJXhtOkEZ6x8ckuKx8e06KyoalFXpnEVp2EexdIdjD3ZkNguE7lRLDI2JBLIEEWZC d5IbryQbednqhaR6XW8ZU6CZhMqcs2cdMRRD9dNPM73PxAvw6XLs2cl0nGFWn2C5a5TK 7ywzHYgScr7MvD1HQSJPtZ1WyZ/e7tugl/0Rs4MkI8p1ciLzUF2wqiwSPYpn6Lv5CToa qBLg== X-Gm-Message-State: ALyK8tLhc2BrL9SwNCwv8hsCWMDdXWW1Dt/COcYut/AbCk3ohvRD4QgybIDKJFXXF0uiAw== X-Received: by 10.25.149.75 with SMTP id x72mr1959615lfd.156.1464649412383; Mon, 30 May 2016 16:03:32 -0700 (PDT) To: ALT Linux Sisyphus discussions From: Stas Message-ID: <574CC6C2.1050902@gmail.com> Date: Tue, 31 May 2016 04:03:30 +0500 User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:38.0) Gecko/20100101 Thunderbird/38.6.0 MIME-Version: 1.0 Content-Type: text/plain; charset=utf-8 Content-Transfer-Encoding: 8bit Subject: [sisyphus] BUG: soft lockup - CPU#1 stuck for 23s! X-BeenThere: sisyphus@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: ALT Linux Sisyphus discussions List-Id: ALT Linux Sisyphus discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Mon, 30 May 2016 23:03:37 -0000 Archived-At: List-Archive: List-Post: Некоторое время сталкиваюсь с проблемой: smbd подвешивает одно из ядер (разные ядра в разных случаях), растут LA, kill -kill подвисшие самбы не киляет и программная перезагрузка не отраюатывает. Помогает только нажатие Reset или отключение питания. Ядро при этом сообщает: [ 1536.827715] BUG: soft lockup - CPU#1 stuck for 23s! [smbd:6663] [ 1536.828132] Modules linked in: ip6table_filter ip6_tables ebtable_nat ebtables ipt_MASQUERADE iptable_nat nf_nat_ipv4 nf_nat nf_conntrack _ipv4 nf_defrag_ipv4 xt_conntrack nf_conntrack ipt_REJECT xt_CHECKSUM iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables bridge stp llc af_packet autofs4 sunrpc ipv6 xfs libcrc32c dm_multipath scsi_dh coretemp hwmon intel_rapl x86_pkg_temp_thermal intel_powerclamp kvm_intel kvm crct10dif_pclmul crc32_pclmul crc32c_intel aesni_intel i915 d rm_kms_helper iTCO_wdt iTCO_vendor_support drm aes_x86_64 alx(O) lrw gf128mul xhci_hcd glue_helper i2c_i801 intel_gtt mdio ablk_helper i2c_algo_bit tpm_infineon thermal lpc_i ch cryptd i2c_core fan battery video psmouse evdev microcode serio_raw pcspkr processor button tun ext4 crc16 mbcache jbd2 raid1 hid_generic sd_mod crc_t10dif crct10dif_commo n ata_generic pata_acpi usbhid hid ata_piix libata ehci_pci ehci_hcd scsi_mod usbcore usb_common dm_mod [ 1536.828166] CPU: 1 PID: 6663 Comm: smbd Tainted: G O 3.14.70-std-def-alt0.M70P.1 #1 [ 1536.828167] Hardware name: Gigabyte Technology Co., Ltd. To be filled by O.E.M./B75-D3V, BIOS F9 10/23/2013 [ 1536.828168] task: ffff8800d72ea090 ti: ffff880206dda000 task.ti: ffff880206dda000 [ 1536.828169] RIP: 0010:[] [] _raw_spin_lock+0x27/0x50 [ 1536.828174] RSP: 0018:ffff880206ddbe20 EFLAGS: 00000206 [ 1536.828175] RAX: 0000000000007b72 RBX: ffffffff811cf36c RCX: 0000000000000098 [ 1536.828176] RDX: 000000000000007e RSI: 000000000000007e RDI: ffff880206d8fe88 [ 1536.828176] RBP: ffff880206ddbe48 R08: 00000000574c0cb1 R09: ffff880206ddbbe4 [ 1536.828177] R10: ffff880206ddbee2 R11: 0000000000000004 R12: ffff88020c839a10 [ 1536.828178] R13: 0000000000000002 R14: ffff88020c8144c0 R15: 0000000400000001 [ 1536.828179] FS: 00007f42454287c0(0000) GS:ffff88021e240000(0000) knlGS:0000000000000000 [ 1536.828180] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 [ 1536.828181] CR2: 00007f42344aa53c CR3: 0000000206ebb000 CR4: 00000000001407e0 [ 1536.828182] Stack: [ 1536.828182] ffffffff8152dea7 ffff88021210bbc0 0000000000000027 ffff880206ddbec0 [ 1536.828184] ffff88021210bbc0 ffff880206ddbea8 ffffffff8152fba3 ffff880206ddbe74 [ 1536.828186] ffffffff8185c440 0000000000000000 0000002700000000 ffffffff810a10a6 [ 1536.828188] Call Trace: [ 1536.828192] [] ? unix_state_double_lock+0x27/0x70 [ 1536.828194] [] unix_dgram_connect+0x93/0x200 [ 1536.828197] [] ? account_system_time+0xc6/0x180 [ 1536.828199] [] SYSC_connect+0xdb/0x100 [ 1536.828202] [] SyS_connect+0x9/0x10 [ 1536.828204] [] tracesys+0xdd/0xe2 [ 1536.828205] Code: 00 00 00 00 b8 00 02 00 00 f0 66 0f c1 07 0f b6 d4 38 c2 75 01 c3 83 e2 fe 0f b6 f2 b8 00 80 00 00 eb 08 90 f3 90 83 e8 01 74 0a <0f> b6 0f 38 ca 75 f2 66 90 c3 48 83 3d e7 9d 2a 00 00 74 09 0f Ядро обновлял, это не помогло, теперь работает Linux 3.14.70-std-def-alt0.M70P.1 x86_64. Самба обслуживает меньше десяти клиентов, ресурсы расположены на томе с файловой сиcтемой xfs. Только что заменил FS на томе на ext4, чтобы проверить, не в этом ли дело. Гугленье не слишком помогает понять, что к чему. Единственная внятная рекомендация - добавить в командную строку ядра "nohz=off hpet=disable", только я сомневаюсь, что дело в HPET и "засыпании" CPU. -- Станислав Дёгтев Служба "Ваш админ" Мои контакты: - jabber: grumbler@grumbler.org - email: stas.grumbler@gmail.com и stas@vashadmin.su - телефоны в Е-бурге +79045430461 и +79222112259