From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.4.1 (2015-04-28) on sa.local.altlinux.org X-Spam-Level: X-Spam-Status: No, score=-1.9 required=5.0 tests=BAYES_00 autolearn=ham autolearn_force=no version=3.4.1 To: community@lists.altlinux.org References: <201909091133.05478.a_s_y@sama.ru> <201909091213.13719.a_s_y@sama.ru> From: =?UTF-8?B?0J/QsNCy0LXQuyDQmNGB0L7Qv9C10L3QutC+?= Message-ID: <659e328d-5c05-52b0-b83e-e1da4b596937@pauli.ru> Date: Wed, 20 Nov 2019 23:42:10 +0300 User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Thunderbird/52.9.1 MIME-Version: 1.0 In-Reply-To: Content-Type: text/plain; charset=utf-8; format=flowed Content-Language: en-US Content-Transfer-Encoding: 8bit Subject: Re: [Comm] =?utf-8?b?0J3QtdC/0L7QvdGP0YLQvdC+0LUg0L/QvtCy0LXQtNC10L0=?= =?utf-8?b?0LjQtSBwOQ==?= X-BeenThere: community@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: ALT Linux Community general discussions List-Id: ALT Linux Community general discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 20 Nov 2019 20:44:48 -0000 Archived-At: List-Archive: List-Post: 20.11.2019 22:07, Yuri Khachaturyan пишет: > В продолжение этой темы. > Заменил диски на новые и 100% рабочие (тестировал каждый диск перед > установкой посекторно). Это правильно. > Сервер проработал 1.5 суток и опять та же история - просто отвалился > /dev/sda и система не дает ни залогиниться локально, ни > естесственно удаленно. Все признаки указывают на аппаратную неисправность. Ни p9, ни p8 и никакая другая p* так себя не вели. Никогда. Я бы начал с замены блока питания. Далее всё - компонент за компонентом. А лучше сервер целиком, так продуктивнее. Старый разобрать на запчасти. Даже если дело в драйвере и старый сервер исправен, мы ничего не теряем, комплект ЗИП лишним не будет. > Есть мысль в неисправности контроллера (Intel ServerRAID 8K) или же > все-таки проблема в драйвере aacraid? Как это можно диагностировать? Подменой контроллера на заведомо исправный. Такой найдётся? > > В логах ни слова о проблеме нет. Когда подсистема хранения останавливается внезапно, куда писать лог? > 1. продуть разъемы SATA от пыли сжатым воздухом. Не стоит усилий. Просто остановить на несколько минут сервер и вынуть-вставить разъёмы. Любая пыль неизбежно будет сдвинута с пятна контакта. Кстати, а откуда в серверной вообще пыль? Что с фильтрами и вообще с климат-контролем? А как насчёт наддува корпуса, что с терморежимом и схемой теплопереноса, всё ли исправно? > 2. попробовать собрать mdraid вместо аппаратного (а вдруг) Можно. Как-то расследовал похожий случай. Закончилось тем что RAID попросту развалился у меня в руках - конструктивный дефект, заложенный изготовителем восемь лет тому назад. Уже год сервер доживает с программным RAID5, и нет проблем. > 3. заменить ОС на FreeBSD и посмотреть что будет. Уже известно. Ничего хорошего. Но попробовать можно. Опыт, как-никак. > > Ваше мнение? Новый сервер, старый на запчасти. И не жалеть. Хороший так себя не поведёт, а плохого не жалко. -- С уважением, Павел Исопенко тел. +79165329582 email: master@pauli.ru XMPP: pavelri@jabber.credoaudit.ru