* [Comm] Выпал диск из RAID1 @ 2012-04-20 10:42 Vladimir Karpinsky 2012-04-20 11:25 ` Michael Shigorin 0 siblings, 1 reply; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-20 10:42 UTC (permalink / raw) To: community Здравствуйте! Обнаружил, что 2-й диск выпал из массива: # cat /proc/mdstat Personalities : [raid1] md1 : active raid1 sda2[0] 4192896 blocks [2/1] [U_] md2 : active raid1 sda5[0] 10490304 blocks [2/1] [U_] md3 : active raid1 sda6[0] 13309696 blocks [2/1] [U_] md4 : active raid1 sda7[0] 11068672 blocks [2/1] [U_] md0 : active raid1 sda1[0] 955712 blocks [2/1] [U_] Физически диск присутствует, во всяком случае fdisk про него всё рассказывает, smartctl явных ошибок не даёт. Пытаюсь # mdadm --re-add /dev/md0 /dev/sdb1 mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible После попытки остановки-запуска в логе: md: kicking non-fresh sdb1 from array! md: unbind<sdb1> md: export_rdev(sdb1) md/raid1:md0: active with 1 out of 2 mirrors Как убедиться не выключая, что это именно железо? В принципе, если менять диск, то хочу поменять диски на побольше, но тогда заодно надо бы по-другому переразбить, причём практически все разделы (как минимум 3 из 5). Буду признателен за подробный алгоритм. Ссылок про это есть много, но я не совсем понимаю, как делать grow последовательно для нескольких разделов. Компьютер во время этого процесса могу включить-выключить неограниченное раз так, что необязательно упираться в работу "по-горячему". -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 10:42 [Comm] Выпал диск из RAID1 Vladimir Karpinsky @ 2012-04-20 11:25 ` Michael Shigorin 2012-04-20 14:53 ` Vladimir Karpinsky 0 siblings, 1 reply; 11+ messages in thread From: Michael Shigorin @ 2012-04-20 11:25 UTC (permalink / raw) To: community On Fri, Apr 20, 2012 at 02:42:10PM +0400, Vladimir Karpinsky wrote: > Физически диск присутствует, во всяком случае fdisk про него > всё рассказывает, smartctl явных ошибок не даёт. Всё-таки настораживает, стоит прогнать smartctl -t long > # mdadm --re-add /dev/md0 /dev/sdb1 > mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible В dmesg подробностей нет часом? Что-то не помню такого. > Как убедиться не выключая, что это именно железо? Возможно, неконтакт по шлейфу ещё. > В принципе, если менять диск, то хочу поменять диски на > побольше, но тогда заодно надо бы по-другому переразбить, > причём практически все разделы (как минимум 3 из 5). Буду > признателен за подробный алгоритм. Ссылок про это есть много, > но я не совсем понимаю, как делать grow последовательно для > нескольких разделов. Компьютер во время этого процесса могу > включить-выключить неограниченное раз так, что необязательно > упираться в работу "по-горячему". Я бы при возможности отключил эти диски, засунул новые, стоя на rescue побил и собрал в массив как требуется, затем подключил исходные диски (которые окажутся каким-нить md127), посмотрел параметры ФС, сделал сообразно ФС на новых и синхронизировал, после чего chroot и установка загрузчика. Это не минимум даунтайма, а скорее минимум чего в голове держать: при сборке нового массива при загрузке со старого как минимум может понадобиться исправление /etc/fstab (/etc/mdadm.conf в любом разе стоит перепроверить либо просто перегенерировать при помощи mdadm --examine --scan). Если монтируется по UUID или LABEL, то у двух ФС после синхронизации по крайней мере LABEL может оказаться тем же (при клонировании дисков в случае нерасширения можно поймать ещё и неоднозначность UUID). -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 11:25 ` Michael Shigorin @ 2012-04-20 14:53 ` Vladimir Karpinsky 2012-04-20 20:32 ` Michael Shigorin 0 siblings, 1 reply; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-20 14:53 UTC (permalink / raw) To: community 20.04.2012 15:25, Michael Shigorin написал: > On Fri, Apr 20, 2012 at 02:42:10PM +0400, Vladimir Karpinsky wrote: >> Физически диск присутствует, во всяком случае fdisk про него >> всё рассказывает, smartctl явных ошибок не даёт. > > Всё-таки настораживает, стоит прогнать smartctl -t long > >> # mdadm --re-add /dev/md0 /dev/sdb1 >> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible > > В dmesg подробностей нет часом? Что-то не помню такого. Есть такое странное: ... [ 8.222185] md: sdb5 has different UUID to sdb2 [ 8.224684] md: sdb6 has different UUID to sdb2 [ 8.227172] md: sdb7 has different UUID to sdb2 [ 8.229636] md: md1 already running, cannot run sdb2 [ 8.232176] md: export_rdev(sdb2) [ 8.234735] md: considering sdb5 ... [ 8.237308] md: adding sdb5 ... [ 8.239828] md: sdb6 has different UUID to sdb5 [ 8.242385] md: sdb7 has different UUID to sdb5 [ 8.244898] md: md2 already running, cannot run sdb5 и т.п. Совсем не понимаю --- почему сравниваются UUID разных разделов, да и, вообще, причём здесь UUID... >> В принципе, если менять диск, то хочу поменять диски на >> побольше, но тогда заодно надо бы по-другому переразбить, >> причём практически все разделы (как минимум 3 из 5). Буду >> признателен за подробный алгоритм. Ссылок про это есть много, >> но я не совсем понимаю, как делать grow последовательно для >> нескольких разделов. Компьютер во время этого процесса могу >> включить-выключить неограниченное раз так, что необязательно >> упираться в работу "по-горячему". > > Я бы при возможности отключил эти диски, засунул новые, > стоя на rescue побил и собрал в массив как требуется, > затем подключил исходные диски (которые окажутся каким-нить > md127), посмотрел параметры ФС, сделал сообразно ФС на новых > и синхронизировал, после чего chroot и установка загрузчика. Пока не понял. Себе я представлял примерно так: 1. Пусть у меня уже есть новые диски, разбитые по-новому, для простоты с такими же ФС. 2. Загружаюсь с rescue/live, установив по одному диску из новой и старой пары. Копирую разделы один в один --- тут бы с ключами не промахнуться чтобы линки не попортились. 3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf. 4. Устанавливаю загрузчик на новый диск. 5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву. 6. Установка загрузчика на второй диск. > Это не минимум даунтайма, а скорее минимум чего в голове держать: Это для меня --- в голове и так не всё помещается ;-) -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 14:53 ` Vladimir Karpinsky @ 2012-04-20 20:32 ` Michael Shigorin 2012-04-20 20:58 ` Vladimir Karpinsky 0 siblings, 1 reply; 11+ messages in thread From: Michael Shigorin @ 2012-04-20 20:32 UTC (permalink / raw) To: community On Fri, Apr 20, 2012 at 06:53:55PM +0400, Vladimir Karpinsky wrote: > 1. Пусть у меня уже есть новые диски, разбитые по-новому, для > простоты с такими же ФС. Кстати, да -- так меньше мороки с fstab. Но если на старых ext3, а ядро не ниже 2.6.30 (лучше 2.6.32+) -- может быть сильно полезно для производительности под нагрузкой переехать заодно на ext4. Если неохота перегенерировать initrd, то корень можно оставить и на ext3. > 2. Загружаюсь с rescue/live, установив по одному диску из новой > и старой пары. Копирую разделы один в один --- тут бы с ключами > не промахнуться чтобы линки не попортились. Эээ... в смысле не разделы (dd), а ФС (rsync), так? Ключи -- rsync -PavHx /path/to/source/ /path/to/dest/; можно и cp -ax, но rsync заметно удобней (можно перезапустить, добавить --exclude и т.п.). Не забудьте trailing slashes. > 3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf. Проще пересканировать mdadm и проверить глазами. > 5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву. Можно и так, хотя я бы сразу собирал не-degraded array. И кстати, тогда уж по оказии сделал mdadm -G /dev/md? -b internal (см. man mdadm про write intent bitmaps; спасибо mrkooll@ за когдашнюю подсказку). > >Это не минимум даунтайма, а скорее минимум чего в голове держать: > Это для меня --- в голове и так не всё помещается ;-) Отчасти и для Вас, а вообще-то сам тоже порой так делаю :) -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 20:32 ` Michael Shigorin @ 2012-04-20 20:58 ` Vladimir Karpinsky 2012-04-20 22:41 ` Michael Shigorin 0 siblings, 1 reply; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-20 20:58 UTC (permalink / raw) To: community 21.04.2012 0:32, Michael Shigorin написал: > On Fri, Apr 20, 2012 at 06:53:55PM +0400, Vladimir Karpinsky wrote: >> 1. Пусть у меня уже есть новые диски, разбитые по-новому, для >> простоты с такими же ФС. > > Кстати, да -- так меньше мороки с fstab. Но если на старых ext3, > а ядро не ниже 2.6.30 (лучше 2.6.32+) -- может быть сильно > полезно для производительности под нагрузкой переехать заодно > на ext4. Если неохота перегенерировать initrd, то корень можно > оставить и на ext3. Ядро 3.0.17, нагрузка там небольшая, но имеет смысл. >> 2. Загружаюсь с rescue/live, установив по одному диску из новой >> и старой пары. Копирую разделы один в один --- тут бы с ключами >> не промахнуться чтобы линки не попортились. > > Эээ... в смысле не разделы (dd), а ФС (rsync), так? Я вообще-то имел ввиду cp, опять про rsync забыл. > Ключи -- rsync -PavHx /path/to/source/ /path/to/dest/; > можно и cp -ax, но rsync заметно удобней (можно перезапустить, > добавить --exclude и т.п.). Не забудьте trailing slashes. > >> 3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf. > > Проще пересканировать mdadm и проверить глазами. Я примерно это и имел ввиду. >> 5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву. > Можно и так, хотя я бы сразу собирал не-degraded array. > И кстати, тогда уж по оказии сделал mdadm -G /dev/md? -b internal > (см. man mdadm про write intent bitmaps; спасибо mrkooll@ за > когдашнюю подсказку). Почитаю... А что происходит с моим массивом совсем непонятно? Хотя бы на будущее... -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 20:58 ` Vladimir Karpinsky @ 2012-04-20 22:41 ` Michael Shigorin 2012-04-21 4:20 ` Vladimir Karpinsky 0 siblings, 1 reply; 11+ messages in thread From: Michael Shigorin @ 2012-04-20 22:41 UTC (permalink / raw) To: community On Sat, Apr 21, 2012 at 12:58:02AM +0400, Vladimir Karpinsky wrote: > А что происходит с моим массивом совсем непонятно? Хотя бы на будущее... Посмотрите вывод mdadm --examine /dev/sdb1, что там с суперблоком и есть ли он ещё вообще. >>> # mdadm --re-add /dev/md0 /dev/sdb1 >>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible --add аналогично? -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-20 22:41 ` Michael Shigorin @ 2012-04-21 4:20 ` Vladimir Karpinsky 2012-04-21 12:39 ` Michael Shigorin 0 siblings, 1 reply; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-21 4:20 UTC (permalink / raw) To: community 21.04.2012 2:41, Michael Shigorin написал: > On Sat, Apr 21, 2012 at 12:58:02AM +0400, Vladimir Karpinsky wrote: >> А что происходит с моим массивом совсем непонятно? Хотя бы на будущее... > > Посмотрите вывод mdadm --examine /dev/sdb1, что там с суперблоком > и есть ли он ещё вообще. # mdadm --examine /dev/sdb1 /dev/sdb1: Magic : a92b4efc Version : 0.90.00 UUID : 2b0784e0:d2c8b336:33a55beb:3bd231fc Creation Time : Wed Jan 27 17:09:36 2010 Raid Level : raid1 Used Dev Size : 955712 (933.47 MiB 978.65 MB) Array Size : 955712 (933.47 MiB 978.65 MB) Raid Devices : 2 Total Devices : 2 Preferred Minor : 0 Update Time : Sat Jan 28 10:04:01 2012 State : clean Active Devices : 2 Working Devices : 2 Failed Devices : 0 Spare Devices : 0 Checksum : b1058815 - correct Events : 538 Number Major Minor RaidDevice State this 1 8 17 1 active sync /dev/sdb1 0 0 8 1 0 active sync /dev/sda1 1 1 8 17 1 active sync /dev/sdb1 >>>> # mdadm --re-add /dev/md0 /dev/sdb1 >>>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible > > --add аналогично? Да. # mdadm --add /dev/md0 /dev/sdb1 mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a --re-add fails. mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-21 4:20 ` Vladimir Karpinsky @ 2012-04-21 12:39 ` Michael Shigorin 2012-04-21 18:02 ` Vladimir Karpinsky 0 siblings, 1 reply; 11+ messages in thread From: Michael Shigorin @ 2012-04-21 12:39 UTC (permalink / raw) To: community On Sat, Apr 21, 2012 at 08:20:46AM +0400, Vladimir Karpinsky wrote: > >>>>mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible > >--add аналогично? > Да. Не совсем. > # mdadm --add /dev/md0 /dev/sdb1 > mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a > --re-add fails. > mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. > mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. А, ну так сперва --remove его тогда. -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-21 12:39 ` Michael Shigorin @ 2012-04-21 18:02 ` Vladimir Karpinsky 2012-04-21 20:22 ` Michael Shigorin 0 siblings, 1 reply; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-21 18:02 UTC (permalink / raw) To: community 21.04.2012 16:39, Michael Shigorin написал: > On Sat, Apr 21, 2012 at 08:20:46AM +0400, Vladimir Karpinsky wrote: >>>>>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible >>> --add аналогично? >> Да. > > Не совсем. > >> # mdadm --add /dev/md0 /dev/sdb1 >> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a >> --re-add fails. >> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. >> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. > > А, ну так сперва --remove его тогда. # mdadm --remove /dev/md0 /dev/sdb1 mdadm: hot remove failed for /dev/sdb1: No such device or address # mdadm --add /dev/md0 /dev/sdb1 mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a --re-add fails. mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. В /var/log/meesages и dmesg за это время только: Apr 21 22:00:10 plkv kernel: [103627.887576] md: export_rdev(sdb1) -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-21 18:02 ` Vladimir Karpinsky @ 2012-04-21 20:22 ` Michael Shigorin 2012-04-22 4:18 ` Vladimir Karpinsky 0 siblings, 1 reply; 11+ messages in thread From: Michael Shigorin @ 2012-04-21 20:22 UTC (permalink / raw) To: community On Sat, Apr 21, 2012 at 10:02:26PM +0400, Vladimir Karpinsky wrote: > >А, ну так сперва --remove его тогда. > # mdadm --remove /dev/md0 /dev/sdb1 > mdadm: hot remove failed for /dev/sdb1: No such device or address Что сейчас в /proc/mdstat? > # mdadm --add /dev/md0 /dev/sdb1 > mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a > --re-add fails. > mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. > mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. А если действительно снести на нём суперблок и добавлять заново? -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 11+ messages in thread
* Re: [Comm] Выпал диск из RAID1 2012-04-21 20:22 ` Michael Shigorin @ 2012-04-22 4:18 ` Vladimir Karpinsky 0 siblings, 0 replies; 11+ messages in thread From: Vladimir Karpinsky @ 2012-04-22 4:18 UTC (permalink / raw) To: community 22.04.2012 0:22, Michael Shigorin написал: > On Sat, Apr 21, 2012 at 10:02:26PM +0400, Vladimir Karpinsky wrote: >>> А, ну так сперва --remove его тогда. >> # mdadm --remove /dev/md0 /dev/sdb1 >> mdadm: hot remove failed for /dev/sdb1: No such device or address > > Что сейчас в /proc/mdstat? То же: ... md0 : active raid1 sda1[0] 955712 blocks [2/1] [U_] ... >> # mdadm --add /dev/md0 /dev/sdb1 >> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a >> --re-add fails. >> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare. >> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first. > > А если действительно снести на нём суперблок и добавлять заново? А, ведь, после сноса суперблока действительно всё добавилось! А что могло быть причиной такого выпадения? -- С уважением, Владимир. ^ permalink raw reply [flat|nested] 11+ messages in thread
end of thread, other threads:[~2012-04-22 4:18 UTC | newest] Thread overview: 11+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2012-04-20 10:42 [Comm] Выпал диск из RAID1 Vladimir Karpinsky 2012-04-20 11:25 ` Michael Shigorin 2012-04-20 14:53 ` Vladimir Karpinsky 2012-04-20 20:32 ` Michael Shigorin 2012-04-20 20:58 ` Vladimir Karpinsky 2012-04-20 22:41 ` Michael Shigorin 2012-04-21 4:20 ` Vladimir Karpinsky 2012-04-21 12:39 ` Michael Shigorin 2012-04-21 18:02 ` Vladimir Karpinsky 2012-04-21 20:22 ` Michael Shigorin 2012-04-22 4:18 ` Vladimir Karpinsky
ALT Linux Community general discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 community community/ http://lore.altlinux.org/community \ mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com public-inbox-index community Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.community AGPL code for this site: git clone https://public-inbox.org/public-inbox.git