[Comm] Выпал диск из RAID1

ALT Linux Community general discussions
 help / color / mirror / Atom feed

* [Comm] Выпал  диск из RAID1
@ 2012-04-20 10:42 Vladimir Karpinsky
  2012-04-20 11:25 ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-20 10:42 UTC (permalink / raw)
  To: community

Здравствуйте!

Обнаружил, что 2-й диск выпал из массива:

# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sda2[0]
       4192896 blocks [2/1] [U_]

md2 : active raid1 sda5[0]
       10490304 blocks [2/1] [U_]

md3 : active raid1 sda6[0]
       13309696 blocks [2/1] [U_]

md4 : active raid1 sda7[0]
       11068672 blocks [2/1] [U_]

md0 : active raid1 sda1[0]
       955712 blocks [2/1] [U_]

Физически диск присутствует, во всяком случае fdisk про него всё 
рассказывает, smartctl явных ошибок не даёт. Пытаюсь
# mdadm --re-add /dev/md0 /dev/sdb1
mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible

После попытки остановки-запуска в логе:
md: kicking non-fresh sdb1 from array!
md: unbind<sdb1>
md: export_rdev(sdb1)
md/raid1:md0: active with 1 out of 2 mirrors

Как убедиться не выключая, что это именно железо?

В принципе, если менять диск, то хочу поменять диски на побольше, но тогда 
заодно надо бы по-другому переразбить, причём практически все разделы (как 
минимум 3 из 5). Буду признателен за подробный алгоритм. Ссылок про это 
есть много, но я не совсем понимаю, как делать grow последовательно для 
нескольких разделов. Компьютер во время этого процесса могу 
включить-выключить неограниченное раз так, что необязательно упираться в 
работу "по-горячему".

-- 
	С уважением,
		Владимир.

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 10:42 [Comm] Выпал диск из RAID1 Vladimir Karpinsky
@ 2012-04-20 11:25 ` Michael Shigorin
  2012-04-20 14:53   ` Vladimir Karpinsky
  0 siblings, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2012-04-20 11:25 UTC (permalink / raw)
  To: community

On Fri, Apr 20, 2012 at 02:42:10PM +0400, Vladimir Karpinsky wrote:
> Физически диск присутствует, во всяком случае fdisk про него
> всё рассказывает, smartctl явных ошибок не даёт.

Всё-таки настораживает, стоит прогнать smartctl -t long

> # mdadm --re-add /dev/md0 /dev/sdb1
> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible

В dmesg подробностей нет часом?  Что-то не помню такого.

> Как убедиться не выключая, что это именно железо?

Возможно, неконтакт по шлейфу ещё.

> В принципе, если менять диск, то хочу поменять диски на
> побольше, но тогда заодно надо бы по-другому переразбить,
> причём практически все разделы (как минимум 3 из 5). Буду
> признателен за подробный алгоритм. Ссылок про это есть много,
> но я не совсем понимаю, как делать grow последовательно для
> нескольких разделов. Компьютер во время этого процесса могу
> включить-выключить неограниченное раз так, что необязательно
> упираться в работу "по-горячему".

Я бы при возможности отключил эти диски, засунул новые,
стоя на rescue побил и собрал в массив как требуется,
затем подключил исходные диски (которые окажутся каким-нить
md127), посмотрел параметры ФС, сделал сообразно ФС на новых
и синхронизировал, после чего chroot и установка загрузчика.

Это не минимум даунтайма, а скорее минимум чего в голове держать:
при сборке нового массива при загрузке со старого как минимум
может понадобиться исправление /etc/fstab (/etc/mdadm.conf
в любом разе стоит перепроверить либо просто перегенерировать
при помощи mdadm --examine --scan).  Если монтируется по UUID
или LABEL, то у двух ФС после синхронизации по крайней мере
LABEL может оказаться тем же (при клонировании дисков в случае
нерасширения можно поймать ещё и неоднозначность UUID).

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 11:25 ` Michael Shigorin
@ 2012-04-20 14:53   ` Vladimir Karpinsky
  2012-04-20 20:32     ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-20 14:53 UTC (permalink / raw)
  To: community

20.04.2012 15:25, Michael Shigorin написал:
> On Fri, Apr 20, 2012 at 02:42:10PM +0400, Vladimir Karpinsky wrote:
>> Физически диск присутствует, во всяком случае fdisk про него
>> всё рассказывает, smartctl явных ошибок не даёт.
>
> Всё-таки настораживает, стоит прогнать smartctl -t long
>
>> # mdadm --re-add /dev/md0 /dev/sdb1
>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible
>
> В dmesg подробностей нет часом?  Что-то не помню такого.

Есть такое странное:
...
[    8.222185] md: sdb5 has different UUID to sdb2
[    8.224684] md: sdb6 has different UUID to sdb2
[    8.227172] md: sdb7 has different UUID to sdb2
[    8.229636] md: md1 already running, cannot run sdb2
[    8.232176] md: export_rdev(sdb2)
[    8.234735] md: considering sdb5 ...
[    8.237308] md:  adding sdb5 ...
[    8.239828] md: sdb6 has different UUID to sdb5
[    8.242385] md: sdb7 has different UUID to sdb5
[    8.244898] md: md2 already running, cannot run sdb5
и т.п.

Совсем не понимаю --- почему сравниваются UUID разных разделов, да и, 
вообще, причём здесь UUID...

>> В принципе, если менять диск, то хочу поменять диски на
>> побольше, но тогда заодно надо бы по-другому переразбить,
>> причём практически все разделы (как минимум 3 из 5). Буду
>> признателен за подробный алгоритм. Ссылок про это есть много,
>> но я не совсем понимаю, как делать grow последовательно для
>> нескольких разделов. Компьютер во время этого процесса могу
>> включить-выключить неограниченное раз так, что необязательно
>> упираться в работу "по-горячему".
>
> Я бы при возможности отключил эти диски, засунул новые,
> стоя на rescue побил и собрал в массив как требуется,
> затем подключил исходные диски (которые окажутся каким-нить
> md127), посмотрел параметры ФС, сделал сообразно ФС на новых
> и синхронизировал, после чего chroot и установка загрузчика.

Пока не понял. Себе я представлял примерно так:

1. Пусть у меня уже есть новые диски, разбитые по-новому, для простоты с 
такими же ФС.

2. Загружаюсь с rescue/live, установив по одному диску из новой и старой 
пары. Копирую разделы один в один --- тут бы с ключами не промахнуться 
чтобы линки не попортились.

3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf.

4. Устанавливаю загрузчик на новый диск.

5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву.

6. Установка загрузчика на второй диск.

> Это не минимум даунтайма, а скорее минимум чего в голове держать:

Это для меня --- в голове и так не всё помещается ;-)

-- 
	С уважением,
		Владимир.

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 14:53   ` Vladimir Karpinsky
@ 2012-04-20 20:32     ` Michael Shigorin
  2012-04-20 20:58       ` Vladimir Karpinsky
  0 siblings, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2012-04-20 20:32 UTC (permalink / raw)
  To: community

On Fri, Apr 20, 2012 at 06:53:55PM +0400, Vladimir Karpinsky wrote:
> 1. Пусть у меня уже есть новые диски, разбитые по-новому, для
> простоты с такими же ФС.

Кстати, да -- так меньше мороки с fstab.  Но если на старых ext3,
а ядро не ниже 2.6.30 (лучше 2.6.32+) -- может быть сильно
полезно для производительности под нагрузкой переехать заодно
на ext4.  Если неохота перегенерировать initrd, то корень можно
оставить и на ext3.

> 2. Загружаюсь с rescue/live, установив по одному диску из новой
> и старой пары. Копирую разделы один в один --- тут бы с ключами
> не промахнуться чтобы линки не попортились.

Эээ... в смысле не разделы (dd), а ФС (rsync), так?

Ключи -- rsync -PavHx /path/to/source/ /path/to/dest/;
можно и cp -ax, но rsync заметно удобней (можно перезапустить,
добавить --exclude и т.п.).  Не забудьте trailing slashes.

> 3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf.

Проще пересканировать mdadm и проверить глазами.

> 5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву.

Можно и так, хотя я бы сразу собирал не-degraded array.
И кстати, тогда уж по оказии сделал mdadm -G /dev/md? -b internal
(см. man mdadm про write intent bitmaps; спасибо mrkooll@ за
когдашнюю подсказку).

> >Это не минимум даунтайма, а скорее минимум чего в голове держать:
> Это для меня --- в голове и так не всё помещается ;-)

Отчасти и для Вас, а вообще-то сам тоже порой так делаю :)

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 20:32     ` Michael Shigorin
@ 2012-04-20 20:58       ` Vladimir Karpinsky
  2012-04-20 22:41         ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-20 20:58 UTC (permalink / raw)
  To: community

21.04.2012 0:32, Michael Shigorin написал:
> On Fri, Apr 20, 2012 at 06:53:55PM +0400, Vladimir Karpinsky wrote:
>> 1. Пусть у меня уже есть новые диски, разбитые по-новому, для
>> простоты с такими же ФС.
>
> Кстати, да -- так меньше мороки с fstab.  Но если на старых ext3,
> а ядро не ниже 2.6.30 (лучше 2.6.32+) -- может быть сильно
> полезно для производительности под нагрузкой переехать заодно
> на ext4.  Если неохота перегенерировать initrd, то корень можно
> оставить и на ext3.

Ядро 3.0.17, нагрузка там небольшая, но имеет смысл.

>> 2. Загружаюсь с rescue/live, установив по одному диску из новой
>> и старой пары. Копирую разделы один в один --- тут бы с ключами
>> не промахнуться чтобы линки не попортились.
>
> Эээ... в смысле не разделы (dd), а ФС (rsync), так?

Я вообще-то имел ввиду cp, опять про rsync забыл.

> Ключи -- rsync -PavHx /path/to/source/ /path/to/dest/;
> можно и cp -ax, но rsync заметно удобней (можно перезапустить,
> добавить --exclude и т.п.).  Не забудьте trailing slashes.
>
>> 3. chroot на новый диск. Правлю UUID в /etc/mdadm.conf.
>
> Проще пересканировать mdadm и проверить глазами.

Я примерно это и имел ввиду.

>> 5. Перегружаюсь с обоими новыми дисками и добавляю sdb? к массиву.

> Можно и так, хотя я бы сразу собирал не-degraded array.
> И кстати, тогда уж по оказии сделал mdadm -G /dev/md? -b internal
> (см. man mdadm про write intent bitmaps; спасибо mrkooll@ за
> когдашнюю подсказку).

Почитаю...

А что происходит с моим массивом совсем непонятно? Хотя бы на будущее...

-- 
	С уважением,
		Владимир.


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 20:58       ` Vladimir Karpinsky
@ 2012-04-20 22:41         ` Michael Shigorin
  2012-04-21  4:20           ` Vladimir Karpinsky
  0 siblings, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2012-04-20 22:41 UTC (permalink / raw)
  To: community

On Sat, Apr 21, 2012 at 12:58:02AM +0400, Vladimir Karpinsky wrote:
> А что происходит с моим массивом совсем непонятно? Хотя бы на будущее...

Посмотрите вывод mdadm --examine /dev/sdb1, что там с суперблоком
и есть ли он ещё вообще.

>>> # mdadm --re-add /dev/md0 /dev/sdb1
>>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible

--add аналогично?

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-20 22:41         ` Michael Shigorin
@ 2012-04-21  4:20           ` Vladimir Karpinsky
  2012-04-21 12:39             ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-21  4:20 UTC (permalink / raw)
  To: community

21.04.2012 2:41, Michael Shigorin написал:
> On Sat, Apr 21, 2012 at 12:58:02AM +0400, Vladimir Karpinsky wrote:
>> А что происходит с моим массивом совсем непонятно? Хотя бы на будущее...
>
> Посмотрите вывод mdadm --examine /dev/sdb1, что там с суперблоком
> и есть ли он ещё вообще.

# mdadm --examine /dev/sdb1
/dev/sdb1:
           Magic : a92b4efc
         Version : 0.90.00
            UUID : 2b0784e0:d2c8b336:33a55beb:3bd231fc
   Creation Time : Wed Jan 27 17:09:36 2010
      Raid Level : raid1
   Used Dev Size : 955712 (933.47 MiB 978.65 MB)
      Array Size : 955712 (933.47 MiB 978.65 MB)
    Raid Devices : 2
   Total Devices : 2
Preferred Minor : 0

     Update Time : Sat Jan 28 10:04:01 2012
           State : clean
  Active Devices : 2
Working Devices : 2
  Failed Devices : 0
   Spare Devices : 0
        Checksum : b1058815 - correct
          Events : 538


       Number   Major   Minor   RaidDevice State
this     1       8       17        1      active sync   /dev/sdb1

    0     0       8        1        0      active sync   /dev/sda1
    1     1       8       17        1      active sync   /dev/sdb1


>>>> # mdadm --re-add /dev/md0 /dev/sdb1
>>>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible
>
> --add аналогично?

Да.

# mdadm --add /dev/md0 /dev/sdb1
mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a 
--re-add fails.
mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.

-- 
	С уважением,
		Владимир.


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-21  4:20           ` Vladimir Karpinsky
@ 2012-04-21 12:39             ` Michael Shigorin
  2012-04-21 18:02               ` Vladimir Karpinsky
  0 siblings, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2012-04-21 12:39 UTC (permalink / raw)
  To: community

On Sat, Apr 21, 2012 at 08:20:46AM +0400, Vladimir Karpinsky wrote:
> >>>>mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible
> >--add аналогично?
> Да.

Не совсем.

> # mdadm --add /dev/md0 /dev/sdb1
> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a 
> --re-add fails.
> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.

А, ну так сперва --remove его тогда.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-21 12:39             ` Michael Shigorin
@ 2012-04-21 18:02               ` Vladimir Karpinsky
  2012-04-21 20:22                 ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-21 18:02 UTC (permalink / raw)
  To: community



21.04.2012 16:39, Michael Shigorin написал:
> On Sat, Apr 21, 2012 at 08:20:46AM +0400, Vladimir Karpinsky wrote:
>>>>>> mdadm: --re-add for /dev/sdb1 to /dev/md0 is not possible
>>> --add аналогично?
>> Да.
>
> Не совсем.
>
>> # mdadm --add /dev/md0 /dev/sdb1
>> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a
>> --re-add fails.
>> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
>> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.
>
> А, ну так сперва --remove его тогда.

# mdadm --remove /dev/md0 /dev/sdb1
mdadm: hot remove failed for /dev/sdb1: No such device or address
# mdadm --add /dev/md0 /dev/sdb1
mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a 
--re-add fails.
mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.

В /var/log/meesages и dmesg за это время только:

Apr 21 22:00:10 plkv kernel: [103627.887576] md: export_rdev(sdb1)

-- 
	С уважением,
		Владимир.


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-21 18:02               ` Vladimir Karpinsky
@ 2012-04-21 20:22                 ` Michael Shigorin
  2012-04-22  4:18                   ` Vladimir Karpinsky
  0 siblings, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2012-04-21 20:22 UTC (permalink / raw)
  To: community

On Sat, Apr 21, 2012 at 10:02:26PM +0400, Vladimir Karpinsky wrote:
> >А, ну так сперва --remove его тогда.
> # mdadm --remove /dev/md0 /dev/sdb1
> mdadm: hot remove failed for /dev/sdb1: No such device or address

Что сейчас в /proc/mdstat?

> # mdadm --add /dev/md0 /dev/sdb1
> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a 
> --re-add fails.
> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.

А если действительно снести на нём суперблок и добавлять заново?

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [Comm] Выпал диск из RAID1
  2012-04-21 20:22                 ` Michael Shigorin
@ 2012-04-22  4:18                   ` Vladimir Karpinsky
  0 siblings, 0 replies; 11+ messages in thread
From: Vladimir Karpinsky @ 2012-04-22  4:18 UTC (permalink / raw)
  To: community

22.04.2012 0:22, Michael Shigorin написал:
> On Sat, Apr 21, 2012 at 10:02:26PM +0400, Vladimir Karpinsky wrote:
>>> А, ну так сперва --remove его тогда.
>> # mdadm --remove /dev/md0 /dev/sdb1
>> mdadm: hot remove failed for /dev/sdb1: No such device or address
>
> Что сейчас в /proc/mdstat?

То же:

...
md0 : active raid1 sda1[0]
       955712 blocks [2/1] [U_]
...

>> # mdadm --add /dev/md0 /dev/sdb1
>> mdadm: /dev/sdb1 reports being an active member for /dev/md0, but a
>> --re-add fails.
>> mdadm: not performing --add as that would convert /dev/sdb1 in to a spare.
>> mdadm: To make this a spare, use "mdadm --zero-superblock /dev/sdb1" first.
>
> А если действительно снести на нём суперблок и добавлять заново?

А, ведь, после сноса суперблока действительно всё добавилось! А что могло 
быть причиной такого выпадения?

-- 
	С уважением,
		Владимир.


^ permalink raw reply	[flat|nested] 11+ messages in thread

end of thread, other threads:[~2012-04-22  4:18 UTC | newest]

Thread overview: 11+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2012-04-20 10:42 [Comm] Выпал диск из RAID1 Vladimir Karpinsky
2012-04-20 11:25 ` Michael Shigorin
2012-04-20 14:53   ` Vladimir Karpinsky
2012-04-20 20:32     ` Michael Shigorin
2012-04-20 20:58       ` Vladimir Karpinsky
2012-04-20 22:41         ` Michael Shigorin
2012-04-21  4:20           ` Vladimir Karpinsky
2012-04-21 12:39             ` Michael Shigorin
2012-04-21 18:02               ` Vladimir Karpinsky
2012-04-21 20:22                 ` Michael Shigorin
2012-04-22  4:18                   ` Vladimir Karpinsky

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git