mam RAID10 zo 4 diskov a jeden spare, do styroch dni sa vzdy rozpadne a netusim preco v logu o tom neni ani zmienka, takze po restarte nabehne len iniframs kde musim disky popripdavat naspat do md1 a po resync, to opat bezi... rozpadne sa mi vzdy md1 a md3, md2 je swap ten je v pohode ale na to sa ani nic nezapisuje, pamate je dost... a md0 je RAID1 ten je tiez v pohode...
ked som skusil pozret md1 s prikazom fsck a prepinacom -n len aby som videl co sa deje vypise mi to toto
fsck -n /dev/md1 fsck from util-linux-ng 2.17.2 e2fsck 1.41.12 (17-May-2010) Varování! /dev/md1 je připojen. Varování: přeskakuji obnovu žurnálu, protože provádím kontrolu systému souborů jen pro čtení. /dev/md1 obsahuje systém souborů s chybami, kontrola vynucena. Průchod 1: Kontroluji iuzly, bloky a velikosti Průchod 2: Kontroluji strukturu adresářů Průchod 3: Kontroluji dosažitelnost adresářů Průchod 4: Kontroluji počty odkazů Průchod 5: Kontroluji souhrnné informace skupin Počet volných bloků špatně (578842, spočteno=578197). Opravit? ne Počet volných iuzlů špatně (571345, spočteno=571278). Opravit? ne /dev/md1: ********** VAROVÁNÍ: Systém souborů má stále chyby ********** /dev/md1: 39455/610800 souborů (1,6 % nesouvislých), 1862982/2441824 bloků
1. Myslite ze mozem ten fsck /dev/md1 pustit natvrdo a nerzdrbem si pole?
2. v logu mam este taketo hlasky
Nov 25 22:31:19 XEN mdadm[1715]: SpareActive event detected on md device /dev/md3, component device /dev/sdb4 Nov 25 22:31:19 XEN mdadm[1715]: SpareActive event detected on md device /dev/md3, component device /dev/sdd4
Inak, ked budes spustat kontrolu len na citani a nie aj na opravu, tak to nikdy neopravis. Otazkou je ako dolezite data tam boli.
Linux IN-XEN2 2.6.32-5-xen-amd64 #1 SMP Wed Oct 20 02:22:18 UTC 2010 x86_64 GNU/Linux
moze tam byt nejaky bug s RAID10 ?
Inak, jak si to prosim Ta vytvaral, ako seriu 2x raid1 a nad tym stripe alebo rovno raid10?
v logu cat /var/log/xen/xend-debug.log potom som skontroloval virtualne masiny a zisitil som ze som priradil virtualnym masinam dokopy 18 threadov, lenze ja ich mam len 16... nemoze to mat suvis?
fdisk -l /dev/md1
tak mi to hlasi toto:
Predpokladam ze si ides teraz skontrolovat zivotnosti diskov cez SMART a urobis ten RAID znova aj s instalaciou. Uzivatelske data by nemali byt dotknute pokial su na inych fyzickych diskoch.
PS.: s tym fdisk-om si myslel co? To som nepochopil.
akoze myslis ze mam ten RAID zle nastaveny?
ved som ho vytvaral priamo v instalacnom procese, co sa tyka smartu to mam pozrete, disky su okej... inak su to vsetko nove disky maju tak mesiac co som ich doniesol z obchodu...
s tym fdiskom to je ok, zistil som ze tam ma vypisovat tu vetu
Disk /dev/md1 doesn't contain a valid partition table
a tie data su na tych istych diskoch len na inej partici md3...
RAID1 md0 /boot
RAID10 md1 /
RAID10 swap
RAID10 md3 - na tom mi bez lvm2 a az tu som povytvaral particie pre XEN masiny
A podla toho ze Ti vypadol len jeden disk a cele to lahlo do kytek, tak podla toho je cast zrkadla zle nastavena. Velmi zle.
Teda, pokial to nebolo v niecom inom. Aky je stav tych RAIDov?
md3 : active raid10 sda4[0] sde4[4](S) sdd4[3] sdb4[2] sdc4[1]
1237534976 blocks 64K chunks 2 near-copies [4/4] [UUUU]
md2 : active (auto-read-only) raid10 sda3[0] sde3[4](S) sdd3[3] sdb3[2] sdc3[1]
995840 blocks 64K chunks 2 near-copies [4/4] [UUUU]
md1 : active raid10 sdc2[0] sda2[4](S) sdd2[3] sdb2[2] sde2[1]
9767296 blocks 64K chunks 2 near-copies [4/4] [UUUU]
md0 : active raid1 sdd1[0] sde1[2](S) sdc1[3](S) sda1[4](S) sdb1[1]
979840 blocks [2/2] [UU]
a ono ked to vypadne tak v md1 je stav napriklad takyto [_U__] a v md3 napriklad takyto [__U_] a disky su oznacene ako F, md1 aj md2 je tympadom nefunkcne, takze to zrestartujem a nahodim disky naspat do pola, tie sa zosynchronizuju vsetko funguje tak ako ma...
... md1 aj md3 je tympadom nefunkcne ...
Ale jedno mi nie je jasne. Ak to funguje ako ma, tak kde je problem?
tak ma napadlo, ci to to rozbijanie pola nemoze mat suvis s tym, ze celkovy pocet jadier CPU mam 16, ja som vsak virtualnym strojom omylom nadelil 18(neviem pocitat)...
teraz som nadelil virtualnym strojom 14 CPU jadier a ak mi to zase padne tak tam dam vsade RAID1 a basta, mozno zato jebe tomu RAIDu ze tam mam DEBIAN SQUEZE 2.6.32-5-xen-amd64 #1 SMP Sat Oct 30 17:04:10 UTC 2010 x86_64 GNU/Linux a mozno je v nom este daky bug alebo co
SEASONIC 750 X-750(SS-750KM) 80 Plus Gold
dufam ze som nevybral cocotinu
[52247.938473] EXT3-fs: write access uavailable, cannot procced.
alebo
end_request: I/O error on device sda, sector 11727442
Buffer I/O error on device sda2, logical block 1220939
kazdopadne data mam uz zazalohovane a idem to cele drbnut iba na RAID1
inak ked sa nad tym tak zamyslim tak tam kde to je umiestnene je dost teplo... ale teplota diskov mi ukazovala cca 38-40 stupnov coz je normal, sem tam to pokolisalo o stupen, dva hore dole... zase na pamataiach tam mohlo byt celkom teplo, kolko stupnov znesu pamate?
Inak, skôr sa natíska otázka, ako rýchlo sa prehreje napríklad CPU a akú má celkovú spotrebu ten stroj. Ale, neviem že by tá otázka ešte niekoho zaujímala.
este ma napada ze zdroj ale ta 750ka musi v pohode utiahnut dva XEONy a 5 diskov ine tam neni nic co by mohlo zrat...