Primar: Jupp, korrekt
Sekundär: warte lieber mal 1-2d ob wirklich nichts kommt
Interessant ware noch ob bei eingeschaltetem ALPM auch bei dir der SATA link von 6 aif 1.5hb/s Abfälle.
Wenn ja dann haben die wds ein Problem
Primar: Jupp, korrekt
Sekundär: warte lieber mal 1-2d ob wirklich nichts kommt
Interessant ware noch ob bei eingeschaltetem ALPM auch bei dir der SATA link von 6 aif 1.5hb/s Abfälle.
Wenn ja dann haben die wds ein Problem
Ich werde noch mal schreiben falls sich was ändert. Danke für deine HIlfe!!
Ich kann jetzt wirklich nicht sagen wie lange das schon ist, ich habe nie darauf geachtet da mir der S.M.A.R.T. selftest immer ein PASSED gab.
Und dieser Test wird selbst bei praktisch Herztoten Festplatten noch ein PASSED anzeigen.
Spin up time ist ein "echtes" Problem wenn der wert immer schlechter wird.
Das würde ich jetzt mal darauf schieben dass die Festplatten in den Ruhezustand fahren und wieder anlaufen.
Gruß
David
Wie gesagt ich habe jetzt APM deaktiviert so das die Platten immer laufen. Und ALPM in powertop deaktiviert.
Keinerlei Fehlermeldungen bis jetzt...
Aber warum tritt der Fehler auf sobald ALPM an ist?
Wie gesagt ich habe jetzt APM deaktiviert so das die Platten immer laufen. Und ALPM in powertop deaktiviert.
Keinerlei Fehlermeldungen bis jetzt...
Aber warum tritt der Fehler auf sobald ALPM an ist?
Weil die WD REDs mit Linux ALPM in dem Setting min_power nicht kompatibel sind.
Bei medium power hatte ich auch keine Fehler mehr - bei mir waren ALPM Fehler entweder ABRT Errors oder ATA Links resets .
Ich hatte bei WD einen Fall eröffnet aber die hatten mich nicht verstanden - werden die Platten nicht erkannt ? Ach Sie werden erkannt, ja dann ist ja alles gut - WTF !!!?!?
Und wie setzt du ALPM auf medium_power?
Man kann mit powertop top ein HTML erstellen wo die commandos stehen die powertop beim aktivieren von Einstellungen setzt. Dann kam man die zB in die RC.local eintragen dass die bei jedem biiten geladen werden ohne powertop selbst manuell auszuführen.
Man muss da dann nur min durch medium ersetzen.
Achso joa das hatte ich ja zuvor gemacht....Ich hatte übersehen das da schon min_power steht....sorry!
Hmm jetzt habe ich schon wieder 2 Fehler mit ALPM auf medium_power
Device: /dev/disk/by-id/scsi-SATA_SAMSUNG_HD103SJS246J9BB232181 [SAT], 1 Currently unreadable (pending) sectors
Device: /dev/disk/by-id/wwn-0x50024e9204a0348d [SAT], 1 Currently unreadable (pending) sectors
EDIT: Ich werde jetzt ALPM komplett ausschalten und dann nochmal abwarten...
Mach das.
Es ist aber diesmal ein anderer Fehler:
vorher: ABRT = Abort Error - kann alles mögliche sein. Das kann vom System kommen wenn bei min_power die HDD nicht schnell genug anwortet und der SATA Link nicht schnell aufgebaut wird
diesmal: pending sector - nicht lesbarer Sector auf der HDD der Fehler wird von der HDD selber ausgegeben. Schau mal in die SMART info der entsprechenden HDD ob da wirklich 1 Sector auf pending steht.
Jep, 1 Sector ist wirklich auch Pending
EDIT: Jetzt sind es auf der Platte 2 Sector Pending.
Außerdem schreibt er nach einem neustart wieder ATA error count.
Jan 31 14:47:50 server smartd[3110]: Device: /dev/disk/by-id/wwn-0x50014ee25fd40306 [SAT], ATA error count increased from 32 to 33
Jan 31 14:47:50 server smartd[3110]: Device: /dev/disk/by-id/wwn-0x50014ee2091f2d63 [SAT], ATA error count increased from 27 to 28
Jan 31 14:47:51 server smartd[3110]: Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4EN39HYFH [SAT], ATA error count increased from 32 to 33
Jan 31 14:47:51 server smartd[3110]: Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4E0291590 [SAT], ATA error count increased from 27 to 28
Bekomme aber jetzt im Moment keine Mail
Da kann doch irgendwas anderes nicht stimmen, es kann doch unmöglich sein das alle platten einen ATA error bekommen...
Ok dann ist das ein HDD eigener Fehler der mit dem ALPM nicht i Verbindung stehen kann.
edit:
Poste mal die komplette SMART info der HDD
Ok dann ist das ein HDD eigener Fehler der mit dem ALPM nicht i Verbindung stehen kann.
Also wenn nur die System Platte betroffen ist, ist mir das egal, dann kommt halt ne SSD rein. Aber wie steht es um meine Daten Platten? gibt es ausfürhliche Test um herrauszufinden ob alles ok ist?
Ist der Fehler denn bisher nur auf der System Platte aufgetreten ?
Du kannst Dir nur die SMART Werte ansehen und hin und wieder einen Long-Self-Test machen. Mehr geht nicht.
Die Read Error kommen anscheinend nur auf der System Platte, die ATA Error Counts kommen aber auf allen Platten.
Hier mal die Attribute:
Die letzte Platte ist die System Platte. Da werden die Raw_Read_Error_Rate immer mehr.
Ok
Also die ATA Erros waren all auf den WD REDs - das passt ja.
Kann gut sein dass System HDD bald kaputt Geht - Sectoren, Spin Up Time und red error rate werden schlechter.
Ok
Also die ATA Erros waren all auf den WD REDs - das passt ja.
Kann gut sein dass System HDD bald kaputt Geht - Sectoren, Spin Up Time und red error rate werden schlechter.
Ok alles klar! Danke dir!
Ich werde übernacht mal einen Long-Test auf den Datenplatten laufen lassen. Wie gesagt, die System Platte ist alt und mir völlig egal.
Hier der Read Error:
Jan 31 15:00:06 server kernel: [ 765.110625] ata2.00: exception Emask 0x0 SAct 0xf800 SErr 0x0 action 0x0
Jan 31 15:00:06 server kernel: [ 765.110675] ata2.00: irq_stat 0x40000008
Jan 31 15:00:06 server kernel: [ 765.110700] ata2.00: failed command: READ FPDMA QUEUED
Jan 31 15:00:06 server kernel: [ 765.110733] ata2.00: cmd 60/08:58:d0:14:04/00:00:60:00:00/40 tag 11 ncq 4096 in
Jan 31 15:00:06 server kernel: [ 765.110733] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F>
Jan 31 15:00:06 server kernel: [ 765.110826] ata2.00: status: { DRDY ERR }
Jan 31 15:00:06 server kernel: [ 765.110850] ata2.00: error: { UNC }
Jan 31 15:00:06 server kernel: [ 765.122554] ata2.00: configured for UDMA/133
Jan 31 15:00:06 server kernel: [ 765.122564] sd 1:0:0:0: [sda] Unhandled sense code
Jan 31 15:00:06 server kernel: [ 765.122565] sd 1:0:0:0: [sda]
Jan 31 15:00:06 server kernel: [ 765.122566] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jan 31 15:00:06 server kernel: [ 765.122567] sd 1:0:0:0: [sda]
Jan 31 15:00:06 server kernel: [ 765.122567] Sense Key : Medium Error [current] [descriptor]
Jan 31 15:00:06 server kernel: [ 765.122569] Descriptor sense data with sense descriptors (in hex):
Jan 31 15:00:06 server kernel: [ 765.122570] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Jan 31 15:00:06 server kernel: [ 765.122573] 60 04 14 d5
Jan 31 15:00:06 server kernel: [ 765.122575] sd 1:0:0:0: [sda]
Jan 31 15:00:06 server kernel: [ 765.122576] Add. Sense: Unrecovered read error - auto reallocate failed
Jan 31 15:00:06 server kernel: [ 765.122577] sd 1:0:0:0: [sda] CDB:
Jan 31 15:00:06 server kernel: [ 765.122578] Read(10): 28 00 60 04 14 d0 00 00 08 00
Jan 31 15:00:06 server kernel: [ 765.122581] end_request: I/O error, dev sda, sector 1610880213
Jan 31 15:00:06 server kernel: [ 765.122637] ata2: EH complete
Jan 31 15:00:09 server kernel: [ 767.515431] ata2.00: exception Emask 0x0 SAct 0x180000 SErr 0x0 action 0x0
Jan 31 15:00:09 server kernel: [ 767.515479] ata2.00: irq_stat 0x40000008
Jan 31 15:00:09 server kernel: [ 767.515505] ata2.00: failed command: READ FPDMA QUEUED
Jan 31 15:00:09 server kernel: [ 767.515538] ata2.00: cmd 60/08:a0:d0:14:04/00:00:60:00:00/40 tag 20 ncq 4096 in
Jan 31 15:00:09 server kernel: [ 767.515538] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F>
Jan 31 15:00:09 server kernel: [ 767.515631] ata2.00: status: { DRDY ERR }
Jan 31 15:00:09 server kernel: [ 767.515655] ata2.00: error: { UNC }
Jan 31 15:00:09 server kernel: [ 767.527423] ata2.00: configured for UDMA/133
Jan 31 15:00:09 server kernel: [ 767.527437] sd 1:0:0:0: [sda] Unhandled sense code
Jan 31 15:00:09 server kernel: [ 767.527439] sd 1:0:0:0: [sda]
Jan 31 15:00:09 server kernel: [ 767.527439] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jan 31 15:00:09 server kernel: [ 767.527440] sd 1:0:0:0: [sda]
Jan 31 15:00:09 server kernel: [ 767.527441] Sense Key : Medium Error [current] [descriptor]
Jan 31 15:00:09 server kernel: [ 767.527443] Descriptor sense data with sense descriptors (in hex):
Jan 31 15:00:09 server kernel: [ 767.527443] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Jan 31 15:00:09 server kernel: [ 767.527447] 60 04 14 d5
Jan 31 15:00:09 server kernel: [ 767.527449] sd 1:0:0:0: [sda]
Jan 31 15:00:09 server kernel: [ 767.527450] Add. Sense: Unrecovered read error - auto reallocate failed
Jan 31 15:00:09 server kernel: [ 767.527451] sd 1:0:0:0: [sda] CDB:
Jan 31 15:00:09 server kernel: [ 767.527452] Read(10): 28 00 60 04 14 d0 00 00 08 00
Jan 31 15:00:09 server kernel: [ 767.527455] end_request: I/O error, dev sda, sector 1610880213
Jan 31 15:00:09 server kernel: [ 767.527510] ata2: EH complete
Jan 31 15:03:33 server kernel: [ 971.862407] EXT4-fs (sdc1): mounted filesystem with ordered data mode. Opts: acl,user_xattr,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0
Jan 31 15:09:01 server /USR/SBIN/CRON[8223]: (root) CMD ( [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime))
Jan 31 15:15:01 server /USR/SBIN/CRON[8670]: (root) CMD (/usr/sbin/omv-mkgraph >/dev/null 2>&1)
Jan 31 15:15:01 server rrdcached[2348]: Received FLUSHALL
Jan 31 15:15:03 server kernel: [ 1661.730574] ata2.00: exception Emask 0x0 SAct 0x2000000 SErr 0x0 action 0x0
Jan 31 15:15:03 server kernel: [ 1661.730624] ata2.00: irq_stat 0x40000008
Jan 31 15:15:03 server kernel: [ 1661.730651] ata2.00: failed command: READ FPDMA QUEUED
Jan 31 15:15:03 server kernel: [ 1661.730687] ata2.00: cmd 60/08:c8:d0:14:04/00:00:60:00:00/40 tag 25 ncq 4096 in
Jan 31 15:15:03 server kernel: [ 1661.730687] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F>
Jan 31 15:15:03 server kernel: [ 1661.730784] ata2.00: status: { DRDY ERR }
Jan 31 15:15:03 server kernel: [ 1661.730810] ata2.00: error: { UNC }
Jan 31 15:15:03 server kernel: [ 1661.742333] ata2.00: configured for UDMA/133
Jan 31 15:15:03 server kernel: [ 1661.742342] sd 1:0:0:0: [sda] Unhandled sense code
Jan 31 15:15:03 server kernel: [ 1661.742343] sd 1:0:0:0: [sda]
Jan 31 15:15:03 server kernel: [ 1661.742344] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jan 31 15:15:03 server kernel: [ 1661.742345] sd 1:0:0:0: [sda]
Jan 31 15:15:03 server kernel: [ 1661.742346] Sense Key : Medium Error [current] [descriptor]
Jan 31 15:15:03 server kernel: [ 1661.742347] Descriptor sense data with sense descriptors (in hex):
Jan 31 15:15:03 server kernel: [ 1661.742348] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Jan 31 15:15:03 server kernel: [ 1661.742352] 60 04 14 d5
Jan 31 15:15:03 server kernel: [ 1661.742353] sd 1:0:0:0: [sda]
Jan 31 15:15:03 server kernel: [ 1661.742355] Add. Sense: Unrecovered read error - auto reallocate failed
Jan 31 15:15:03 server kernel: [ 1661.742356] sd 1:0:0:0: [sda] CDB:
Jan 31 15:15:03 server kernel: [ 1661.742356] Read(10): 28 00 60 04 14 d0 00 00 08 00
Jan 31 15:15:03 server kernel: [ 1661.742359] end_request: I/O error, dev sda, sector 1610880213
Jan 31 15:15:03 server kernel: [ 1661.742410] ata2: EH complete
Alles anzeigen
Ahhh ok.
Diese ATA Fehlermeldungen kenne ich: Read FPDMA, UNC ausw.
Kommen die von den WD REDs ?
Ist da ALPM aktiviert?
Alles anzeigenOk alles klar! Danke dir!
Ich werde übernacht mal einen Long-Test auf den Datenplatten laufen lassen. Wie gesagt, die System Platte ist alt und mir völlig egal.
Hier der Read Error:
CodeAlles anzeigenJan 31 15:00:06 server kernel: [ 765.110625] ata2.00: exception Emask 0x0 SAct 0xf800 SErr 0x0 action 0x0 Jan 31 15:00:06 server kernel: [ 765.110675] ata2.00: irq_stat 0x40000008 Jan 31 15:00:06 server kernel: [ 765.110700] ata2.00: failed command: READ FPDMA QUEUED Jan 31 15:00:06 server kernel: [ 765.110733] ata2.00: cmd 60/08:58:d0:14:04/00:00:60:00:00/40 tag 11 ncq 4096 in Jan 31 15:00:06 server kernel: [ 765.110733] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F> Jan 31 15:00:06 server kernel: [ 765.110826] ata2.00: status: { DRDY ERR } Jan 31 15:00:06 server kernel: [ 765.110850] ata2.00: error: { UNC } Jan 31 15:00:06 server kernel: [ 765.122554] ata2.00: configured for UDMA/133 Jan 31 15:00:06 server kernel: [ 765.122564] sd 1:0:0:0: [sda] Unhandled sense code Jan 31 15:00:06 server kernel: [ 765.122565] sd 1:0:0:0: [sda] Jan 31 15:00:06 server kernel: [ 765.122566] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Jan 31 15:00:06 server kernel: [ 765.122567] sd 1:0:0:0: [sda] Jan 31 15:00:06 server kernel: [ 765.122567] Sense Key : Medium Error [current] [descriptor] Jan 31 15:00:06 server kernel: [ 765.122569] Descriptor sense data with sense descriptors (in hex): Jan 31 15:00:06 server kernel: [ 765.122570] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Jan 31 15:00:06 server kernel: [ 765.122573] 60 04 14 d5 Jan 31 15:00:06 server kernel: [ 765.122575] sd 1:0:0:0: [sda] Jan 31 15:00:06 server kernel: [ 765.122576] Add. Sense: Unrecovered read error - auto reallocate failed Jan 31 15:00:06 server kernel: [ 765.122577] sd 1:0:0:0: [sda] CDB: Jan 31 15:00:06 server kernel: [ 765.122578] Read(10): 28 00 60 04 14 d0 00 00 08 00 Jan 31 15:00:06 server kernel: [ 765.122581] end_request: I/O error, dev sda, sector 1610880213 Jan 31 15:00:06 server kernel: [ 765.122637] ata2: EH complete Jan 31 15:00:09 server kernel: [ 767.515431] ata2.00: exception Emask 0x0 SAct 0x180000 SErr 0x0 action 0x0 Jan 31 15:00:09 server kernel: [ 767.515479] ata2.00: irq_stat 0x40000008 Jan 31 15:00:09 server kernel: [ 767.515505] ata2.00: failed command: READ FPDMA QUEUED Jan 31 15:00:09 server kernel: [ 767.515538] ata2.00: cmd 60/08:a0:d0:14:04/00:00:60:00:00/40 tag 20 ncq 4096 in Jan 31 15:00:09 server kernel: [ 767.515538] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F> Jan 31 15:00:09 server kernel: [ 767.515631] ata2.00: status: { DRDY ERR } Jan 31 15:00:09 server kernel: [ 767.515655] ata2.00: error: { UNC } Jan 31 15:00:09 server kernel: [ 767.527423] ata2.00: configured for UDMA/133 Jan 31 15:00:09 server kernel: [ 767.527437] sd 1:0:0:0: [sda] Unhandled sense code Jan 31 15:00:09 server kernel: [ 767.527439] sd 1:0:0:0: [sda] Jan 31 15:00:09 server kernel: [ 767.527439] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Jan 31 15:00:09 server kernel: [ 767.527440] sd 1:0:0:0: [sda] Jan 31 15:00:09 server kernel: [ 767.527441] Sense Key : Medium Error [current] [descriptor] Jan 31 15:00:09 server kernel: [ 767.527443] Descriptor sense data with sense descriptors (in hex): Jan 31 15:00:09 server kernel: [ 767.527443] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Jan 31 15:00:09 server kernel: [ 767.527447] 60 04 14 d5 Jan 31 15:00:09 server kernel: [ 767.527449] sd 1:0:0:0: [sda] Jan 31 15:00:09 server kernel: [ 767.527450] Add. Sense: Unrecovered read error - auto reallocate failed Jan 31 15:00:09 server kernel: [ 767.527451] sd 1:0:0:0: [sda] CDB: Jan 31 15:00:09 server kernel: [ 767.527452] Read(10): 28 00 60 04 14 d0 00 00 08 00 Jan 31 15:00:09 server kernel: [ 767.527455] end_request: I/O error, dev sda, sector 1610880213 Jan 31 15:00:09 server kernel: [ 767.527510] ata2: EH complete Jan 31 15:03:33 server kernel: [ 971.862407] EXT4-fs (sdc1): mounted filesystem with ordered data mode. Opts: acl,user_xattr,usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0 Jan 31 15:09:01 server /USR/SBIN/CRON[8223]: (root) CMD ( [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime)) Jan 31 15:15:01 server /USR/SBIN/CRON[8670]: (root) CMD (/usr/sbin/omv-mkgraph >/dev/null 2>&1) Jan 31 15:15:01 server rrdcached[2348]: Received FLUSHALL Jan 31 15:15:03 server kernel: [ 1661.730574] ata2.00: exception Emask 0x0 SAct 0x2000000 SErr 0x0 action 0x0 Jan 31 15:15:03 server kernel: [ 1661.730624] ata2.00: irq_stat 0x40000008 Jan 31 15:15:03 server kernel: [ 1661.730651] ata2.00: failed command: READ FPDMA QUEUED Jan 31 15:15:03 server kernel: [ 1661.730687] ata2.00: cmd 60/08:c8:d0:14:04/00:00:60:00:00/40 tag 25 ncq 4096 in Jan 31 15:15:03 server kernel: [ 1661.730687] res 41/40:00:d5:14:04/00:00:60:00:00/40 Emask 0x409 (media error) <F> Jan 31 15:15:03 server kernel: [ 1661.730784] ata2.00: status: { DRDY ERR } Jan 31 15:15:03 server kernel: [ 1661.730810] ata2.00: error: { UNC } Jan 31 15:15:03 server kernel: [ 1661.742333] ata2.00: configured for UDMA/133 Jan 31 15:15:03 server kernel: [ 1661.742342] sd 1:0:0:0: [sda] Unhandled sense code Jan 31 15:15:03 server kernel: [ 1661.742343] sd 1:0:0:0: [sda] Jan 31 15:15:03 server kernel: [ 1661.742344] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Jan 31 15:15:03 server kernel: [ 1661.742345] sd 1:0:0:0: [sda] Jan 31 15:15:03 server kernel: [ 1661.742346] Sense Key : Medium Error [current] [descriptor] Jan 31 15:15:03 server kernel: [ 1661.742347] Descriptor sense data with sense descriptors (in hex): Jan 31 15:15:03 server kernel: [ 1661.742348] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Jan 31 15:15:03 server kernel: [ 1661.742352] 60 04 14 d5 Jan 31 15:15:03 server kernel: [ 1661.742353] sd 1:0:0:0: [sda] Jan 31 15:15:03 server kernel: [ 1661.742355] Add. Sense: Unrecovered read error - auto reallocate failed Jan 31 15:15:03 server kernel: [ 1661.742356] sd 1:0:0:0: [sda] CDB: Jan 31 15:15:03 server kernel: [ 1661.742356] Read(10): 28 00 60 04 14 d0 00 00 08 00 Jan 31 15:15:03 server kernel: [ 1661.742359] end_request: I/O error, dev sda, sector 1610880213 Jan 31 15:15:03 server kernel: [ 1661.742410] ata2: EH complete
Du meins den UNC Error oder ?
Das wird kein richtiger UNC Error sein. Ich hatte die auch und keinen fehlerhadten Sector im SMART oder irgendwelche anderen Read Erro Auffälligkeiten von der HDD selber.
Bei mir gingen alle erros bis auf UNC weg wenn ALPM deaktiviert war. Ich hab ja wegen den UNC Fehlerm im Syslog alle HDD getauscht auch wenn alle HDD im Selbstest unauffällig waren und auch der Großhändler keine Fehler feststellen konnte - hatte aber aufgrund der geloggten Daten dennoch eine Gutschrift erhalten.
Habe übernacht einen Extended Offline Test bei meinen beiden Datenplatten laufen lassen. Es ergab keine Fehler.
Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!