SmartD error bei 2 Festplatten

  • Hallo,


    Ich bekomme seit 2 Tagen diesen SmartD error bei 2 von meinen Festplatten:


    Code
    The following warning/error was logged by the smartd daemon:
    
    
    Device: /dev/disk/by-id/wwn-0x50014ee2091f2d63 [SAT], ATA error count increased from 10 to 12
    Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4E0291590 [SAT], ATA error count increased from 10 to 12


    Code
    wwn-0x50014ee2091f2d63


    Finde ich aber nirgends bei meinen Festplatten.


    Und auch ein Smart Selftest bei der Platte mit der Seriennummer WCC4E0291590 ergibt keine Fehler...


    Weiß jemand was hier vor sich geht?


    Danke!

  • Ich würd mal die Sata Kabel tauschen. ATA Fehler müssen nicht direkt einen Fehler der Festplatte selbst bedeuten.


    Gruß
    David

    "Well... lately this forum has become support for everything except omv" [...] "And is like someone is banning Google from their browsers"


    Only two things are infinite, the universe and human stupidity, and I'm not sure about the former.

    Upload Logfile via WebGUI/CLI
    #openmediavault on freenode IRC | German & English | GMT+1
    Absolutely no Support via PM!

  • Also ganz unten im SMART Bericht der entsprechenden HDD sollten ein paar details zu dem Error stehen (da werden immer die letzten 5 gespeichert).


    Des Weiteren kannst Du im Syslog mal suchen. Das kann ein CRC, UNC .. usw Error sein.


    Gruß

  • Also ganz unten im SMART Bericht der entsprechenden HDD sollten ein paar details zu dem Error stehen (da werden immer die letzten 5 gespeichert).


    Des Weiteren kannst Du im Syslog mal suchen. Das kann ein CRC, UNC .. usw Error sein.


    Gruß


    Sagt euch das was?


  • Hi


    Nee das was ich meine ist eine Sektion/paar Zeilen drüber und schaut so aus:




    Ausserdem schau mal in der Syslog nach. Ggf kannst Du die alten syslog unter /var/log runterladen und mal durchforsten,

  • Da habe ich bei mir stehen.


  • Es ist ein Dell T20 allerdings mit einem E3-1245 V3.


    Festplatten sind:
    1x Samsung HD103SJ
    2x WD40EFRX-68W


    Ist jetzt seit ca. 6 Monaten im Betrieb.


    Ich habe bis jetzt keinerlei Problem mit Datenverlust gehabt, alles läuft bestens! Aber die Fehlermeldungen verwundern mich etwas...
    Ich nutze den 3.16er Backports Kernel.


    Hier gibts ein paar infos zu dem Dell: http://www.hardwareluxx.de/com…oweredge-t20-1031138.html


    Wie gesagt, G3220 wurde durch einen E3-1245 V3 ersetzt.

  • Mhh wieder die WD REDs.... .


    Also zum einen brauchen wir folgendes:


    1. Zu dem Error passenden syslog Eintrag


    1.5 steht im syslog was von ATA link reset


    2. Ist AHCI aktiviert?


    3. Ist SATA aggressive PM aktiviert im BIOS UND ggf per powertop/RC.local !?


    Die Fehlern können prinzipiell bedingt sein durch:


    Defektes SATA kabel
    Defektes SATA power kabel
    Netzteil
    Mainboard
    Kernel
    HDD


    Tolle Einschränkungen oder :)


    Also erstmal die oberen Punkte ab arbeiten und dann schauen wir mal

  • Ach das ist ja interessant dass der T20 auch den C226 Chipsatz hat! Und dann noch die WD Reds!


    Mhh so viel Zufall?


    Schau mal unter meinen posts da musstest du einen Thread " smart errors driving me nuts" finden.
    Lies den mal :)

  • Soooo....



    1. Im Syslog finde ich keinen Eintrag, gibt es ein Syslog archiv?
    2. Ja
    3. Enable SATA link power management for wird per powertop auf "good" gestellt. Keine Anpassungen in rc.local.


    Wenn es das Sata Kabel sein sollte, dann müssten es ja alle 3 Kabel sein O_o.
    Diese Fehler treten ja bei allen 3 Festplatten auf, alle 3 Platten defekt???


    Ich finde es nur komisch das diese Fehlermeldungen keinerlei auswirkung auf das System haben, alles läuft wie geschmiert.



    Heute stand im SMART log das hier:



    gestern kam das ein paar mal vor:


    Code
    Jan 26 18:38:41 server smartd[11780]: Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4EN39HYFH [SAT], SMART Prefailure Attribute: 3 Spin_Up_Time changed from 180 to 181
    Jan 26 18:38:41 server smartd[11780]: Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4EN39HYFH [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 115 to 114
    Jan 26 18:38:41 server smartd[11780]: Device: /dev/disk/by-id/scsi-SATA_WDC_WD40EFRX-68_WD-WCC4E0291590 [SAT], SMART Prefailure Attribute: 3 Spin_Up_Time changed from 179 to 181
    Jan 26 19:08:40 server smartd[11780]: Device: /dev/disk/by-id/wwn-0x50014ee25fd40306 [SAT], SMART Prefailure Attribute: 3 Spin_Up_Time changed from 181 to 182
    Jan 26 19:08:40 server smartd[11780]: Device: /dev/disk/by-id/wwn-0x50014ee25fd40306 [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 114 to 116
    Jan 26 19:08:40 server smartd[11780]: Device: /dev/disk/by-id/wwn-0x50014ee2091f2d63 [SAT], SMART Prefailure Attribute: 3 Spin_Up_Time changed from 181 to 182
    Jan 26 19:08:40 server smartd[11780]: Device: /dev/disk/by-id/wwn-0x50014ee2091f2d63 [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 115 to 116


    Ich kann jetzt wirklich nicht sagen wie lange das schon ist, ich habe nie darauf geachtet da mir der S.M.A.R.T. selftest immer ein PASSED gab.

  • Also ich hatte auch viele smart error mit den Reds und dem c226 Chipsatz - steht alles in dem thread den ich geschildert habe.


    Spin up time ist ein "echtes" Problem wenn der wert immer schlechter wird.


    Abrt CRC und UNC Fehler (letzterer nur wenn wirklich keine defekten Sektoren vorliegen)/waren bei mir eine Inkompatibilität.


    Unter /var/log liegen auch die alten syslog Dateien. Es muss ein log zu dem abrt smart Eintrag geben.


    Schau auch wie schon erwähnt ob deine ATA ports immer "link resets" haben ind der SATA link von 6gb/s irgendwann auf 1.5gb/s abfällt.


    Link resets konnte ich mit deaktivieren der powertop Einstellungen beheben - die anderen Fehler blieben


    Also:


    Syslog durchsuchen. Wenn kein Eintrag da ist in OMV syslog löschen, neu booten und warten bis wieder ein Smart Fehler kommt und dann den passenden syslog eintrag Posten.


    Wenn wir das haben kannst du mal das SATA alpm per powertop deaktivieren und schauen ob die Fehler verschwinden.
    Lies dir meinen thread mal durch

  • Jetzt gerade habe ich wieder eine Mail bekommen:


    Code
    Jan 28 19:37:35 server postfix/smtp[16675]: 7ED743000AE4: replace: header Subject: SMART error (ErrorCount) detected on host: server: Subject: SMART error (ErrorCount) detected on host: server [server.WORKGROUP]
    Jan 28 19:37:35 server postfix/smtp[16678]: 8F44930004BF: replace: header Subject: SMART error (ErrorCount) detected on host: server: Subject: SMART error (ErrorCount) detected on host: server [server.WORKGROUP]
    Jan 28 19:37:36 server postfix/smtp[16702]: 7F8083000B4A: replace: header Subject: SMART error (ErrorCount) detected on host: server: Subject: SMART error (ErrorCount) detected on host: server [server.WORKGROUP]
    Jan 28 19:37:36 server postfix/smtp[16699]: 752153000B4F: replace: header Subject: SMART error (ErrorCount) detected on host: server: Subject: SMART error (ErrorCount) detected on host: server [server.WORKGROUP]


    Ich werde gleich ein paar Sachen überprüfen und berichten

  • So ich habe jetzt...


    - alle Sata Kabel ausgetauscht
    - alle powertop tuning optionen deaktiviert
    - die APM einstellung aller Festplatten Deaktiviert


    Mal sehen ob jetzt noch was kommt. Wenn ja werde ich mal anstatt die onboard Sata ports eine Sata Karte benutzen um zu sehen ob das Problem immer noch auftaucht.


    Mir ist gerade eingefallen das ich diese Error Mails erst seit ca einer Woche bekomme...Ich weiss nicht was sich seit dem verändert hat.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!