ata1: soft resetting link

Wenn Euch der Linux-Kernel mit

ata1.00: exception Emask 0x0 SAct 0x7 SErr 0x0 action 0x2 frozen
ata1.00: cmd 60/a0:00:f5:b2:29/00:00:02:00:00/40 tag 0 cdb 0x0 data 81920 in
res 40/00:00:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)
ata1.00: cmd 60/b8:08:95:b3:29/00:00:02:00:00/40 tag 1 cdb 0x0 data 94208 in
res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata1.00: cmd 60/08:10:5d:bc:7c/00:00:01:00:00/40 tag 2 cdb 0x0 data 4096 in
res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata1: soft resetting link
ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
ata1.00: configured for UDMA/133
ata1: EH complete

beglückt und Aussetzer verursacht, dann ist mit großer Wahrscheinlichkeit die Implementierung von Native Command Queuing (NCQ) in Eurer SATA-Platte b0rken.

Um das Problem zu umschiffen reicht es in der Regel, NCQ für die entsprechenden Platten zu deaktivieren:

echo 1 > /sys/block/sda/device/queue_depth

Das führt man dann automatisiert an entsprechender Stelle direkt nach dem Booten aus oder wartet darauf, bis die Entwickler von libata das Festplattenmodell für NCQ blacklisten.

Bei mir betrifft dies zwei der folgenden Samsung-Platten:

lisa:~ # hdparm -I /dev/sda

/dev/sda:

ATA device, with non-removable media
Model Number:       SAMSUNG HD103UJ
Serial Number:      XXXXXXXXXXXX
Firmware Revision:  1AA01112
Standards:
Supported: 7 6 5 4
Likely used: 7
Configuration:
Logical         max     current
cylinders       16383   16383
heads           16      16
sectors/track   63      63

CHS current addressable sectors:   16514064
LBA    user addressable sectors:  268435455
LBA48  user addressable sectors: 1953525168
device size with M = 1024*1024:      953869 MBytes
device size with M = 1000*1000:     1000204 MBytes (1000 GB)
Capabilities:
LBA, IORDY(can be disabled)
Queue depth: 32
Standby timer values: spec’d by Standard, no device specific minimum
R/W multiple sector transfer: Max = 16  Current = 8
Advanced power management level: unknown setting (0x0000)
Recommended acoustic management value: 254, current value: 254
DMA: mdma0 mdma1 mdma2 udma0 udma1 udma2 udma3 udma4 udma5 *udma6 udma7
Cycle time: min=120ns recommended=120ns
PIO: pio0 pio1 pio2 pio3 pio4
Cycle time: no flow control=120ns  IORDY flow control=120ns
Commands/features:
Enabled Supported:
*    SMART feature set
Security Mode feature set
*    Power Management feature set
*    Write cache
*    Look-ahead
*    Host Protected Area feature set
*    WRITE_BUFFER command
*    READ_BUFFER command
*    NOP cmd
*    DOWNLOAD_MICROCODE
Advanced Power Management feature set
Power-Up In Standby feature set
*    SET_FEATURES required to spinup after power up
SET_MAX security extension
*    Automatic Acoustic Management feature set
*    48-bit Address feature set
*    Device Configuration Overlay feature set
*    Mandatory FLUSH_CACHE
*    FLUSH_CACHE_EXT
*    SMART error logging
*    SMART self-test
Media Card Pass-Through
*    General Purpose Logging feature set
*    64-bit World wide name
*    WRITE_UNCORRECTABLE command
*    {READ,WRITE}_DMA_EXT_GPL commands
*    Segmented DOWNLOAD_MICROCODE
*    SATA-I signaling speed (1.5Gb/s)
*    SATA-II signaling speed (3.0Gb/s)
*    Native Command Queueing (NCQ)
*    Host-initiated interface power management
*    Phy event counters
*    unknown 76[12]
DMA Setup Auto-Activate optimization
Device-initiated interface power management
*    Software settings preservation
*    SMART Command Transport (SCT) feature set
*    SCT Long Sector Access (AC1)
*    SCT LBA Segment Access (AC2)
*    SCT Error Recovery Control (AC3)
*    SCT Features Control (AC4)
*    SCT Data Tables (AC5)
Security:
Master password revision code = 65534
supported
not     enabled
not     locked

not     frozen
not     expired: security count
supported: enhanced erase
174min for SECURITY ERASE UNIT. 174min for ENHANCED SECURITY ERASE UNIT.
Checksum: correct

Comments ( 5 )

  1. infogurke
    Achja, sowas ich echt toll. Besonders an den billig Mainboards, bei entsprechender Last startet der Rechner dann mal eben neu... Ich hatte hier letztens ein Asus Board mit AMD (nforce4 Chipsatz), ein paar SATA und eine PATA Platte. DMA ging nicht und so war die Performance mit 2MB/s nicht so prickelnd. Jetzt hab ich ein Snowhill-Board von Intel und alles läuft prima. Nie wieder AMD auf Consumer-Hardware.
  2. Christian
    Würde es auch was bringen die Dinger in die /etc/sysctl.conf zu schreiben oder schmiert der Kernel schon vorher weg?
  3. Marcel
    Der Gedanke kam mir auch als erstes bis mir dann bewusst wurde, dass /etc/sysctrl.conf ja nur für /proc ist, nicht für /sys. Bei mir steht es unter OpenSUSE jetzt in der /etc/init.d/boot.local und in 80% aller Boots reicht es aus. Falls der Kernel vorher schon Probleme bemerkt, dauert der Bootvorgang halt 30 Sekunden länger.
  4. Keks
    Oh man, gut dass auf meinem IBM jetzt alles läuft.. : )
  5. User links about "checksum" on iLinkShare
    [...] | user-saved public links | iLinkShare 2 votesata1: soft resetting link>> saved by scottblake 1 days ago4 votesXenServer - Windows 2003 TCP checksum issue>> saved by [...]