Errori memoria DRAM

13 / 100

Colpiscono tutti, dall’utente medio ai gestori di grandi data center, provocando danni anche rilevanti. La soluzione, però, è più semplice di quanto si pensi

Si tratta della tipologia di memoria di lavoro più diffusa e utilizzata al mondo. Praticamente ubiqua o quasi. E questo nonostante abbia sulle spalle quasi 50 anni di onorato servizio.

La memoria DRAM (acronimo di dynamic random access memory, memoria dinamica ad accesso casuale), lanciata nel 1971 da Intel, è tra le componenti hardware più longeve e utilizzate della storia. Il suo lungo percorso, ovviamente, non è stato esente da passi falsi: nel corso dei decenni, le memorie DRAM sono state spesso al centro dell’occhio del ciclone per aver causato errori di varia natura e ancora oggi sono responsabili della gran parte dei problemi hardware accusati dai sistemi informatici di tutto il mondo.

Come funziona la memoria DRAM

Un chip di memoria RAM utilizzato oggi è costituito da un condensatore e un transistor.

La scrittura dei dati avviene nel momento in cui il condensatore acquista o meno una carica elettrica: se è “caricato” allora assumerà il valore logico di “1”, in caso contrario il suo valore sarà “0”. A differenza delle RAM statiche, nelle quali le celle di memoria conservano l’informazione sino a quando sono alimentate elettricamente, nelle RAM dinamiche la cella perde lentamente la carica (e le informazioni in essa contenute) e il sistema ha bisogno di aggiornare periodicamente la carica di tutte le celle di memoria.

Da qui deriva il nome di memorie dinamiche.

Il vantaggio delle DRAM rispetto alle memorie statiche sta nelle dimensioni del condensatore: nelle memorie dinamiche è eccezionalmente piccolo e permette quindi di ridurre le dimensioni del banco di RAM (ovvero di aumentare la capacità di archiviazione a parità di spazio occupato).

Errore di memoria

Per le memorie DRAM si parla di errore nel momento in cui una o più informazioni sono scritte in un modo ma vengono lette dal sistema in maniera differente. E, a dispetto di quanto si possa credere, gli errori DRAM sono molto frequenti.

Come rilevato dagli studiosi canadesi, una percentuale che va dal 15% al 45% dei computer dei data center Google accusa problemi DRAM almeno una volta l’anno e, nel 4% dei casi, ci si trova di fronte a problemi di magnitudine sufficiente a causare l’improvviso arresto del sistema. Se non fosse per le policy di ridondanza cui si è accennato in precedenza, i servizi offerti dai grandi attori della rete (Google, Facebook, ecc) sarebbero piuttosto inaffidabili, potendo smettere di funzionare in qualsiasi momento e senza alcun preavviso.

Errore soft, errore hard

Gli errori DRAM sono solitamente divisi in due macrocategorie: da un lato gli errori soft, dall’altro gli errori hard.

Si parla di errori software quando la corruzione dei dati è causata da fattori esterni alla RAM (emissioni radioattive, ad esempio) mentre le componenti hardware (condensatore e transistor) sono perfettamente integri.

L’errore hard, invece, colpisce direttamente una componente materiale del modulo RAM, causando spesso un errore permanente: una “cella” di memoria verrebbe bloccata su valore logico preciso (uno “0” oppure un “1”) senza poter essere più modificato e quindi causando errori in scrittura e/o lettura del dato.

Stessa riga, stessa colonna

Se nel sentito comune la gran parte dei problemi DRAM è attribuito a cause software, la statistica dimostra che è vero l’esatto contrario. I dati raccolti dagli studiosi dell’Università di Toronto dimostrano che la maggioranza dei problemi DRAM è invece di natura hardware. Analizzando la distribuzione degli errori, infatti, gli scienziati canadesi hanno scoperto che essi colpiscono solitamente le celle di una stessa riga o di una stessa colonna. In molti casi, addirittura, è sempre la stessa cella a provocare il malfunzionamento del sistema.

Dal momento che è improbabile (se non impossibile) che una radiazione colpisca sempre lo stesso punto della RAM in diverse occasioni, assume maggiore forza la teoria degli errori hard e quindi di un problema permanentemente ai componenti fisici della memoria. Il problema degli errori di questa natura è che non sono, di norma, correggibili.

Translate »