Wechsel auf ECC Ram - Was ist zu beachten?

Status
Not open for further replies.

Taurus

Explorer
Joined
Jan 14, 2015
Messages
76
Hallo,

ich möchte gerne an meinem HP N40L auf ECC Speicher wechseln.

Ist dabei irgendwas zu beachten?

Kann man die ECC Funktion irdendwie testen oder im System einsehen ob vorhanden?

Grüße TTaurus
 

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
Es gibt keine universale ECC tests. Was ist das für eine CPU, Intel oder AMD?
 

Taurus

Explorer
Joined
Jan 14, 2015
Messages
76
AMD Turion™ II Neo N40L (1.5GHz)
AMD RS785E/SB820M chipset
 

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
AMD Turion™ II Neo N40L (1.5GHz)
AMD RS785E/SB820M chipset

Das soll mit ECC arbeiten? Das klingt mir unwahrscheinlich, ist aber nur ein Gefühl.
 

emk2203

Guru
Joined
Nov 11, 2012
Messages
573
Einfach den Speicher austauschen, den Rest macht das Gerät.

Das sind Microserver von HP (N36L, N40L, N54L), die alle mit ECC arbeiten können. Professionelle Hardware zu niedrigem Preis. Ich habe zwei (N40L, N54L), die noch nie Probleme gemacht haben.
 

Taurus

Explorer
Joined
Jan 14, 2015
Messages
76
Es gibt doch eine gute Möglichkeit zu sehen ob ECC Memory erkannt wird:

MemTest!

Da ich Angsthase erst mal wissen wollte ob die neuen Ram Module auch in Ordnung sind, habe ich erst mal Memtest86 V4.20 laufen lassen.
Übrigens auf der G-Parted liveCD enthalten und im Boot Menü auswählbar.

Aber wie kann ich nun sehen ob FreeBSD diesen auch nutzt?!? Denn in Memtest lässt sich die ECC Funktion auch abschalten ???

Was bedeudet eigentlich Correct-Chipkill? Eine art Spare Memory?
- Das ist bei mir nämlich: Off!

Ich würde mich freuen wenn mir hier noch jemand weitere Infos hätte.

Danke und Gruß Taurus
 

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
Es gibt doch eine gute Möglichkeit zu sehen ob ECC Memory erkannt wird:

MemTest!

Da ich Angsthase erst mal wissen wollte ob die neuen Ram Module auch in Ordnung sind, habe ich erst mal Memtest86 V4.20 laufen lassen.
Übrigens auf der G-Parted liveCD enthalten und im Boot Menü auswählbar.

Aber wie kann ich nun sehen ob FreeBSD diesen auch nutzt?!? Denn in Memtest lässt sich die ECC Funktion auch abschalten ???

Was bedeudet eigentlich Correct-Chipkill? Eine art Spare Memory?
- Das ist bei mir nämlich: Off!

Ich würde mich freuen wenn mir hier noch jemand weitere Infos hätte.

Danke und Gruß Taurus

Welcher Memtest?

Memtest86+ 4.etwas
Memtest86+ 5.1
Memtest (nicht Plus)

Im Memtest86+ 5.1 funktioniert die ECC-Detektion nicht sehr gut.

Wenn ECC funktioniert, dann kann keine Software etwas dagegen machen. ECC funktioniert halt. Ob ECC funktioniert ist natürlich eine sehr gute Frage, die leider keine guten Antowrten hat.
 

emk2203

Guru
Joined
Nov 11, 2012
Messages
573

Taurus

Explorer
Joined
Jan 14, 2015
Messages
76
Mir ist schon klar das es sich hier um eine Hardwarefunktionalität handelt, hätte aber auch gedacht dass im Prozessor irgendein Flag gestzt wird, das man unter FreeBSD dann irgendwie abfragen kann.

Zu MemTest:
Memtest86+ V4.20
 

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
Mir ist schon klar das es sich hier um eine Hardwarefunktionalität handelt, hätte aber auch gedacht dass im Prozessor irgendein Flag gestzt wird, das man unter FreeBSD dann irgendwie abfragen kann.

Zu MemTest:
Memtest86+ V4.20

Abfragen, vielleicht. Aber nicht ändern. Leider gibt es hier kein Standard - für AMD gibt es nichts, für manche Intel Plattformen gibt es ecc_check.c , für andere (z.B. Haswell-EP - ich habe es versucht, bekam aber die selben Ergebnisse wie auf einen AMD System (alles FF, was nichts wirklich sagt.)).
 

xaibex

Patron
Joined
Mar 19, 2013
Messages
340
Ich habe ebenfalls einen N40L

folgende Ausgabe bringt klarheit:

Code:
[root@nas ~]# dmidecode --type 16                                                                                                
# dmidecode 2.12                                                                                                                 
SMBIOS 2.6 present.                                                                                                              
                                                                                                                                 
Handle 0x0014, DMI type 16, 15 bytes                                                                                             
Physical Memory Array                                                                                                            
        Location: System Board Or Motherboard                                                                                    
        Use: System Memory                                                                                                       
        Error Correction Type: Single-bit ECC                                                                                    
        Maximum Capacity: 8 GB                                                                                                   
        Error Information Handle: Not Provided                                                                                   
        Number Of Devices: 2    
 
Last edited:

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
Ich habe ebenfalls einen N40L

folgende Ausgabe bringt klarheit:

Code:
[root@nas ~]# dmidecode --type 16                                                                                               
# dmidecode 2.12                                                                                                                
SMBIOS 2.6 present.                                                                                                             
                                                                                                                                
Handle 0x0014, DMI type 16, 15 bytes                                                                                            
Physical Memory Array                                                                                                           
        Location: System Board Or Motherboard                                                                                   
        Use: System Memory                                                                                                      
        Error Correction Type: Single-bit ECC                                                                                   
        Maximum Capacity: 8 GB                                                                                                  
        Error Information Handle: Not Provided                                                                                  
        Number Of Devices: 2    
Sagt aber nicht ob es wirklich benutzt wird, leider. Nur ob es unterstützt wird.
 

xaibex

Patron
Joined
Mar 19, 2013
Messages
340
Eric du hast recht, das sagt nur ob die Module ECC unterstützen.

Ich habe nochmal recherchiert und ausprobiert.
Mit dmidecode -t 17 wird angezeigt was am System eingebunden ist.

In meinem Fall steht dort Data Width = 64bits und Total Width = 72 bits. Also 64 Bits und 8 Bits Parität. --> ECC wird verwendet.

Ich habe nochmal auf einem anderem System ohne ECC geschaut und dort steht bei Data Width und Total Width derselbe Zahlenwert.


Code:
                                                                                                                                                                                                                            
Handle 0x0016, DMI type 17, 28 bytes                                                                                               
Memory Device                                                                                                                      
        Array Handle: 0x0014                                                                                                       
        Error Information Handle: Not Provided                                                                                     
        Total Width: 72 bits                                                                                                       
        Data Width: 64 bits                                                                                                        
        Size: 8192 MB                                                                                                              
        Form Factor: DIMM                                                                                                          
        Set: None                                                                                                                  
        Locator: DIMM0                                                                                                             
        Bank Locator: BANK0                                                                                                        
        Type: Other                                                                                                                
        Type Detail: Synchronous                                                                                                   
        Speed: 1333 MHz                                                                                                            
        Manufacturer: Manufacturer00                                                                                               
        Serial Number: SerNum00                                                                                                    
        Asset Tag: Not Specified                                                                                                   
        Part Number: ModulePartNumber00                                                                                            
        Rank: Unknown                                                                                                              
                                                                                                                                   
[...] 
 

xaibex

Patron
Joined
Mar 19, 2013
Messages
340
Das klingt für mich als ob ECC im BIOS Deaktiviert ist?
Was sagt Memtest86 über den ECC Status?
 

Taurus

Explorer
Joined
Jan 14, 2015
Messages
76
Also bei mir passt es!
Sowohl auf dem Ecc System als auch auf meinem alten ohne.

VIELEN DANK
 

Spacemarine

Contributor
Joined
Jul 19, 2014
Messages
105
Das klingt für mich als ob ECC im BIOS Deaktiviert ist?
Was sagt Memtest86 über den ECC Status?

Memtest86+ 4.2.0 sagt: ECC OFF
Memtest86 V6.0.0 (neu vom 13.02.2015) sagt: ECC Status: Unknown

Memtest 86 V6.0.0 kann auch keine SPD-Informationen auslesen, scheinbar kommt es mit dem Chipsatz/Ram/CPU nicht ganz klar.

Ein vom USB-Stick gebootetes Ubuntu 14.10 sagt zu dmidecode -t memory:
# dmidecode 2.12
# SMBIOS entry point at 0x000f04d0
SMBIOS 2.8 present.

Handle 0x002B, DMI type 16, 23 bytes
Physical Memory Array
Location: System Board Or Motherboard
Use: System Memory
Error Correction Type: Single-bit ECC
Maximum Capacity: 64 GB
Error Information Handle: Not Provided
Number Of Devices: 4

Handle 0x002D, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x002B
Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits
Size: 8192 MB
Form Factor: SODIMM
Set: None
Locator: DIMMA1
Bank Locator: BANK 0
Type: DDR3
Type Detail: Synchronous Unbuffered (Unregistered)
Speed: 1600 MHz
Manufacturer: <BAD INDEX>
Serial Number: <BAD INDEX>
Asset Tag: <BAD INDEX>
Part Number: <BAD INDEX>
Rank: 1
Configured Clock Speed: 1600 MHz

Handle 0x002F, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x002B
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: Unknown
Size: No Module Installed
Form Factor: SODIMM
Set: None
Locator: DIMMA2
Bank Locator: BANK 0
Type: DDR3
Type Detail: Synchronous Unbuffered (Unregistered)
Speed: Unknown
Manufacturer: NO DIMM
Serial Number: NO DIMM
Asset Tag: NO DIMM
Part Number: NO DIMM
Rank: Unknown
Configured Clock Speed: Unknown

Handle 0x0030, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x002B
Error Information Handle: Not Provided
Total Width: 64 bits
Data Width: 64 bits
Size: 8192 MB
Form Factor: SODIMM
Set: None
Locator: DIMMB1
Bank Locator: BANK 0
Type: DDR3
Type Detail: Synchronous Unbuffered (Unregistered)
Speed: 1600 MHz
Manufacturer: <BAD INDEX>
Serial Number: <BAD INDEX>
Asset Tag: <BAD INDEX>
Part Number: <BAD INDEX>
Rank: 1
Configured Clock Speed: 1600 MHz

Handle 0x0032, DMI type 17, 34 bytes
Memory Device
Array Handle: 0x002B
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: Unknown
Size: No Module Installed
Form Factor: SODIMM
Set: None
Locator: DIMMB2
Bank Locator: BANK 0
Type: DDR3
Type Detail: Synchronous Unbuffered (Unregistered)
Speed: Unknown
Manufacturer: NO DIMM
Serial Number: NO DIMM
Asset Tag: NO DIMM
Part Number: NO DIMM
Rank: Unknown
Configured Clock Speed: Unknown

Die relevanten Zeilen daraus sind:

Code:
Error Correction Type: Single-bit ECC
Total Width: 64 bits
Data Width: 64 bits


Hier gibt es einen scheinbaren Widerspruch, da Zeile 2 und 3 sagen dass es kein ECC-Speicher ist, Zeile 1 sagt dass ECC unterstützt wird. Ich vermute dass Zeile 2 und 3 vielleicht aus den SPD-Informationen gelesen werden und da auch etwas schief läuft. Dafür spricht auch die Angabe weiter unten:

Code:
Manufacturer: <BAD INDEX>
Serial Number: <BAD INDEX>
Asset Tag: <BAD INDEX>
Part Number: <BAD INDEX>


Wenn ich im BIOS den ECC-support ausschalte, dann bekomme ich den gleichen Output, nur die erste Zeile ist geändert:

Code:
Error Correction Type: None


Der Output von ecc_check.c liefert ff ff ff f, was ein weiterer Hinweis darauf ist, dass die Informationen nicht korrekt gelesen werden können.

Ich habe mittlerweile zwei Intel Avoton Systeme, nämlich:
Supermicro A1SRi-2558F
ASRock C2750D4I.

Beide Systeme sind mit DDR3-ECC Speicher ausgestattet und die Module haben auch 9 statt 8 Speicherchips auf der Platine. (Bei 8 Chips könnten sie kein ECC haben)

Auf beiden Systemen habe ich genau das gleiche Verhalten, d.h. alle oben angegebenen Tests führen auf beiden Systemen zu genau den gleichen Ergebnissen.

Was schließe ich daraus? ECC wird wahrscheinlich funktionieren, denn es ist unwahrscheinlich dass auf dem Supermicro und dem Asrock System mit völlig unterschiedlichem RAM beide male kein ECC funktiniert, obwohl es funktionieren sollte. Die widersprüchlichen Informationen führe ich auf Inkompatibilitäten des Chipsatz zurück, es ist ja auch eine etwas exotischere Hardware.

Trotzdem sehr schade, dass man dieses Feature nicht wirklich überprüfen kann...
 

xaibex

Patron
Joined
Mar 19, 2013
Messages
340
Technisch ist es für Software/Betriebssysteme nicht relevant ob der Speicher ECC unterstützt/nutzt oder nicht.
Deshalb gibt es (vor allem im nicht Server (Xeon) Umfeld) leider immer wieder BIOS/Chipsätze die dem Betriebssystem erst gar nicht verraten ob ECC genutzt wird.
Hier hat man keine andere Wahl als dem Mainboard einfach blind zu vertrauen.
 

Reifi

Cadet
Joined
Mar 20, 2015
Messages
7
Hallo,

ich hänge mich mit meiner Frage mal hier an.

Ich habe einen N40L im Einsatz und will dem RAM auf 16 GB erweitern. Ist das ohne Neuinstallation möglich? Also einfach Server runterfahren, Kiste öffnen, neuen ECC-RAM rein. Dann kurz einmal ins Bios schauen, ob der RAM erkannt wurde und gut ist.

Oder muss ich Freenas neu installieren? Aktuell habe ich es auf einem USB-Stick der auf dem internen Anschluss steckt.
 

Ericloewe

Server Wrangler
Moderator
Joined
Feb 15, 2014
Messages
20,194
Hallo,

ich hänge mich mit meiner Frage mal hier an.

Ich habe einen N40L im Einsatz und will dem RAM auf 16 GB erweitern. Ist das ohne Neuinstallation möglich? Also einfach Server runterfahren, Kiste öffnen, neuen ECC-RAM rein. Dann kurz einmal ins Bios schauen, ob der RAM erkannt wurde und gut ist.

Oder muss ich Freenas neu installieren? Aktuell habe ich es auf einem USB-Stick der auf dem internen Anschluss steckt.

Ich kenne keine Betriebssysteme, die nach einen RAM Upgrade neu installiert werden müssen.

Also, einfach einstecken und alles sollte in Ordnung sein.
 
Status
Not open for further replies.
Top