Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Aktuell betreiben wir ein Hybrid-System, das aus einer großen Shared-Memory-Maschine der Firma SGI und einem MPI-basierten Teil der Firma BULL besteht. Beide unterschiedlichen GPU- und CPU-Komponenten besteht. Die CPU-Nodes sind hauptsächlich Blade-Server der Firma Supermicro und können MPI-basiert betrieben werden. Der GPU-Teil beinhaltet Server mit NVIDIA Graphikkarten unterschiedlicher Baureihen (A100, RTX6000/8000, GTX1080Ti). Alle „Teile“ sind von uns zu einem großen Cluster verbunden worden (mit gemeinsamem Batchsystem, Scratch-Speicher, Administration, etc…), das von uns HILBERT (nach dem deutschen Mathematiker Mathematiker David Hilbert, * 1862 ; † 1943) getauft wurde. Damit ist der Serverraum, in dem das System steht, ein…? Na...?

 


Warum hybrid?

Aufgrund der an der HHU bestehenden heterogenen Bedarfssituation wurde am ZIM bereits der Vorgänger von HILBERT („GAUSS“, * 2007 ; † 2013) vom HPC-Team als heterogener Rechencluster konzipiert, ausgeschrieben und installiert. Der heterogene Aufbau des GAUSS-Clusters war bei Inbetriebnahme einzigartig in Deutschland (eine Kombination aus Itanium Montecito (ia64)- und Woodcrest (em64t)-Prozessoren). Das Nachfolge-System "Hilbert" bestand ebenfalls zunächst aus einer großen Shared-Memory-Maschine der Firma SGI und einem MPI-basierten Teil der Firma BULL.

Der notwendige Mehraufwand, der in die Entwicklung neuartiger Tools für so einen heterogenen Cluster gesteckt werden muss, und die deutlich komplexere Administration lohnen sich, um die typischerweise heterogenen Anforderungen sehr unterschiedlicher Anwendungen zu erfüllen.

...