Die Reihe der Lichtenberg-Hochleistungsrechner an der TU Darmstadt stellt Wissenschaftlerinnen und Wissenschaftlern deutscher Hochschulen und öffentlicher Forschungseinrichtungen Rechenressourcen zur Verfügung. Die vielfältigen Architekturen der Hochleistungsrechner-Reihe bieten beste Voraussetzungen für eine flexible und effiziente Nutzung und insbesondere für rechenintensive Anwendungen.
Mitte Juli 2023 wurde der Lichtenberg II-Hochleistungsrechner der TU Darmstadt offiziell in Betrieb genommen. Ausgestattet mit neuester Technologie setzt er Maßstäbe bei Leistung und Energieeffizienz und bietet damit beste Voraussetzungen für exzellente Forschung. Unser zweiminütiger Film gibt Einblicke in die feierliche Einweihung und einen Rundgang durch den Hochleistungsrechner.
Im Jahr 2020 wurde die erste Ausbaustufe des Lichtenberg II-Systems mit 643 Rechenknoten in Betrieb genommen, die mit der zweiten Ausbaustufe um 581 Rechenknoten erweitert wird. Damit stellen beide Ausbaustufen zusammen eine theoretische Spitzenleistung von circa 8,5 Petaflops pro Sekunde (PFlop/s) durch Prozessoren und 1,7 Petaflops pro Sekunde durch Akzeleratoren zur Verfügung. Der Hauptspeicher beträgt in Summe 563 Terabyte, das Storagesystem für Daten rund 6 Petabyte.
Energieeffiziente Rechnersysteme und eine nachhaltige Nutzung sind wesentliche Ziele für die TU Darmstadt. Daher wird die Abwärme des Lichtenberg II nicht einfach an die Umwelt abgegeben, sondern während der Heizperiode zu einem erheblichen Teil in das Fernwärmenetz eingespeist, das auf dem Campus Lichtwiese alle Gebäude miteinander verbindet.
Der Lichtenberg II nutzt dafür eine direkte und hocheffiziente Warmwasserkühlung, um die Leistung der Prozessoren voll ausfahren zu können. Dabei werden durch spezielle Wärmetauscher und Kühlmittelverteiler hohe Rücklauftemperaturen von über 45 Grad Celsius ermöglicht, um eine sinnvolle Nachnutzung der Energie und effiziente Kühlung zu sichern. Dies führt zu einer deutlich verbesserten CO2- und Energiebilanz und ist ein wichtiger Schritt in Richtung nachhaltiges Hochleistungsrechnen.
Das Gesamtsystem Lichtenberg II (alle Ausbaustufen zusammen) wurde vom Bund und vom Land Hessen in Summe mit rund 15 Mio. Euro gefördert (Förderung nach Art. 91b GG).
Das berät bei der effizienten Nutzung der Rechnersysteme und bietet Schulungen an. Hessische Komptenzzentrum für Hochleistungsrechnen
Behoben: Ausfall des cluster-weiten Filesystems
04. November 2024
Der Fehler ist behoben, das System steht wieder zur Verfügung.
+++ Update 17:00: Das Deadlock-Problem ließ sich nur durch (teilweise hartes) Neustarten diverser GPFS-Master- und aller Rechenknoten lösen. Dadurch sind leider alle Jobs abgebrochen worden, die zu diesem Zeitpunkt liefen. Falls Sie das nicht explizit (durch spezielle Parameter) unterbunden haben, wird der Scheduler solche abgebrochenen Jobs selbständig neu starten. +++
Neue Standards bei OpenMP- und hybriden Programmen
24. Oktober 2024
Zwei neue Umgebungsvariablen für OMP
HLR und Housing in L5|08: Auszeit
30. September 2024
für Arbeiten an der Stromversorgung
Für die endgültige Reparatur der 2000A-Stromschiene des Serverraums muss das HPC-System abgeschaltet werden.