Die Reihe der Lichtenberg-Hochleistungsrechner an der TU Darmstadt stellt Wissenschaftlerinnen und Wissenschaftlern deutscher Hochschulen und öffentlicher Forschungseinrichtungen Rechenressourcen zur Verfügung. Die vielfältigen Architekturen der Hochleistungsrechner-Reihe bieten beste Voraussetzungen für eine flexible und effiziente Nutzung und insbesondere für rechenintensive Anwendungen.
Mitte Juli 2023 wurde der Lichtenberg II-Hochleistungsrechner der TU Darmstadt offiziell in Betrieb genommen. Ausgestattet mit neuester Technologie setzt er Maßstäbe bei Leistung und Energieeffizienz und bietet damit beste Voraussetzungen für exzellente Forschung. Unser zweiminütiger Film gibt Einblicke in die feierliche Einweihung und einen Rundgang durch den Hochleistungsrechner.
Im Jahr 2020 wurde die erste Ausbaustufe des Lichtenberg II-Systems mit 643 Rechenknoten in Betrieb genommen, die mit der zweiten Ausbaustufe um 581 Rechenknoten erweitert wird. Damit stellen beide Ausbaustufen zusammen eine theoretische Spitzenleistung von circa 8,5 Petaflops pro Sekunde (PFlop/s) durch Prozessoren und 1,7 Petaflops pro Sekunde durch Akzeleratoren zur Verfügung. Der Hauptspeicher beträgt in Summe 563 Terabyte, das Storagesystem für Daten rund 6 Petabyte.
Energieeffiziente Rechnersysteme und eine nachhaltige Nutzung sind wesentliche Ziele für die TU Darmstadt. Daher wird die Abwärme des Lichtenberg II nicht einfach an die Umwelt abgegeben, sondern während der Heizperiode zu einem erheblichen Teil in das Fernwärmenetz eingespeist, das auf dem Campus Lichtwiese alle Gebäude miteinander verbindet.
Der Lichtenberg II nutzt dafür eine direkte und hocheffiziente Warmwasserkühlung, um die Leistung der Prozessoren voll ausfahren zu können. Dabei werden durch spezielle Wärmetauscher und Kühlmittelverteiler hohe Rücklauftemperaturen von über 45 Grad Celsius ermöglicht, um eine sinnvolle Nachnutzung der Energie und effiziente Kühlung zu sichern. Dies führt zu einer deutlich verbesserten CO2- und Energiebilanz und ist ein wichtiger Schritt in Richtung nachhaltiges Hochleistungsrechnen.
Das Gesamtsystem Lichtenberg II (alle Ausbaustufen zusammen) wurde vom Bund und vom Land Hessen in Summe mit rund 15 Mio. Euro gefördert (Förderung nach Art. 91b GG).
Das berät bei der effizienten Nutzung der Rechnersysteme und bietet Schulungen an. Hessische Komptenzzentrum für Hochleistungsrechnen
Ausfall TURZ-L5|08 nach Brand an Stromschiene [Update 2025-04-14]
25. März 2025
Betroffen sind Lichtenberg-HLR sowie Housing
Aufgrund eines Brandes am Stromschienensystem musste der Serverraum TURZ-L5|08 vom Stromnetz genommen werden. Der Betrieb der Netzwerkinfrastruktur, des Hochleistungsrechners sowie der Server der Institute, Fachgebiete bzw. Einrichtungen im Housingbereich konnte daher nicht mehr aufrechterhalten werden.
Vorbereitung der Umstellung auf RedHat EL 9
24. Februar 2025
Neue Hauptversion des Cluster-Betriebssystems
Einige Login- und Rechenknoten sind bereits auf RHEL 9.4 umgestellt
Behoben: Ausfall des cluster-weiten Filesystems
04. November 2024
Der Fehler ist behoben, das System steht wieder zur Verfügung.
+++ Update 17:00: Das Deadlock-Problem ließ sich nur durch (teilweise hartes) Neustarten diverser GPFS-Master- und aller Rechenknoten lösen. Dadurch sind leider alle Jobs abgebrochen worden, die zu diesem Zeitpunkt liefen. Falls Sie das nicht explizit (durch spezielle Parameter) unterbunden haben, wird der Scheduler solche abgebrochenen Jobs selbständig neu starten. +++