Lenovo erweitert HPC-Cluster „LISE“ am Zuse-Institut Berlin

Read in: English German

Stuttgart, 7. Dezember 23 – Lenovo erweitert das HPC-System „LISE“ am Zuse-Institut Berlin (ZIB), einer interdisziplinären Forschungseinrichtung für angewandte Mathematik und datenintensives High-Performance-Computing (HPC). Seit Ende März sind die GPU-Partitionen bereits für Nutzer zugänglich, während die Installation der CPU-Partition für Anfang nächsten Jahres geplant ist. Besonderer Fokus liegt dabei auf der Verbesserung der Energieeffizienz. Lenovo setzt dafür auf innovative Technologien, einschließlich der Neptune-Warmwasserkühlung, während der HPC-Partner pro-com für eine nahtlose Integration in das bestehende System sorgt. Diese Erweiterung versorgt Forschende mit der nötigen Leistung, um rechenintensive Anwendungen wie künstliche Intelligenz und maschinelles Lernen auszuführen.

Technologie und Nachhaltigkeit

Das LISE-System wurde Ende 2019 in Betrieb genommen und im Laufe dieses Jahres aufgrund gestiegener Anforderungen an GPU-Ressourcen um Partitionen mit GPUs von NVIDIA und Intel erweitert. Die NVIDIA-GPU-Partition besteht aus 42 Rechenknoten, von denen jeder 4 NVIDIA A100/80 GPUs enthält. Die Intel GPU-Partition hingegen umfasst 8 Rechenknoten, von denen jeder mit 4 Intel MAX GPUs (frühere Bezeichnung „Ponte Vecchio“) ausgestattet ist. Bei beiden Partitionen kommt Lenovo-Hardware zum Einsatz.

Als Host-CPUs werden Intel IceLake bzw. Sapphire Rapids in einer Dual-Socket-Konfiguration verwendet. Die GPU-Rechenknoten sind über InfiniBand (200 Gb/s) vernetzt und greifen über Gateway-Knoten auf die globalen parallelen Dateisysteme HOME und WORK im Omni-Path-Netzwerk zu.

Die NVIDIA GPU-Partition ist seit Ende März für die Nutzer zugänglich, während die Intel-Partition aktuell für den Betrieb vorbereitet wird. Beide GPU-Partition sollen für vier bis fünf Jahre genutzt und ab 2025 um neue heterogene Prozessorarchitekturen erweitert werden.

Des Weiteren ist die Installation einer energieeffizienten CPU-Partition mit 168 Knoten für Ende 2023/ Anfang 2024 geplant. Zum Einsatz kommt das ThinkSystem SD665 V3 von Lenovo mit AMD EPYC Prozessoren der 4. Generation (frühere Bezeichnung „Genoa“) und eingebauter Neptune Warmwasserkühlung.

Server racks with Lenovo logos and green lights switched on

Abhängig von Workload, Vorlauftemperatur und Umgebungstemperatur liegt der Effizienzwert des Systems bei 85-90%. Durch den Einsatz der Lenovo Extreme Heat Recovery Lösung mit wassergekühlten Netzteilen und isolierten, wassergekühlten Rücktüren der HPC-Racks wird die Effizienz noch weiter gesteigert und mehr als 97% der Wärme in den Warmwasserkreislauf statt ins Rechenzentrum abgeführt. Dies steigert die Energiebilanz des Rechenzentrums, da eine zusätzliche Raumkühlung überflüssig wird.

Gegenwärtig wird außerdem in einer Machbarkeitsstudie die Nachnutzung der Abwärme für das Fernwärmenetz oder die lokale Nutzung im ZIB geprüft.

Anwendungen

Auf dem LISE-System des ZIB werden vielfältige Anwendungen aus verschiedenen Wissenschaftsdisziplinen betrieben. Insbesondere unterstützt das ZIB Forschungsinitiativen in den Bereichen Lebenswissenschaften, Chemie- und Materialwissenschaften, Erdsystemwissenschaften und Ingenieurswissenschaften (CFD).

Die GPU-Ressourcen spielen eine zentrale Rolle in den Projekten, die Methoden der Künstlichen Intelligenz (KI) und des Maschinellen Lernens in Simulationen und der Methodenentwicklung einsetzen. Zwei Beispiele, die traditionelle Simulationsmethoden mit KI-Ansätzen verknüpfen, sind die Medikamententwicklung sowie die Untersuchung der Dynamik von Proteinstrukturen:

Das erste Projekt beschäftigt sich mit der in-silico-Suche nach neuen Opioiden ohne gefährliche Nebenwirkungen. Hierbei werden komplexe atomistische Simulationen mit KI-Methoden gekoppelt, um effektiv Kandidaten und ihre Wirkmechanismen zu identifizieren.

In einem weiteren Projekt des ZIB in Zusammenarbeit mit der Freien Universität Berlin werden neue atomistisch-basierte Proteinmodelle mithilfe von KI-Ansätzen verfeinert. Ziel ist es, wichtige strukturabhängige Wirkungsweisen von Proteinen, die sich erst auf einer längeren Zeitskala entwickeln, zu simulieren.

Pictoral representation of protein project

Finanzierung und Netzwerk

Das ZIB ist eines von neun NHR-Zentren im Verbund für Nationales Hochleistungsrechnen. Dieser zielt darauf ab, die Hochleistungsrechenkapazitäten für Forschung und Entwicklung in Deutschland weiter auszubauen. Durch die Zusammenarbeit und Vernetzung von Hochleistungsrechenzentren im NHR-Verbund wird die Effizienz und der Zugang zu leistungsstarker Recheninfrastruktur für Wissenschaftler und Forscher in ganz Deutschland erhöht. Der HPC Cluster LISE nimmt eine bedeutende Rolle in diesem Netzwerk ein und hilft dabei, Deutschland als Innovationskraft im Bereich des Hochleistungsrechnen zu etablieren. Im Zuge dieses Programmes und durch die finanzielle Unterstützung durch Bund und Länder wird LISE nun weiter ausgebaut.

Zitate

„Für das Zuse-Institut Berlin ist seit Jahren der energieeffiziente Betrieb seiner leistungsfähigen HPC-Ressourcen von besonderer Wichtigkeit und treten gleichberechtigt neben hohe Rechenleistung und effizienten Betrieb“, ergänzt Thomas Steinke, Leiter der Abteilung Supercomputing am ZIB. „Mit Hinblick auf die Nachhaltigkeit und die Energiekostenentwicklung haben wir uns für technologische Lösungen von Lenovo entschieden, mit denen wir unsere Ansprüche sowohl an starker Rechenleistung durch neueste Prozessorgenerationen als auch an hoher Energieeffizienz der CPU- und GPU-Plattformen aufgrund der direkten Warmwasserkühlung erfüllen können. Wir freuen uns, dass wir mit Lenovo und der pro-com DATENSYSTEME GmbH starke Partner bei der Umsetzung unserer Pläne gefunden haben.“

„Wir freuen uns, dass uns das Zuse-Institut Berlin gemeinsam mit der pro-com DATENSYSTEME GmbH für die Erweiterung ihres HPC-Clusters „LISE“ ausgewählt hat, um die Forschung in Deutschland weiter voranzubringen“, kommentiert Andreas Thomasch, Director HPC & AI DACH, France, UKI bei Lenovo. „Diese Wahl unterstreicht unser Engagement für technologischen Fortschritt durch den warmwassergekühlten Einsatz neuester Intel GPUs und NVIDIA GPUs sowie AMD und Intel CPUs, verbunden mit unserer Verpflichtung zu nachhaltigen und effizienten Lösungen im Bereich des High-Performance-Computing. Durch unsere innovative Neptune-Warmwasserkühlung steigern wir die Rechenleistung des Clusters für einen noch schnelleren Erkenntnisgewinn der Wissenschaftler und reduzieren gleichzeitig die Umweltbelastung.“

[ssba]

MWC 2024

Experience breakthrough technology solutions and see how we're transforming, connecting, and empowering the world with AI for all.

Join us Feb. 26-29
Don't Miss StoryHub Updates: