Dank Levovo konnte der Partner DreamWorks Animation sein Rechenzentrum mit einem HPC-Cluster mit Neptune Liquid Cooling ausstatten, der auf aktuelle und zukünftige Anforderungen zugeschnitten ist. Von Versorgungsunterbrechungen durch Corona bis hin zu kurzfristigen und Last-Minute-Änderungen an den Leitungen war kein Hindernis zu groß, um überwunden zu werden, und kein Detail zu klein, um berücksichtigt zu werden.
DreamWorks Animation, bekannt für unzählige unvergessliche Zeichentrickfile, möchte mit jedem Projekt noch größere und eindrucksvollere Geschichten erzählen. Für die Umsetzung dieser ambitionierten Pläne ist High Performance Computing unerlässlich, vor allem in einer Branche, die dem Publikum ständig etwas Neues bieten will.
Zu Beginn dieses Jahres stand das Unternehmen vor einer Herausforderung. Das eigene Rechenzentrum war 22 Jahre alt, was zu Platzproblemen und Engpässen bei der Stromversorgung führte. Das Animationsunternehmen wusste, dass es eine Technologie brauchte, die bei unverändertem Platzbedarf mehr Leistung liefert. Das Ziel bestand darin, dem Platz an der Spitze der CG-Animationstechnologie ohne massive Umgestaltung zu behaupten.
„Wir wissen, dass wir keine zusätzlichen Räumlichkeiten oder mehr Strom bekommen werden. Daher ist die Fähigkeit, mehr Arbeit mit derselben Leistung zu erledigen, für uns in Zukunft immer wichtiger. Als wir von denflüssigkeitsgekühlten Optionen von Lenovo hörten, wurde uns klar, dass wir mehr Dichte und viel mehr Recheneinheiten bekommen können, ohne größere Umbauten vornehmen zu müssen“, so Skottie Miller, Technology Fellow und VP of Platforms and Infrastructure, DreamWorks Animation.
Mit Neptune Liquid Cooling und dem High-Performance-Computing-Cluster von Lenovo konnte DWA die Leistung pro Quadratmeter des bestehenden Rechenzentrums um mehr als das Hundertfache steigern.
In den ersten Gesprächen wurde auch deutlich, dass das Unternehmen mit Lenovo einen Partner hat, der es bei jedem Schritt unterstützt, von der Bereitstellung der Komponenten über die Anpassung vor Ort bis hin zur Feinabstimmung nach der Installation – mit der Möglichkeit, voneinander zu lernen und zu experimentieren.
„Entscheidend bei der Partnerschaft ist, dass wir den Ingenieuren die Möglichkeit bieten, ihre Innovationen erstmals im Einsatz bei einem echten Kunden präsentieren zu können“, so Miller.
Die Änderungen ermöglichen verbesserte Arbeitsabläufe und erlauben Künstlern mehr Interaktivität bei der Erschaffung neuer Welten. Da der DreamWorks Animation Renderer MoonRay skalieren kann, um Kerne auf mehreren Rechnern zu nutzen, bedeutet mehr Leistung mehr Möglichkeiten.
„Statt Minuten oder sogar Stunden auf das Rendering zu warten zu müssen, sehen wir die Ergebnisse jetzt in Echtzeit“, so Scott Chapin, Director, Systems Engineering, DreamWorks Animation.
In Zusammenarbeit mit den Facility Managern von DreamWorks, den Installateuren und sogar den Bauunternehmern, die das ursprüngliche Rechenzentrum gemeinsam mit ihren Subunternehmern gebaut haben, hat Lenovo eine zukunftssichere Vision zum Leben erweckt. „Wir sind stets die Schnittstelle in der Diskussion, und wir betreuen die Anbieter, die wir in ein Projekt einbringen. Das bedeutet, dass wir die Freiheit haben, verschiedene Anbieter zu wählen, um Lösungen mit höherer Leistung und niedrigeren Kosten zu optimieren“, so Jerrod Buterbaugh, Sr. Principal Consultant/Principal Engineer, Data Center Power and Cooling Services von Lenovo.
Das Team fand für alle Probleme eine Lösung, angefangen bei der Planung des besten Weges, auf dem das Wasser den neuen Kühlungswärmetauscher (CDU) erreicht, über die Umsetzung des Plans für das Innere des Gebäudes bis hin zur Integration der neuen Ergänzungen in das Gebäudemanagementsystem.
Dabei war kein Detail zu unbedeutend für eine maßgeschneiderte Lösung. Woche für Woche kehrte Buterbaugh auf den Campus zurück und kümmerte sich um alles, von der Installation der erdbebensicheren Hardware über die Feinabstimmung des Systems bis hin zur Überwachung des Wasseraufbereitungsprozesses. Er hatte Dutzende von Jobs: Klempner, Elektriker, Bauunternehmer, Ingenieur.
„Er war unglaublich gründlich und machte so viele Besuche, wie nötig waren, um unseren Setup wirklich zu verstehen“, so Chapin.
Dieses tiefe Verständnis half Buterbaugh, Änderungen auch in letzter Minute noch geschickt einzuarbeiten.
Die Pläne änderten sich zum Beispiel, als das Installationsteam die Führung der Schläuche für die Flüssigkeitskühlung im Verhältnis zu den Racks änderte. Obwohl Buterbaugh erst am Tag der Änderung davon erfuhr, passte er die Ausrichtung der Leitungen in der CDU innerhalb weniger Stunden an den neuen Plan an.
Die verschiedenen von Lenovo eingesetzten Anbieter haben wie ein eingespieltes Team zusammengearbeitet.
„Dass es sich um externe Partner handelte, ist kaum aufgefallen. Sie waren extrem kompetent und die Zusammenarbeit verlief reibungslos. Wir hatten mehr als eine Woche für die Installation und die Inbetriebnahme eingeplant, aber sie haben nur eineinhalb Tagen gebraucht“, so Balaji Alahari, Manager, Storage Operations, DreamWorks Animation. „Die Geschwindigkeit und Effizienz der Installation hat uns nachhaltig beeindruckt.“
Die globale Pandemie stellte eine noch nie dagewesene Herausforderung dar. Lenovo begegnete den Bestimmungen zur Kapazitätsbegrenzung im Rechenzentrum mit innovativen Verfahren: Als beispielsweise Firmware-Probleme auftraten, entwickelte Lenovo ein Verfahren, mit dem Netzteile bei laufendem Cluster ausgetauscht werden konnten, sodass keine Ausfallzeiten entstanden.
Innerhalb einer Woche nach dem Einschalten renderten die neuen Systeme bereits Produktionsaufträge. DreamWorks konnte mit dem Neptune-Cluster eine 20%ige Leistungssteigerung im Vergleich zu den herkömmlichen luftgekühlten Servern in der Renderfarm feststellen, was zum Teil der Flüssigkeitskühlung zu verdanken ist, die die Drosselung aufgrund von Überhitzung reduziert.
„Mit einem 22 Jahre alten Rechenzentrum fast 42 Kilowatt pro Rack zu erreichen, ist einfach genial“, so Alahari.
Das System hat seitdem eine Feuerprobe bestanden, und das im wahrsten Sinne des Wortes. Ein lokal begrenzter Brand verursachte im September einen kurzen Ausfall im Rechenzentrum. Nach dem Wiederhochfahren des Systems war das Team überrascht, dass es bei keinem der neuen HPC-Server Fehler gab.
Letztendlich hat das Lenovo-Team nicht nur leistungsstarke Technologie geliefert, sondern auch durchdachtes Fachwissen und ein offenes Ohr für die Anliegen von DreamWorks, selbst als die Projektbesprechungen nur noch online stattfinden konnten.
„Mir ist aufgefallen, wie persönlich der Kontakt war, obwohl wir ein großes System von einem riesigen Unternehmen erworben haben. Unsere Ansprechpartner haben sich für unseren Erfolg engagiert, sie wollten helfen und haben den Prozess komplett reibungslos gestaltet“, so Miller.
Auf die Frage, welchen Rat er einem anderen Unternehmen geben würde, das mit dem Gedanken spielt, in den Bereich der Flüssigkeitskühlung einzusteigen, hat Miller eine einfache Antwort.
„Haben Sie keine Angst davor, neue Wege zu gehen. Unternehmen mit veralteten Rechenzentren schrecken häufig grundlos vor großen Änderungen zurück. Dank des Teams von Lenovo hat es bei uns funktioniert und für mehr Leistung gesorgt.“