L’approche collaborative et transparente de Lenovo a permis à son partenaire DreamWorks Animation d’équiper sa centrale de données d’un cluster HPC avec le système de refroidissement liquide Neptune conçu pour répondre à leurs besoins actuels et anticiper les futurs. Des ruptures d’approvisionnement dues à la crise du COVID-19 aux changements de dernière minute sous le capot, aucun obstacle n’était trop grand pour être surmonté, et aucun détail trop petit pour être traité.
Un géant de l’animation dont les franchises sont adorées de tous, DreamWorks Animation se doit de se dépasser à chaque projet. Le calcul haute performance est essentiel à la réalisation de cette vision audacieuse, en particulier dans un secteur qui lutte sans cesse pour montrer de nouvelles choses au public.
En début d’année, l’entreprise a dû relever un défi de taille. Sa centrale de données avait 22 ans, ce qui lui posait des problèmes d’espace et des contraintes d’alimentation. Pour ce champion de l’animation, il était essentiel de trouver une solution efficace qui ne s’étendrait pas au-delà des locaux existants, afin de rester à la fine pointe des technologies d’animation par ordinateur qui font sa renommée, sans devoir procéder à un remaniement complet.
« Nous savons que nous ne disposerions pas de plus d’espace et qu’il était peu probable que nous obtenions plus de puissance, donc notre capacité à effectuer plus de travail avec le même nombre de watts était de plus en plus critique pour l’avenir. Lorsque nous avons commencé à entendre parler des options de refroidissement liquide de Lenovo, nous avons réalisé que nous pouvions obtenir plus de densité et de puissance de traitement sans avoir à faire de grandes rénovations », indique Skottie Miller, Technology Fellow et VP des plateformes et de l’infrastructure de DreamWorks Animation.
Grâce au système de refroidissement liquide Neptune et au cluster de calcul haute performance de Lenovo, DWA a pu multiplier par plus de cent la quantité d’énergie tirée par mètre carré de sa centrale de données existante.
Les premières réunions ont permis d’établir clairement qu’avec Lenovo, ils auraient un partenaire qui répondrait à leurs besoins à tous les niveaux, de la préparation des composants aux ajustements sur site, en passant par la mise au point après installation, avec la possibilité d’apprendre les uns des autres et d’expérimenter en cours de route.
« L’un des éléments clés de notre partenariat avec Lenovo est de servir de laboratoire vivant et d’organe de réflexion pour les innovations que les ingénieurs de Lenovo veulent mettre en place auprès d’un véritable client », explique S. Miller.
Ces modifications permettent d’améliorer les flux de travail et d’offrir aux artistes une plus grande interactivité lorsqu’ils travaillent à l’élaboration de nouveaux mondes. Étant donné que le moteur de rendu de DreamWorks Animation, MoonRay, peut être redimensionné pour utiliser les processeurs de plusieurs machines, plus de puissance signifie plus de possibilités.
« Tout à coup, vous voyez des images qui prendraient des minutes, voire des heures, produites en temps réel sous vos yeux », nous confie Scott Chapin, directeur, ingénierie des systèmes chez DreamWorks Animation.
En association avec les gestionnaires des installations de DreamWorks, leurs plombiers, les entrepreneurs qui ont construit la centrale de données originale et d’autres fournisseurs auxquels elle fait déjà appel, Lenovo a donné vie à une vision porteuse d’avenir. « Nous jouons toujours le rôle d’interface dans la discussion, et nous gérons les fournisseurs que nous faisons intervenir dans un projet, ce qui signifie que nous sommes libres de choisir différents fournisseurs, afin d’optimiser des solutions à haut niveau de rendement et à petit prix », indique Jerrod Buterbaugh, Sr. Consultant principal/ingénieur principal, Services d’alimentation et de refroidissement de la centrale de données.
L’équipe a résolu les problèmes à chaque stade, de la conception du meilleur itinéraire pour que l’eau atteigne le nouvel échangeur thermique de refroidissement (CDU), à l’exécution physique de ce plan dans les entrailles du bâtiment, à l’intégration de nouvel équipement aux systèmes de gestion technique du bâtiment.
Et aucun détail n’était trop petit pour une solution sur mesure. Semaine après semaine, Buterbaugh est retourné sur le campus pour s’occuper de tout, de l’installation de matériel antisismique personnalisé à la mise au point du système, en passant par la supervision du processus de traitement de l’eau. Il a porté des dizaines de casquettes : plombier, électricien, entrepreneur, ingénieur.
« Il a été incroyablement minutieux et a effectué autant de visites qu’il le fallait pour bien comprendre nos installations », déclare Chapin.
Cette profonde compréhension a permis à Buterbaugh de s’adapter habilement aux changements de dernière minute.
Les plans ont changé, par exemple, lorsque l’équipe d’installation a modifié – pour le mieux – le positionnement des tuyaux de refroidissement liquide par rapport aux racks. Bien qu’il ait été informé du changement le jour même, Buterbaugh a modifié l’orientation des tuyaux dans le CDU en quelques heures seulement, pour les adapter au nouveau plan.
Les différents fournisseurs réunis par Lenovo étaient tellement en phase qu’ils semblaient ne former qu’une seule entité.
« Nous n’aurions pas été capables de dire qu’il s’agissait d’un intervenant extérieur. La collaboration avec l’équipe était efficace; et ses membres extrêmement compétents. Nous avions prévu plus d’une semaine pour l’installation et la mise en service, et elles ont été effectuées en un jour et demi », nous déclare Balaji Alahari, responsable des opérations de stockage chez DreamWorks Animation. « Nous avons été très impressionnés par la rapidité et l’efficacité de l’installation. »
La pandémie mondiale a ajouté une série de défis sans précédent. Lenovo a respecté les règles limitant la capacité de la centrale de données en innovant dans de nouvelles procédures : lorsque des problèmes de firmware sont survenus, par exemple, Lenovo a inventé un processus permettant de remplacer les blocs d’alimentation sans affecter le fonctionnement du cluster, éliminant ainsi les temps morts dus à l’entretien.
Une semaine après leur mise en service, les nouveaux systèmes effectuaient le rendu des travaux de production. DreamWorks a constaté une augmentation de 20 % des performances du cluster Neptune par rapport aux serveurs traditionnels refroidis à l’air de sa plateforme de traitement, grâce notamment à la technologie de refroidissement liquide qui a permis d’atténuer les ralentissements dus à la surchauffe.
« Pouvoir tirer près de 42 kilowatts par rack dans une centrale de données vieille de 22 ans est une chose impressionnante », précise Alahari.
Le système a depuis survécu à l’épreuve du feu, littéralement. Un incendie local a provoqué une brève panne de la centrale de données en septembre. Lorsque le système a été remis sous tension, l’équipe a été surprise de constater que pas un seul des nouveaux serveurs HPC n’était tombé en panne.
En fin de compte, l’équipe de Lenovo a non seulement fourni des technologies puissantes, mais aussi une expertise réfléchie et une écoute attentive. Elle a rejoint DreamWorks là où la société se trouvait, même lorsque les réunions de projet sont passées du mode présentiel au mode en ligne.
« L’une des choses qui me frappe, c’est que même si nous avons acheté un gros système à une multinationale, nous avons eu affaire à des individus. Les personnes qui travaillaient avec nous sur le terrain étaient des gens qui voulaient que nous réussissions, que nous voulions aider, et qui ont tout simplement rendu le processus très fluide », a ajouté Miller.
Lorsqu’on lui a demandé quel conseil il donnerait à une autre entreprise qui envisage de se lancer dans le domaine du refroidissement liquide, la réponse de M. Miller fut simple.
« N’ayez pas peur de plonger dans l’inconnu. Je sais que beaucoup de sites dotés de centrales de données d’un certain âge craignent de procéder à de grands changements. Celui-ci a non seulement fonctionné, il a aussi augmenté notre performance. Et c’est grâce à l’équipe Lenovo que nous pouvons vanter cette fière réussite. »