banner
Heim / Nachricht / Wie sich KI-Optimierung auf das Design von Rechenzentren auswirkt
Nachricht

Wie sich KI-Optimierung auf das Design von Rechenzentren auswirkt

Jun 25, 2023Jun 25, 2023

von Colin Ryan

Vor 2 Tagen

Tate Cantrell. Bild: Pawel Swider

Tate Cantrell von Verne Global erörtert die Auswirkungen, die KI auf das Design von Rechenzentren hat, von komplexen Kühlanforderungen bis hin zu Sicherheitsprotokollen auf NATO-Ebene.

Kürzlich teilte Meta Einzelheiten zu seinen Plänen für KI-Fortschritte mit, zu denen ein KI-optimiertes Rechenzentrumsdesign gehörte, und erklärte, dass das neue Design „flüssigkeitsgekühlte KI-Hardware und ein leistungsstarkes KI-Netzwerk unterstützen wird, das Tausende von KI-Chips für Rechenzentren verbindet“. -skalierte KI-Trainingscluster“.

Das Unternehmen gab außerdem an, dass das neue Design schneller und kostengünstiger zu bauen sei. Aber wie wirkt sich die KI-Optimierung tatsächlich auf die Feinheiten des Rechenzentrumsdesigns aus?

Um das herauszufinden, haben wir mit Tate Cantrell, Chief Technology Officer bei Verne Global, gesprochen, der uns einen Einblick in die vielen Möglichkeiten gab, wie sich das Design von Rechenzentren ändert, um eine geeignete KI-Betriebsfähigkeit zu ermöglichen.

„Das Design von Rechenzentren ist eine komplexe Aufgabe, bei der es darum geht, Strombedarf, Kühlanforderungen, hohe Sicherheit, extreme Zuverlässigkeit und Hochgeschwindigkeitszugriff auf Netzwerke in Einklang zu bringen“, sagte Cantrell.

„KI-Modelle erfordern eine viel höhere Rechenintensität und -dichte und fügen den Herausforderungen des traditionellen Rechenzentrumsdesigns eine neue Dimension der Komplexität hinzu.“

Laut Cantrell sind einige der Kernparameter, die durch das Hosten von KI-Modellen beeinflusst werden, die Stromquelle und die Zuverlässigkeit; der Bedarf an Server-Racks mit höherer Dichte; und Skalierbarkeit.

„Ein herkömmliches Rechenzentrum, das nicht für diese extremen Bedingungen ausgelegt ist, wird keine zuverlässige Leistung bieten können. Letztlich benötigt die Rechenzentrumsbranche ein verändertes Rechenzentrumsdesign, um mit den Anforderungen der KI-Technologie Schritt halten zu können.“

Aber warum benötigen KI-Modelle eine hohe Rechendichte? Cantrell sagte, dies liege daran, dass KI-Computing „Netzwerkverbindungen mit extrem geringer Latenz zwischen Servern im Rechenzentrum“ erfordere.

„Vor einigen Jahren lag die durchschnittliche Rackdichte bei 5 kW pro Rack. Doch die neueste Generation von KI-Supercomputern stellt weitaus höhere Anforderungen an die Rechenzentrumsinfrastruktur.

„Nur vier dieser Systeme in einem Rack könnten mehr als 40 kW verbrauchen und dabei nur 60 Prozent des Platzes eines typischen Computer-Racks beanspruchen. Wenn Rechenzentren also effektiv mit KI-Hardware umgehen können, müssen sie in der Lage sein, diese Art von Rechenleistung mit hoher Dichte zu bewältigen.“

Laut Cantrell sind die meisten herkömmlichen Rechenzentren nicht für die „enorme“ Rechenleistung gerüstet, die für das Training neuronaler KI-Netze erforderlich ist, insbesondere im Hinblick auf die Kühlung.

Während herkömmliche Rechenzentren zur Kühlung auf weit auseinander liegende Server-Racks angewiesen sind, erfordern maschinelle Lernanwendungen nahe beieinander platzierte Racks, da dadurch die Latenz und Bandbreitenkapazität zwischen Servern optimiert und gleichzeitig die Gesamtkosten der Bereitstellung minimiert werden.

„Um die Komplexität noch zu erhöhen, können luftgekühlte Systeme, die zu nah beieinander positioniert sind, zu Kühldefiziten führen, da die extremen Luftstromanforderungen von Servern mit hoher Kapazität gegeneinander blasen und einen Gegendruck auf die Kühlventilatoren innerhalb der Ausrüstung erzeugen können“, so Cantrell hinzugefügt.

„Rechenzentren müssen daher den finanziellen Druck einer Reduzierung der Stellfläche der Datenhalle mit der Notwendigkeit in Einklang bringen, ausreichend Platz für eine ordnungsgemäße Kühlung bereitzustellen.

„Dies wird einer der Gründe sein, warum sich die zunehmende Einführung der Flüssigkeitskühlung beschleunigt.“

Als ob komplexe Kühlanforderungen nicht genug wären, müssen Rechenzentren laut Cantrell auch „strukturell in der Lage sein, schweres Gerät zu transportieren“, um den Transport schwerer KI-Rechnerschränke zu ermöglichen, die bei vollständiger Konfiguration mehr als 1,5 Tonnen wiegen könnten.

„Auch KI selbst spielt eine Rolle, wenn es um die Sicherheit von Rechenzentren geht.“

Cantrell sagt, dass die Infrastruktur von Rechenzentren den Anforderungen an „Konnektivität, Agilität und Skalierbarkeit“ gerecht werden muss, um die immer größeren Datensätze, auf denen KI-Modelle trainiert werden, aufzunehmen und zu analysieren.

„Diese Anforderungen werden sich ändern, wenn neue Anwendungen entwickelt, alte Anwendungen außer Dienst gestellt und Arbeitslasten an die aktuellen Geschäftsanforderungen angepasst werden.

„Gleich bleibt, dass alles so gestaltet sein muss, dass es für jede Anwendung die optimale Leistung bietet.“

Cantrell glaubt außerdem, dass Unternehmen damit beginnen werden, „ihre eigenen parallelen proprietären Engines zu entwickeln, um ihren Wettbewerbsvorteil auf dem Markt zu behalten“, und fügt hinzu, dass Unternehmen wie Google und Microsoft um den Betrieb und die Schulung dieser unabhängigen Systeme konkurrieren und gleichzeitig „ein Daten-Ökosystem anbieten“. Quellen, die mit den vertraulichen Schulungsinformationen eines Unternehmens verknüpft werden können“.

„Dieser Wettbewerb um die Entwicklung paralleler Rechenressourcen wird die Branche zu Innovationen wie der Wissensdestillation auf Algorithmusebene und Innovationen wie Flüssigkeitskühlung auf der Rechenzentrumsebene treiben.“

Was die Konnektivität betrifft, sagt Cantrell, dass Rechenzentren „Ost-West-Spine- und Leaf-Netzwerke mit geringer Latenz benötigen, die sowohl den Produktionsverkehr als auch den maschinellen Lernteil der KI unterstützen können“.

Neben der Anpassung der Netzwerkinfrastruktur und der internen Umstrukturierung bringt die Präsenz von KI-Modellen in Rechenzentren auch besondere Sicherheitsaspekte mit sich.

Cantrell sagte, es sei von entscheidender Bedeutung, dass Rechenzentren „der physischen Sicherheit geschäftskritischer KI-Ressourcen Vorrang einräumen“.

„Wenn jemand Zugriff auf das Modell und, was noch wichtiger ist, auf die mit dem Modell verbundenen Gewichte erhält, könnte er leicht Zugriff auf die Zusammensetzung aller Daten erhalten, die in das Training des KI-Modells eingeflossen sind.“

Cantrell nannte dies als Grund dafür, warum der isländische Rechenzentrumscampus von Verne Global auf einem hochsicheren ehemaligen NATO-Stützpunkt errichtet wurde.

Er fügte hinzu, dass der Schutz dieser KI-Ressourcen mehrere Sicherheitsebenen erfordert, darunter „strenge Identifikationsprotokolle, mehrere Angriffspunkte, Videoüberwachung, physische Patrouillen und Personal vor Ort rund um die Uhr sowie Serverkäfige, Sicherheitsregale und biometrische Erkennung“.

„Auch KI selbst spielt eine Rolle, wenn es um die Sicherheit von Rechenzentren geht. Die Technologie kann Cyberangriffe in einer Geschwindigkeit und einem Ausmaß untersuchen, profilieren und erkennen, die für Menschen einfach nicht möglich sind.“

10 Dinge, die Sie jeden Wochentag direkt in Ihren Posteingang wissen müssen. Melden Sie sich für anTäglicher Brief, Silicon Republics Zusammenfassung wichtiger Wissenschafts- und Technologienachrichten.

Im Detail: Mehr über Verne Global

Verwandte Themen: Energiespeicherung, Rechenzentren, Daten, Verne Global, KI, Datenspeicherung, Brand Insights

Colin Ryan ist Texter/Lektor bei Silicon Republic

[email protected]

21. Juli 2023

26. Mai 2023

27. März 2023

17. Juli 2023

27. Juli 2023

10. Juli 2023

Vor 1 Tag

Vor 1 Tag

Vor 1 Tag

Vor 1 Tag

Vor 1 Tag

Vor 1 Tag

Vor 1 Tag

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

Vor 2 Tagen

vor 3 Tagen

vor 3 Tagen

vor 3 Tagen

Umstrukturierung der Infrastruktur 10 Dinge, die Sie jeden Wochentag direkt in Ihren Posteingang wissen müssen. Melden Sie sich für anTäglicher Brief, Silicon Republics Zusammenfassung wichtiger Wissenschafts- und Technologienachrichten.