Huawei und Deepseek -Launch CloudMatrix 384 Supernode: Ein neuer Benchmark für die AI -Computerleistung
Vor kurzem haben Huawei und Deepseek gemeinsam ihre Hauptprodukte veröffentlichtCloudMatrix 384 SuperknotenMarkierung des Eintritts der AI -Computerleistungsinfrastruktur in eine neue Ära. Diese bahnbrechende Technologie integriert die Hardwarevorteile von Huawei und Deepseeks Algorithmus-Innovationsfunktionen und bietet Super-Computer-Leistungsunterstützung für groß angelegte KI-Schulungen.
1. Kernleistungsparameter
Index | Parameter |
---|---|
Computereinheit | 384 Ascend 910b -Prozessor |
Rechenleistungskala | 147,5 PFLOPS (FP16) |
Internetbandbreite | Huaweis selbst entwickelte Edge-Interconnect-Architektur mit einer Bandbreite von bis zu 768 GB/s |
Energieeffizienzverhältnis | 1.2tflops/w |
Unterstützt die Modellgröße | Überschreitende Billionen-Dollar-Parameter großes Modelltraining |
2. Highlights technologischer Durchbrüche
1.Heterogene Computerarchitektur: Durch die tiefe Integration von Huawei Atlas 900 POD und Deepseek Distributed Training Framework wird die Nutzungsrate der Rechenressourcen um 40%erhöht.
2.Dynamische elastische Planung: Unterstützen Sie die Echtzeit-Expansion und Reduzierung von Trainingsaufgaben, wobei die Fehlerzeit für die Fehlerversicherung bis Sekunden verkürzt wird
3.Grüne energiesparende Design: Verwenden Sie flüssiggekühlte Wärmedissipationstechnologie mit PUE-Wert von nur 1,08
3.. Branchenanwendungsaussichten
Anwendungsbereiche | Typische Fälle |
---|---|
Autonomes Fahren | Unterstützt die parallele Verarbeitung von Simulationstrainingsdaten bei 10 Millionen Kilometern |
Drogenentwicklung | Die Simulationseffizienz der Molekulardynamik beträgt 300 Mal |
Finanztechnologie | Es kann die Iteration von Hochfrequenzhandelsstrategien auf Millisekundenebene erkennen |
AIGC | Unterstützung wöchentlicher Schulung von 50 Milliarden Parameter Multimodal Large Modell |
4. Vergleich von Marktprodukten
Produkt | Rechenleistung (PFLOPS) | Energieeffizienzverhältnis | Knotenskala |
---|---|---|---|
CloudMatrix 384 | 147,5 | 1.2tflops/w | 384 Knoten |
Nvidia DGX H100 | 132 | 0,9tflops/w | Knoten 256 |
Google TPU V4 | 120 | 1.1tflops/w | 2048 Chip |
5. Fortschritte bei der ökologischen Konstruktion
Derzeit haben mehr als 20 führende Unternehmen den CloudMatrix -Ökosystemplan beigetreten, darunter:
- Akademische Institutionen: Institut für Automatisierung, Chinesische Akademie der Wissenschaften, Institut für intelligente Industrie, Universität Tsinghua
- Cloud -Dienstanbieter: Alibaba Cloud, Tencent Cloud, Vulcano Engine
- Branchenbenutzer: Xiaopeng Motors, Wuxi Apptec, Ping A.
6. Expertenmeinung
Der Generalsekretär der Entwicklung der China-Entwicklungs Allianz der China Artificial Intelligence Industry sagte: "Der Start von CloudMatrix 384 füllt die Lücke im Bereich der inländischen AI-Computer-Power-Infrastruktur auf dem Gebiet der Super-Large-Scale-Cluster und der innovativen heterogenen, kollaborativen Architektur, die eine neue Paradigmas für die Branche liefert."
Laut offiziellen Berichten wird die erste Charge von Superknoten in der SHANGHAI LINGANG COURTING POWER HUB und GUI'AN HUAWEI COLUD -Rechenzentrum im zweiten Quartal 2024 eingesetzt, und die jährliche Produktionskapazität wird voraussichtlich 50 Superknotencluster erreichen.
Überprüfen Sie die Details
Überprüfen Sie die Details