Nvidia GTC Taipei 2026: Vera Rubin geht in Serie

vor 7 Stunden
4 Min. Lesezeit

Nvidia hat auf der GTC Taipei im Rahmen der COMPUTEX die Serienproduktion seiner Vera-Rubin-Plattform angekündigt und damit die im März vorgestellte Architektur vom Konzept in die Massenproduktion überführt. CEO Jensen Huang präsentierte vor ausverkauftem Taipei Music Center ein Programm, das sich um drei Schwerpunkte dreht: den Produktionsanlauf der nächsten Chipgeneration, die Ausweitung der KI-Agenten-Strategie vom Rechenzentrum bis auf den Desktop und die Vertiefung des taiwanesischen Ökosystems, das die physische Grundlage für Nvidias KI-Fabriken bildet.

Huang machte den wirtschaftlichen Treiber hinter dem Tempo deutlich: Die Nachfrage nach Token sei derzeit extrem hoch, und weil Token inzwischen zu einem profitablen Umsatzträger geworden seien, wollten KI-Unternehmen deutlich mehr davon erzeugen und zusätzliche KI-Fabriken bauen. Genau dieser Boom bei der Token-Produktion lasse den Bedarf an Rechenleistung explosionsartig ansteigen.

Vera Rubin: Vom Konzept in die Massenproduktion

Herzstück der Keynote war die Ankündigung, dass die Vera-Rubin-Plattform in die Serienproduktion geht. Das System verbindet fünf spezialisierte Racks zu einem einzigen KI-Supercomputer für agentenbasierte Workloads und liefert laut Nvidia die zehnfache Agenten-Durchsatzleistung im Vergleich zur Vorgängergeneration Grace Blackwell. Über 150 Zulieferer allein in Taiwan, verteilt auf mehr als 350 Fabriken in 30 Ländern, fertigen Vera-Rubin-basierte Systeme. Zu den Systemherstellern gehören Dell Technologies, HPE, Lenovo und Supermicro sowie taiwanesische Partner wie Foxconn, GIGABYTE, Quanta Cloud Technology und Wiwynn. Produktionslieferungen sollen im Herbst 2026 beginnen.

Begleitet wird der Ramp-up von zwei neuen Infrastrukturbausteinen. Die DSX-Plattform gibt Infrastrukturbetreibern erstmals ein vollständiges Handbuch aus Software-Bibliotheken, Referenzdesigns und beschleunigter Hardware für Planung, Aufbau und Betrieb großer KI-Fabriken. Spectrum-X Ethernet Photonics, die erste Switch-Technologie auf Basis von Co-Packaged Optics mit 200 Gb/s SerDes, ist bereits in Produktion und verspricht die fünffache Energieeffizienz gegenüber herkömmlichen Transceiver-Netzwerken. CoreWeave, Lambda und Oracle Cloud Infrastructure gehören zu den ersten Abnehmern.

Vera CPU: Der erste Prozessor für KI-Agenten

Parallel stellte Nvidia die Vera-CPU als eigenständiges Produkt vor – den ersten Prozessor, der speziell für agentenbasierte KI-Workloads entwickelt wurde. Der Chip basiert auf dem eigens entwickelten Olympus-Core, bietet 88 Kerne mit 176 Threads, 1,2 TB/s LPDDR5X-Speicherbandbreite und die dreifache Bandbreite pro Kern im Vergleich zu x86-Prozessoren. In der Praxis liefert Vera laut Nvidia die 1,8-fache Geschwindigkeit bei der Aufgabenausführung gegenüber x86, die dreifache Geschwindigkeit bei SQL-Datenverarbeitung und die sechsfache bei Echtzeit-Streaming-Datenverarbeitung.

Die Kundenliste ist prominent: Anthropic und OpenAI evaluieren Vera für CPU-intensive Agenten-Workloads, SpaceXAI plant den Einsatz, und Hyperscaler wie ByteDance, CoreWeave und Oracle Cloud Infrastructure werden die CPU in ihre Infrastruktur integrieren. Die New York Stock Exchange arbeitet mit Vera, um ihre Infrastruktur für über 1,1 Billionen Nachrichten pro Tag zu skalieren.

Vom Rechenzentrum auf den Schreibtisch: RTX Spark und DGX Station

Nvidia bringt agentenbasierte KI erstmals konsequent auf den Desktop. Zusammen mit Microsoft wurde RTX Spark vorgestellt, ein neuer Superchip, der eine Blackwell-GPU mit einer gemeinsam mit MediaTek entwickelten Grace-CPU, 128 GB Unified Memory und 600 GB/s NVLink C2C vereint und ein Petaflop KI-Rechenleistung im FP4-Format liefert. Der Chip bringt das vollständige CUDA- und RTX-Ökosystem auf den Personal Computer und ermöglicht es, 120-Milliarden-Parameter-Modelle mit einer Million Token Kontext lokal zu betreiben. Adobe hat seine Creative-Cloud-Anwendungen Photoshop, Premiere und Substance 3D bereits für RTX Spark optimiert – mit bis zu doppelter Geschwindigkeit. Erste RTX-Spark-Laptops sollen im Herbst verfügbar sein.

Für Unternehmen kommt die DGX Station für Windows, ein Desktop-KI-Supercomputer auf Basis des GB300-Grace-Blackwell-Superchips mit bis zu 748 GB kohärentem Speicher und 800 Gb/s Netzwerkanbindung. Das System kann Frontier-Modelle mit bis zu einer Billion Parametern lokal ausführen und bringt damit erstmals Rechenzentrums-Klasse-Infrastruktur direkt an den Arbeitsplatz.

Agentic AI: Nemotron 3 Ultra und Enterprise-Partnerschaften

Im Softwarebereich stellte Nvidia das neue Nemotron 3 Ultra vor, ein 550-Milliarden-Parameter-Modell, das laut Nvidia fünfmal schneller und 30% günstiger als vergleichbare Frontier-Modelle arbeitet. Das Modell zielt speziell auf Enterprise-Agenten-Workloads wie langfristige Planung, Coding und Wissensarbeit.

Dazu wurde das Nvidia Agent Toolkit vorgestellt, das NemoClaw-Blueprints, OpenShell-Sicherheits-Runtime und CUDA-X-Bibliotheken mit Agenten-Skills bündelt. Unter den Partnern, die darauf aufbauen, finden sich Cadence mit einem autonomen Chip-Design-Super-Agenten, Palo Alto Networks für Bedrohungserkennung, Ansys für Engineering-Workflows, SAP für Supply-Chain-Agenten und ServiceNow für IT-Automatisierung.

Physical AI: Cosmos 3, Alpamayo 2 Super und humanoide Roboter

Im Bereich Physical AI stellte Nvidia gleich drei bedeutende Neuerungen vor. Cosmos 3, ein offenes Foundation-Modell auf Basis einer neuen Mixture-of-Transformers-Architektur, kombiniert erstmals visuelle Interpretation, multimodale Generierung über Text, Bilder, Videos und Geräusche sowie Aktionsvorhersage in einem einzigen System. Das Modell erzeugt numerische Aktionsdaten wie Gelenkwinkel und Greiferpositionen und verkürzt laut Nvidia Trainings- und Evaluationszyklen von Monaten auf wenige Tage.

Für autonomes Fahren wurde Alpamayo 2 Super vorgestellt, ein 32-Milliarden-Parameter-VLA-Modell (Vision-Language-Action), das menschenähnliche Wahrnehmung und logisches Schlussfolgern für Level-4-Robotaxis ermöglicht. Die Robotaxi-Plattform Drive Hyperion erfährt parallel eine massive Ökosystem-Erweiterung mit globalen Automobilherstellern und Mobilitätspartnern.

Mit dem Isaac GR00T Reference Humanoid Robot präsentierte Nvidia das erste offene Referenzdesign für humanoide Roboter: ein System, das Unitree-H2-Plus-Hardware, taktile Fünf-Finger-Hände und die auf Jetson Thor basierende GR00T-Plattform in einem einheitlichen Design verbindet. Verfügbarkeit: Oktober 2026.

Taiwans Rolle: TSMC, Foxconn und der neue Nvidia-Campus

Nvidia unterstrich auf der GTC Taipei die zentrale Rolle Taiwans in seiner Lieferkette. TSMC setzt Nvidia-Technologie ein, um Lithografie, Transistorsimulation, Prozesskontrolle und Defektinspektion in den eigenen Fabs mit CUDA-X-Bibliotheken, KI-Modellen und digitalen Fab-Zwillingen über Omniverse zu beschleunigen. Foxconn bringt gemeinsam mit Nvidia agentenbasierte und Physical AI in taiwanesische Krankenhäuser unter dem Programm „Healthy Taiwan".

Huang enthüllte zudem den neuen Nvidia-Campus „Constellation" im Taipei-Stadtteil Beitou-Shilin. Der Komplex wird rund 4.000 Mitarbeiter beherbergen und einer der größten KI-Forschungsstandorte im asiatisch-pazifischen Raum sein. Taipeis Bürgermeister Chiang Wan-an überreichte Huang bei der Eröffnungsfeier den Schlüssel zur Stadt.

Fazit

Die GTC Taipei 2026 setzt dort an, wo die GTC San Jose im März aufgehört hat, und überführt Nvidias Plattformstrategie konsequent vom Konzept in die Produktion. Die Serienproduktion von Vera Rubin, die Vera-CPU als eigenständiges Produkt, Nemotron 3 Ultra als neues Frontier-Modell und die Ausweitung der Agenten-Architektur vom Rechenzentrum auf den Windows-Desktop zeigen die Breite des Ansatzes.

Die Konferenz läuft noch bis zum 4. Juni.

Wenn ihr Feedback oder Vorschläge habt, was ich mir ansehen sollte, schickt mir eine Nachricht an info@theanalyst.de oder @theanalystde auf X.

Nvidia GTC Taipei 2026: Vera Rubin geht in Serie

Vera Rubin: Vom Konzept in die Massenproduktion

Vera CPU: Der erste Prozessor für KI-Agenten

Vom Rechenzentrum auf den Schreibtisch: RTX Spark und DGX Station

Agentic AI: Nemotron 3 Ultra und Enterprise-Partnerschaften

Physical AI: Cosmos 3, Alpamayo 2 Super und humanoide Roboter

Taiwans Rolle: TSMC, Foxconn und der neue Nvidia-Campus

Fazit

Aktuelle Beiträge

The
Analyst

Vera Rubin: Vom Konzept in die Massenproduktion

Vera CPU: Der erste Prozessor für KI-Agenten

Vom Rechenzentrum auf den Schreibtisch: RTX Spark und DGX Station

Agentic AI: Nemotron 3 Ultra und Enterprise-Partnerschaften

Physical AI: Cosmos 3, Alpamayo 2 Super und humanoide Roboter

Taiwans Rolle: TSMC, Foxconn und der neue Nvidia-Campus

Fazit

The Analyst

The
Analyst