ARTIKEL/TESTS / KFA2 RTX 5070 Ti HOF Gaming (Black) Review

GPU-Architektur: Blackwell

Mit der Blackwell-Architektur hat Nvidia eine neue GPU-Generation eingeführt, die zahlreiche technologische Weiterentwicklungen gegenüber dem Ada-Lovelace-Vorgänger aufweist. Die Architektur bildet die technische Grundlage der GeForce-RTX-5000-Serie und bringt sowohl strukturelle als auch funktionale Neuerungen mit sich, die sich auf Leistung, Effizienz und Feature-Set der Grafikkarten auswirken. Die Fertigung erfolgt erneut bei TSMC im 4N-Prozess, einer leicht modifizierten 5-nm-Fertigung, die speziell auf die Anforderungen von Nvidia zugeschnitten ist. Trotz vergleichbarer Strukturbreite zu Ada Lovelace erzielt Blackwell eine höhere Leistung-pro-Watt.

Ein zentrales Merkmal der Blackwell-Architektur ist der Wechsel von einem monolithischen Chipdesign hin zu einem Multi-Chip-Modul (MCM). Die Architektur trennt Rechenlogik und Speichersteuerung physisch in zwei separate Chips innerhalb eines Packages. Diese Aufteilung verbessert die Fertigungsausbeute, senkt die Produktionskosten und ermöglicht eine bessere Skalierbarkeit:

  • Der Graphics Compute Die (GCD) enthält die zentralen Recheneinheiten: CUDA-Kerne, Tensor-Kerne, RT-Kerne und Rastereinheiten.
  • Der Memory & IO Die (MID) übernimmt Aufgaben rund um Speicherzugriffe, Cache-Koordination, PCIe-Anbindung sowie weitere IO-Funktionalitäten.

Die Struktur der Streaming Multiprocessors (SMs) wurde gegenüber der Ada-Generation deutlich überarbeitet. Pro SM stehen mehr CUDA-Kerne zur Verfügung, ergänzt durch aktualisierte Tensor- und RT-Kerne. Darüber hinaus wurde die Cache-Architektur optimiert. Die Größe des L2-Caches wurde auf bis zu 128 MB erhöht (modellabhängig), was die Speicherbandbreite entlastet und insbesondere bei speicherintensiven Anwendungen (z. B. hochauflösendes Texturstreaming) für geringere Latenzen sorgt.

Die Blackwell-Architektur integriert Raytracing-Kerne der vierten Generation, welche die Leistung bei komplexen Lichtberechnungen im Vergleich zur dritten Generation in Ada Lovelace deutlich steigern. Die in Blackwell verbauten Tensor-Kerne der fünften Generation wurden auf moderne KI-Modelle ausgelegt, insbesondere auf Transformer-Netzwerke, wie sie etwa bei DLSS 4.0 zum Einsatz kommen. Die Tensor-Kerne übernehmen in der RTX-5000-Serie unter anderem Aufgaben wie Frame-Interpolation, Auflösungs-Skalierung (Super Resolution), physikalische Simulationen und Gesichtsanalyse (z. B. für virtuelle Charaktere in Spielen).

Blackwell im Vergleich mit Ampere und Ada (Bildquelle: Nvidia).

Blackwell im Vergleich mit Ampere und Ada (Bildquelle: Nvidia).

Die preisliche Staffelung zum Marktstart (Bildquelle: Nvidia).

Die preisliche Staffelung zum Marktstart (Bildquelle: Nvidia).

Mit Blackwell kommt erstmals der neue GDDR7-Speicherstandard im Consumer-Grafikkartenbereich zum Einsatz. GDDR7 ermöglicht deutlich höhere Datentransferraten – bis zu 32 Gbps pro Pin, abhängig vom konkreten Modell. In Verbindung mit breiteren Speicherinterfaces (z. B. 512 Bit bei der RTX 5090) erreicht die Speicherbandbreite Werte von über 1,7 TB/s.

Die Architektur ist ausgelegt auf den Betrieb mit DLSS 4.0 (Deep Learning Super Sampling), das im Vergleich zu DLSS 3 neue Funktionen bietet, darunter eine erweiterte Multi-Frame Generation. Während DLSS 3 ein gerendertes Frame plus einen KI-generierten Zwischenframe erzeugte, erlaubt DLSS 4 die Berechnung von mehreren Zwischenframes pro gerendertem Frame, was in bestimmten Szenarien eine noch stärkere Steigerung der Bildwiederholrate ermöglicht. Das dahinterliegende KI-Modell wurde von Convolutional Neural Networks (CNNs) auf Transformer-basierte Architekturen umgestellt, was die Bildqualität bei Bewegung, Kantenglättung und Detailrekonstruktion weiter verbessert. Die Tensor-Kerne der fünften Generation sind speziell auf diese Modelle hin optimiert.

Auch Nvidia Reflex wurde weiterentwickelt: In Verbindung mit der Blackwell-Architektur wird Reflex 2.0 eingeführt, das die Eingabelatenz durch optimierte GPU-Pipeline-Steuerung nochmals senkt.

Blackwell GB202 GPU

Der GB202-Chip ist das Flaggschiff der RTX Blackwell GPU-Reihe und treibt die GeForce RTX 5090-Grafikkarte an. Die GB203-GPU wird in der GeForce RTX 5080 und GB205 in der GeForce RTX 5070 verwendet. Diese GPUs basieren auf derselben Architektur und sind für unterschiedliche Marktsegmente konfiguriert. Die vollständige GB202-GPU umfasst 12 Grafikverarbeitungscluster (GPCs), 96 Texturverarbeitungscluster (TPCs), 192 Streaming-Multiprozessoren (SMs) und eine 512-Bit-Speicherschnittstelle mit sechzehn 32-Bit-Speichercontrollern.

Die vollständige GB202-GPU (Bildquelle: Nvidia).

Die vollständige GB202-GPU (Bildquelle: Nvidia).

Autor: Patrick von Brunn, Stefan Boller
KFA2 GeForce RTX 5070 1-Click OC im Test
KFA2 GeForce RTX 5070 1-Click OC im Test
KFA2 RTX 5070 1-Click OC

Im günstigeren Preissegment hat Nvidia die GeForce RTX 5070 installiert, die auf der abgespeckten Blackwell-Variante GB205 basiert. Wir haben uns ein Custom-Design von Hersteller KFA2 im Test genauer angesehen.

KFA2 GeForce RTX 5070 Ti 1-Click OC im Test
KFA2 GeForce RTX 5070 Ti 1-Click OC im Test
KFA2 RTX 5070 Ti 1-Click OC

Mit der Einführung der RTX 5070 Ti rollt Nvidia die neue Blackwell-Architektur auch in niedrigeren Preisregionen aus. Wir haben uns einen frischen KFA2-Boliden mit 1-Click OC und schicker RGB-Beleuchtung angesehen.

INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D RTX 5080 X3 OC

Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.