ARTIKEL & TESTS / INNO3D RTX 4080 SUPER iCHILL Frostbite

31.01.2024 15:00 Uhr

GPU-Architektur

Die Turing GPU-Architektur wurde 2018 eingeführt und formte die erste Generation GeForce RTX ‒ für Nvidia läutete sie zudem die Zukunft von 3D-Grafik und GPU-beschleunigtem Computing ein. Turing sorgte für große Fortschritte bei Effizienz und Leistung für PC-Spiele, professionelle Grafikanwendungen und Deep-Learning. Mithilfe neuer hardwarebasierter Beschleuniger verschmolz die Turing-Architektur konventionelle Rasterizer-Grafik, Echtzeit-Raytracing, KI und Simulation. Zwei Jahre später, im Jahr 2020, enthielt die verbesserte Ampere-Architektur leistungsstärkere RT-Kerne und Tensor-Kerne sowie eine neuartige SM-Struktur, die im Vergleich zu Turing-GPUs Takt für Takt die doppelte FP32-Leistung bot. Diese Innovationen ermöglichten es der Ampere-Architektur, in herkömmlichen Rastergrafiken bis zu 1,7-mal schneller als Turing und bei Raytracing bis zu 2-mal schneller zu laufen.

Die neue Ada Lovelace GPU-Architektur, benannt nach der Mathematikerin Ada Lovelace, die oft als die erste Computerprogrammiererin der Welt angesehen wird, legt die Messlatte weit über Turing- und Ampere-GPUs, so Nvidia in seiner offiziellen Ankündigung. Während sich die Verbesserungen in den Chip-Herstellungsprozessen verlangsamt haben, hat die Komplexität moderner Computergrafiken exponentiell zugenommen. Zunehmende geometrische Komplexität und Innovationen in der Beleuchtung haben zu Grafiken geführt, die lebensechter aussehen als je zuvor. Um Umgebungen mit dieser Komplexität bei hohen Bildraten zu generieren, ist Ada in gerasterten Spielen bis zu 2x schneller und in Raytracing-Spielen bis zu 4x schneller als die vorherige Ampere GPU-Architektur.

Die Ada-Lovelace-Architektur ist die dritte GeForce-RTX-Generation (Bildquelle: Nvidia)

Ada Lovelace bietet das größte Leistungs-Upgrade von Generation zu Generation in der Geschichte von Nvidia. Eine verbesserte Architektur in Kombination mit Fertigungsinnovationen (TSMC 4N; 5 nm) und Materialforschung ermöglichten es eine GPU mit 76,3 Milliarden Transistoren und 18.432 CUDA-Kernen herzustellen, die mit Taktraten von über 2,5 GHz betrieben werden können, während die gleiche 450 Watt TGP wie bei der RTX 3090 Ti der vorherigen Generation beibehalten wird.

Ein neuer Ada RT Core für schnelleres Raytracing ist ebenso mit dabei, um 2x schnellere Schnittpunkttests zu ermöglichen (Ray-triangle intersection testing) und enthält außerdem zwei wichtige neue Hardwareeinheiten: Eine Opacity Micromap Engine beschleunigt das Raytracing von Alpha-getesteter Geometrie um den Faktor zwei und eine Displaced Micro-Mesh Engine generiert Displaced Micro-Triangles on-the-fly, um zusätzliche Geometrie zu erstellen.

Die neuen RTX-40-GPUs unterstützen Shader Execution Reordering, das Shader-Workloads dynamisch organisiert und neu ordnet, um RT-Shading zu verbessern. Die Ada-Architektur verfügt außerdem über einen völlig neuen Optical Flow Accelerator und eine KI-Frame-Generierung, die die Bildraten von DLSS 3 gegenüber dem vorherigen DLSS 2.0 um das bis zu 2-fache steigert, während die native Bildqualität beibehalten oder übertroffen wird. Im Vergleich zum herkömmlichen Rendering ist DLSS 3 letztendlich bis zu 4x schneller und bietet gleichzeitig eine niedrige Systemlatenz, so Nvidia. Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ada-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32).

Graphics Processor Cluster (GPC) im Detail (Bildquelle: Nvidia)

Ein Ada Lovelace SM (Bildquelle: Nvidia)

Der GPC ist der dominierende High-Level-Hardwareblock in allen GPUs der AD10x Ada-Familie, wobei sich alle wichtigen Verarbeitungseinheiten in einem GPC befinden. Jede GPC enthält eine dedizierte Raster-Engine, zwei Partitionen für Rasteroperationen (ROPs), wobei jede Partition acht einzelne ROP-Einheiten und sechs TPCs enthält. Jeder TPC enthält eine PolyMorph-Engine und zwei SMs. Jeder SM in AD10x-GPUs enthält 128 CUDA-Kerne, einen Ada-RT-Kern der dritten Generation, vier Ada-Tensorkerne der vierten Generation, vier Textureinheiten, eine 256-KB-Registerdatei und 128 KB L1/Shared Memory.

Wie frühere GPUs, ist der AD10x SM in vier Verarbeitungsblöcke (oder Partitionen) unterteilt, wobei jede Partition ein 64-KB-Registerfile, einen L0-Instruction-Cache, einen Warp-Scheduler, eine Dispatch-Unit und 16 CUDA-Kerne enthält, die für die Verarbeitung von FP32 Operationen bestimmt sind (bis zu 16 FP32-Operationen pro Takt), 16 CUDA-Kerne, die FP32- oder INT32-Operationen verarbeiten können (16 FP32-Operationen pro Takt oder 16 INT32-Operationen pro Takt), ein Ada-Tensorkern der vierten Generation, vier Load-/Store-Einheiten und eine Special Function Unit (SFU). Ein Ada SM enthält 128 KB Level-1-Cache und die gesamte AD102-GPU wurde mit 98304 KB L2-Cache ausgestattet.

Die vollständige AD102-GPU, die als Basis der neuen GeForce RTX 4090 dient, umfasst 12 Graphics Processing Clusters (GPCs), 72 Texture Processing Clusters (TPCs), 144 Streaming Multiprocessors (SMs) und eine 384-Bit-Speicherschnittstelle mit zwölf 32-Bit-Speichercontrollern. Mit der Einführung der GeForce RTX 3090 und 3080 lieferten Nvidia und Micron die ersten GDDR6X-Exemplare mit Geschwindigkeiten von bis zu 19,5 Gbit/s aus. Zwei Jahre später sind noch höhere Speichergeschwindigkeiten für Ada-GPUs möglich: Die GeForce RTX 4080 16 GB wird mit 22,4 Gbit/s GDDR6X-Speicher geliefert (effektiver Takt von 22.400 MHz), während die GeForce RTX 4090 1 TB/s Spitzenspeicherbandbreite bietet (effektiver Takt von 21.008 MHz).

AD103-300-GPU, RTX 4080.

AD102-300-GPU, RTX 4090.

AD104-250-GPU, RTX 4070.

AD104-400-GPU, RTX 4070 Ti.

AD107-400-GPU, RTX 4060.

AD106-350-GPU, RTX 4060 Ti (8 GB).

AD106-351-GPU, RTX 4060 Ti (16 GB).

Autor: Patrick von Brunn, Stefan Boller

« « Vorherige Seite

Nächste Seite » »

#Ada Lovelace #Alphacool #ASUS #Benchmark #CES #DLSS #Gamer #Gaming #GeForce #Grafikchip #Grafikkarte #INNO3D #Intel #KFA2 #KI #Kühlung #Lüfter #Lüftersteuerung #Micron #Monitor #MSI #Netzteil #Nvidia #Overclocking #PCIe #Raytracing #Sapphire #SMS #Software #Technologie #Turing #Wasserkühlung #ZOTAC

Vorsicht bei GPU-Drops, Vorbestellungen und Fake-Shops

heute, 13:00

Wenn eine neue Grafikkarte erscheint, wird aus nüchterner Hardware-Begeisterung schnell ein kleiner Ausnahmezustand. Tests werden gelesen, Benchmarks verglichen, Shops aktualisiert,...

Warum Kühlungsdesign für moderne Gaming PCs immer wichtiger wird

22.06.2026

Moderne Gaming PCs liefern immer mehr Leistung, doch ohne gutes Kühlungsdesign können hohe Temperaturen, laute Lüfter und instabile Taktraten den...

PC, Smartphone und Cloud-Dienste verändern die Freizeitgestaltung

16.06.2026

Die Geschichte der Online-Unterhaltung ist eng mit der Entwicklung von Computern, Internetverbindungen und mobilen Geräten verbunden. Was heute selbstverständlich erscheint...

ASUS präsentiert kompakte ProArt GeForce RTX 5090

16.06.2026

ASUS erweitert sein ProArt-Portfolio um die neue ProArt GeForce RTX 5090. Die Grafikkarte richtet sich an Kreativprofis, KI-Entwickler und Anwender...

KIOXIA erweitert EXCERIA-G3-Serie um 4-TB-Modell

16.06.2026

Die KIOXIA Europe GmbH erweitert ihre PCIe-5.0-SSD-Familie um ein neues 4TB-Modell der EXCERIA G3-Serie. Die SSD basiert auf der BiCS...

#AMD #Apps #Benchmark #Cloud #Display #Festplatte #Gaming #Gehäuse #Grafikchip #Grafikkarte #Hardware #Intel #Kühlung #Lüfter #Monitor #Prozessor #SSD #Technologie #Western Digital

INNO3D RTX 5090 iCHILL Frostbite im Test

RTX 5090 iCHILL Frostbite

Mit der iCHILL Frostbite bietet INNO3D eine GeForce RTX 5090 Grafikkarte mit Wasserkühlblock von Alphacool an. Wir hatten die Gelegenheit diesen extravaganten Boliden im Testlab auf Herz und Nieren zu prüfen.

KFA2 RTX 5070 Ti HOF Gaming (Black) Review

RTX 5070 Ti HOF Gaming Black

Mit der GeForce RTX 5070 Ti HOF Gaming bietet Grafikkarten-Spezialist KFA2 einen besonders extravaganten Boliden mit großem OC-Potenzial an. Wir durften im Praxistest einen Blick auf die Black Edition der Karte werfen.

KFA2 GeForce RTX 5070 1-Click OC im Test

KFA2 RTX 5070 1-Click OC

Im günstigeren Preissegment hat Nvidia die GeForce RTX 5070 installiert, die auf der abgespeckten Blackwell-Variante GB205 basiert. Wir haben uns ein Custom-Design von Hersteller KFA2 im Test genauer angesehen.

ARTIKEL & TESTS / INNO3D RTX 4080 SUPER iCHILL Frostbite

Inhaltsverzeichnis

31.01.2024 15:00 Uhr

GPU-Architektur

Autor: Patrick von Brunn, Stefan Boller

Inhaltsverzeichnis

Vorsicht bei GPU-Drops, Vorbestellungen und Fake-Shops

Warum Kühlungsdesign für moderne Gaming PCs immer wichtiger wird

PC, Smartphone und Cloud-Dienste verändern die Freizeitgestaltung

ASUS präsentiert kompakte ProArt GeForce RTX 5090

KIOXIA erweitert EXCERIA-G3-Serie um 4-TB-Modell

INNO3D RTX 5090 iCHILL Frostbite im Test

RTX 5090 iCHILL Frostbite

KFA2 RTX 5070 Ti HOF Gaming (Black) Review

RTX 5070 Ti HOF Gaming Black

KFA2 GeForce RTX 5070 1-Click OC im Test

KFA2 RTX 5070 1-Click OC