R600: ATi kommt mit Radeon HD Serie


Erschienen: 14.05.2007, Autor: Patrick von Brunn
R600: Unified-Shader

Nachdem Konkurrent Nvidia bereits vor einigen Monaten mit der GeForce 8-Generation den Umschwung auf eine Unified-Shader-Architektur geschafft hat, zieht nun auch ATi im Desktop- und Mobile-Bereich nach. Das Design basiert dabei auf dem erfolgreichen "Xenos"-Chip der Xbox 360, den man weiterentwickelt und verbessert hat. Das Ergebniss kann sich (zumindest auf dem Papier) sehen lassen und trägt die Bezeichnung R600 bzw. in den abgespeckten Varianten RV610 und RV630.

Der Trick an Unified-Shader ist dabei relativ leicht nachzuvollziehen. Herkömmliche Architekturen setzen auf verschiedene Arten von Shader-Prozessoren, die jeweils nur für eine Aufgabe bestimmt sind (zum Beispiel Vertex oder Pixel). Shader aus Unified-Shader-GPUs sind in der Lage alle anfallenden Arbeiten zu erledigen und somit auf keinen Typ festgelegt. Diese Einheiten nennt man Stream-Prozessoren und können im Falle der R600-Generation sowohl Vertex- und Pixel- als auch Geometry-Operationen ausführen. Je nach Modell können bis zu 320 dieser SPs integriert sein und superskalar in der Berechnung agieren. Dies heißt konkret, dass bis zu fünf Operationen pro Takt abgearbeitet werden können (bisher: zwei Ops/sec). Superskalar bedeutet dabei auch, dass eine dynamische Zuteilung der Operationen auf die Prozessoren besteht, um eine maximale Parallelität zu erreichen und das System maximal auslasten zu können. Da die Zuteilung eben nicht mehr direkt durch den Compiler vorgenommen wird, sondern während des Betriebs dynamisch geschieht, wird eine entsprechenden Zuteilungseinheit benötigt. Diese nennt sich im Fachschargon "Dispatcher" (Koordinator bzw. Zuteiler). In der zweiten Unified-Shader Generation von ATi hat man auch diese Einheit weiter verbessert und den "Ultra Threaded Dispatch Processor" geschaffen, der eine maximale Auslastung der zur Verfügung stehenden Stream-Prozessoren und somit höchstmögliche Berechnungsgeschwindigkeit erreichen soll.

Ein Blick auf die Architektur des R600 (HD 2900).

Ein einfaches Beispiel zur Verdeutlichung von Flaschenhälsen in einer Nicht-Unified-Architektur: Hat man eine Szene zum Rendern in die GPU geschickt die besonders Vertex-Shader-lastig ist, wie zum Beispiel durch Formveränderungen und Lichteinfalländerungen, werden primär die Vertex-Shader-Einheiten der GPU benutzt und die Pixel-Shader-Einheiten befinden sich überwiegend im Leerlauf. Dieser suboptimale Zustand gilt auch umgekehrt, wenn kaum Vertex-Berechnungen anliegen und die Szene vor allem die Pixel-Shader, beispielsweise durch Interpolationen mit Texturen beim Shading, fordert. Stream-Prozessoren der Unified-GPU sind in der Lage alle anfallenden Operationen durchzuführen und damit im Optimalfall maximal ausgelastet, was Flaschenhälse verhindert und eine beschleunigte Abarbeitung forciert. Diese kann jedoch nur der Fall sein, wenn die Dispatch-Einheit zuverlässig die Threads auf die freien SPs verteilt. R6xx-GPUs können Vertex-, Shader- und Geometry-Operationen je nach Bedarf abarbeiten.

512 Bit: Ringbus-Interface des R600 (HD 2900).

Wieder mit dabei ist das bereits von vorherigen Generationen bekannte Ringbus-Speicherinterface, welches man nun auf insgesamt 1024 Bit (512 Bit in jede Richtung des Rings) aufgestockt hat. Die Daten können somit noch schneller innerhalb der GPU rotieren und von Punkt A nach B gebracht werden. Für die Anbindung von DDR-Speicher hat man wiederum die Unterstützung von GDDR3 und GDDR4 realisiert. Dieser kann an insgesamt vier Schnittstellen paarweise konnektiert werden. Daraus ergeben sich wiederum acht Einzelbusse mit 64 Bit Breite zu je einem Speicherbaustein. Alles in Allem bringt die Radeon HD 2900 also ein 512 Bit Speicherinterface mit in den Kampf gegen ATi und sorgt für neue Rekorde in Sachen Durchsatz. Die Varianten HD 2600 und HD 2400 wurden entsprechend abgespeckt.

Weitere Details zu Features und Neuheiten in der Bildqualität entnehmen Sie der folgenden Seite.


Vor scrollenWeitere Artikel aus der Kategorie GrafikkartenZurück scrollen
Bewerten Sie diesen Artikel!

Bewertung nur durch Mitglieder möglich!

Bewertungen: 3 (Ø 1,67)