Nachdem Konkurrent Nvidia bereits vor einigen Monaten mit der GeForce 8-Generation den Umschwung auf eine Unified-Shader-Architektur geschafft hat, zieht nun auch ATi im Desktop- und Mobile-Bereich nach. Das Design basiert dabei auf dem erfolgreichen "Xenos"-Chip der Xbox 360, den man weiterentwickelt und verbessert hat. Das Ergebniss kann sich (zumindest auf dem Papier) sehen lassen und trägt die Bezeichnung R600 bzw. in den abgespeckten Varianten RV610 und RV630.
Der Trick an Unified-Shader ist dabei relativ leicht nachzuvollziehen. Herkömmliche Architekturen setzen auf verschiedene Arten von Shader-Prozessoren, die jeweils nur für eine Aufgabe bestimmt sind (zum Beispiel Vertex oder Pixel). Shader aus Unified-Shader-GPUs sind in der Lage alle anfallenden Arbeiten zu erledigen und somit auf keinen Typ festgelegt. Diese Einheiten nennt man Stream-Prozessoren und können im Falle der R600-Generation sowohl Vertex- und Pixel- als auch Geometry-Operationen ausführen. Je nach Modell können bis zu 320 dieser SPs integriert sein und superskalar in der Berechnung agieren. Dies heißt konkret, dass bis zu fünf Operationen pro Takt abgearbeitet werden können (bisher: zwei Ops/sec). Superskalar bedeutet dabei auch, dass eine dynamische Zuteilung der Operationen auf die Prozessoren besteht, um eine maximale Parallelität zu erreichen und das System maximal auslasten zu können. Da die Zuteilung eben nicht mehr direkt durch den Compiler vorgenommen wird, sondern während des Betriebs dynamisch geschieht, wird eine entsprechenden Zuteilungseinheit benötigt. Diese nennt sich im Fachschargon "Dispatcher" (Koordinator bzw. Zuteiler). In der zweiten Unified-Shader Generation von ATi hat man auch diese Einheit weiter verbessert und den "Ultra Threaded Dispatch Processor" geschaffen, der eine maximale Auslastung der zur Verfügung stehenden Stream-Prozessoren und somit höchstmögliche Berechnungsgeschwindigkeit erreichen soll.
Ein Blick auf die Architektur des R600 (HD 2900).
Ein einfaches Beispiel zur Verdeutlichung von Flaschenhälsen in einer Nicht-Unified-Architektur: Hat man eine Szene zum Rendern in die GPU geschickt die besonders Vertex-Shader-lastig ist, wie zum Beispiel durch Formveränderungen und Lichteinfalländerungen, werden primär die Vertex-Shader-Einheiten der GPU benutzt und die Pixel-Shader-Einheiten befinden sich überwiegend im Leerlauf. Dieser suboptimale Zustand gilt auch umgekehrt, wenn kaum Vertex-Berechnungen anliegen und die Szene vor allem die Pixel-Shader, beispielsweise durch Interpolationen mit Texturen beim Shading, fordert. Stream-Prozessoren der Unified-GPU sind in der Lage alle anfallenden Operationen durchzuführen und damit im Optimalfall maximal ausgelastet, was Flaschenhälse verhindert und eine beschleunigte Abarbeitung forciert. Diese kann jedoch nur der Fall sein, wenn die Dispatch-Einheit zuverlässig die Threads auf die freien SPs verteilt. R6xx-GPUs können Vertex-, Shader- und Geometry-Operationen je nach Bedarf abarbeiten.
512 Bit: Ringbus-Interface des R600 (HD 2900).
Wieder mit dabei ist das bereits von vorherigen Generationen bekannte Ringbus-Speicherinterface, welches man nun auf insgesamt 1024 Bit (512 Bit in jede Richtung des Rings) aufgestockt hat. Die Daten können somit noch schneller innerhalb der GPU rotieren und von Punkt A nach B gebracht werden. Für die Anbindung von DDR-Speicher hat man wiederum die Unterstützung von GDDR3 und GDDR4 realisiert. Dieser kann an insgesamt vier Schnittstellen paarweise konnektiert werden. Daraus ergeben sich wiederum acht Einzelbusse mit 64 Bit Breite zu je einem Speicherbaustein. Alles in Allem bringt die Radeon HD 2900 also ein 512 Bit Speicherinterface mit in den Kampf gegen ATi und sorgt für neue Rekorde in Sachen Durchsatz. Die Varianten HD 2600 und HD 2400 wurden entsprechend abgespeckt.
Weitere Details zu Features und Neuheiten in der Bildqualität entnehmen Sie der folgenden Seite.
Jedes Jahr bringt uns etwas Neues. Dies gilt auch für das Unternehmensleben. Viele der Veränderungen, die während der Pandemie begonnen...
Wer kennt es nicht – der Altbau hat gerade einmal Stromleitungen in der Wand, Patchkabel haben zur Zeit des Erbauens...
Hersteller Sapphire kündigt die neue PULSE AMD Radeon RX 7600 8GB Grafikkarte für Gamer an, die leises 1080p-Gaming inklusive werkseitiger...
In der heutigen digitalen Welt ist es sehr wichtig, Ihren Computer vor Bedrohungen zu schützen. Viren, Malware und andere bösartige...
Patriot Memory gibt bekannt, dass alle PCIe M.2 2280 SSD-Modelle eine um zwei Jahre auf bis zu fünf Jahre verlängerte...
Die GeForce RTX 4070 Ti EX Gamer von Hersteller KFA2 kommt in einem wuchtigen Quad-Slot-Design daher und bringt u.a. Overclocking ab Werk sowie RGB-Beleuchtung. Mehr zum Custom-Design in unserem Test.
Die abgespeckte AD104-GPU ist die neue Einsteiger-Variante der GeForce RTX-40-Serie von Nvidia. Wir haben uns das Custom Modell EX Gamer mit 1-Click OC Feature von KFA2 im Praxistest genau angesehen.
Mit der NITRO+ RX 7900 XTX Vapor-X von Sapphire haben wir heute ein Custom-Design auf Basis des RDNA-3-Flaggschiffs von AMD im Test. Die Radeon-Karte kommt unter anderem mit Overclocking ab Werk und weiteren Extras.
Mit der PULSE Radeon RX 7900 XT haben wir heute einen Boliden mit RDNA 3 Architektur aus dem Hause Sapphire im Test. Wie sich das Custom-Design mit drei Slots Bauhöhe in der Praxis schlägt, lesen Sie hier in unserem Test.