Architektura układu ATI RV770 LE
Niewiele rzeczy w branży IT potrafi przykuć naszą uwagę na równi z premierą nowego układu graficznego, procesora czy też chipsetu wprowadzającego bardziej rewolucyjne usprawnienia i nowinki technologiczne. W przypadku nowej karty, która właśnie weszła na rynek o rewolucyjności mowy być nie może, a jednak wiele osób czekało na nią z dużymi nadziejami. Dlaczego? Otóż dzięki dużo niższej cenie w stosunku do Radeona z nieco wyższej półki, powinna zapewnić całkiem przyzwoite osiągi przede wszystkim w rozdzielczości 1280x1024, oraz czasem 1680x1050. W tym segmencie, zakup Radeona HD4850 czy też GeForce'a 9800GTX+ dla niektórych wydawać się może istotną rozrzutnością, a jednocześnie „64-shaderowy” 9600GT pozostawi nam spory niedosyt. Do tej pory, całkiem rozsądnie zresztą, dobre rozwiązanie stanowił pośredni GeForce 9800GT. Z racji utraty części rynku właśnie za jego przyczyną, ATi wprowadziło własny jej odpowiednik, oferując potencjalnemu nabywcy podobną, jeżeli nie wyższą wydajność w zbliżonej cenie.
Konstrukcja referencyjna zarówno z zewnątrz, jak i „od wewnątrz” nie różni się praktycznie niczym od dobrze znanego „jednoslotowca” opartego o HD4850. Różnice sięgają jednak nieco dalej, do jej serca, w głąb krzemowej płytki umieszczonej w centralnym miejscu na PCB.
Architektura ATI RV770
Układ RV770 oznaczony przez producenta jako „LE”, wykorzystuje zablokowany częściowo rdzeń RV770, występujący na Radeonach HD4850 oraz 4870. Największe zmiany dotyczą rzecz jasna ilości jednostek SP oraz TU (o czym za chwilę), mniejsze natomiast - poziomu taktowania układu oraz pamięci względem mocniejszego modelu.
Dane z poniższej tabeli doskonale obrazują gdzie do tej pory znajdowała się największa luka wśród produktów ATi/AMD występujących na rynku. Wydajnościowo i cenowo zresztą, to właśnie przedział pomiędzy tanim Radeonem HD4670, a znacznie droższym HD4850 okazał się pozbawiony „czerwonego” przedstawiciela.
Jak widać, pod względem parametrów technicznych odbiega on znacznie zarówno od HD4670 jak i HD4850. Do drugiej z kart jest mu jednak zdecydowanie bliżej, tym bardziej jeżeli pozwolimy sobie na jakiś nietuzinkowy overclocking.
| nazwa marketingowa | Radeon HD4670 | Radeon HD4830 | Radeon HD4850 |
| nazwa kodowa rdzenia | R730 XT | RV770 LE | RV770 Pro |
| technologia wykonania | 55nm | 55nm | 55nm |
| liczba tranzystorów | 514 mln | 956 mln | 956 mln |
| powierzchnia rdzenia | 146 mm2 | 256 mm2 | 256 mm2 |
| maksymalne TDP | 59 W | 95 W | 110 W |
| ilość jednostek RBE | 8 | 16 | 16 |
| ilość jednostek TMU | 32 | 32 | 40 |
| ilość jednostek SP | 64 (320) | 128 (640) | 160 (800) |
| wersja SM / DX | 4.1 / DX10.1 | 4.1 / DX10.1 | 4.1 / DX10.1 |
| częstotliwość GPU | 750 Mhz | 575 Mhz | 625 Mhz |
| wydajność wypełniania | 12000 MT/s | 18400 MT/s | 25000 MT/s |
| wydajność zmiennoprzecinkowa | 480 GFlops | 736 GFlops | 1000 GFlops |
| częstotliwość pamięci | 1000 Mhz (2000 Mhz DDR) | 900 MHz (1800 Mhz DDR) | 993 Mhz (1986 Mhz DDR) |
| przepustowość pamięci | 31,2 GB/s | 56,2 GB/s | 62 GB/s |
| ilość i typ pamięci | 512MB GDDR3 128bit | 512MB GDDR3 256bit | 512MB GDDR3 256bit |
| magistrala | PCI-E 16x 2.0 | PCI-E 16x 2.0 | PCI-E 16x 2.0 |
| chłodzenie | jednoslotowe | jednoslotowe | jednoslotowe |
| sprzętowa obsługa formatów HD | tak (AVIVO HD /UVD2) | tak (AVIVO HD / UVD2) | tak (AVIVO HD / UVD2) |
| multi-GPU | CrossFireX | CrossFireX | CrossFireX |
| dodatkowe zasilanie | brak | 1x 6pin | 1x 6pin |
Co zatem „wypalono” w stosunku do HD4850? Jeżeli spojrzymy na poniższy schemat blokowy, wszystko stanie się jasne. Usunięto, choć lepszym słowem będzie – zablokowano, dwa 16-sto procesorowe klastry SIMD oraz dwa bloki zawierające połączone z nimi jednostki teksturujące. Do dyspozycji pozostało zatem 8 działających klastrów SIMD (łącznie 128), oraz 32 jednostki adresująco – filtrujące (TU). Strata wbrew pozorom nie jest duża, i biorąc pod uwagę pozostawienie 256-bitowej szerokości szyny kontrolera pamięci GDDR3, oraz 16 jednostek renderujących (RBE), w przypadku rozdzielczości 1280x1024 czy 1680x1050, szczególnie dużego spadku wydajności obawiać się raczej nie powinniśmy.
Schemat blokowy „okrojonej” architektury Terascale (RV770LE)
Jak wiadomo „pojedynczy” z 8-u występujących tu klastrów SIMD, zawiera łącznie 80 jednostek wektorowych (4+1). Sumarycznie, mnożąc je przez 8 występujących w układzie bloków dostaniemy 640 jednostek SPu (zdolnych do obliczeń na wektorach), oraz 128 jednostek umożliwiających przekształcenia skalarne.
Schemat blokowy jednego z 8-miu „procesorów” TU (Texture Unit)
Dużego ubytku w „inwentarzu” nie uświadczyły także procesory teksturujące. Łącznie będą tu zdolne do zaadresowania, przefiltrowania oraz nałożenia do 32 tekstur na jeden cykl zegarowy, a nie 40-stu jak ma to miejsce przy HD4850 czy HD4870.
To już wszystkie zmiany jakich dokonano w „nowym” rdzeniu. Przyjrzymy się teraz nieco bliżej karcie która dotarła do testów ...
Powercolor Radeon HD4830
Karta, której użyłem do testów, to produkt sprzedawany pod marką Powercolor. Konstrukcja wyposażona została w 512MB pamięci typu GDDR3, oraz referencyjne zegary: 575MHz dla układu, oraz 900MHz (1800MHz w trybie DDR) dla modułów pamięci.
(*) temperatury odczytywane z ATT v1.6.9.1368beta (Hardware Monitor)
(**) maksymalne stabilne taktowanie odszukane przy pomocy ATT, ATi Overdrive, AtiTool 0.27b4 / Artifact Scanner, Fur Stability Benchmark
Powercolor HD4830 512MB – GPU-Z 0.2.8 nie rozpoznaje jeszcze „nowego” układu
"Pałerkolorowy” wicherek bez żadnego problemu pozwala regulować prędkość obrotową za pomocą wbudowanej w Catalyst Control Center zakładki ATiOverdrive, czy też programu narzędziowego np. ATi Tray Tools. Jego domyślne tryby pracy to 37% prędkości maksymalnej w trybie 2D, oraz 54 do 64% (tylko podczas „burn” testu) w trybie 3D. Takie prędkości zapewniają niezłe osiągi zarówno jeżeli chodzi o generowaną temperaturę jak i poziom wytwarzanego hałasu.
Duże brawa dla Powercolora za doposażenie modułów pamięci w odprowadzającą nagromadzone ciepło miedziane blaszki, oraz za radiator na sekcji zasilania, który pracuje tu w niepozornym układzie faz (2+1). W tym segmencie, dbałość o takie szczegóły, dla producentów wciąż nie jest zbyt obligatoryjna.
Poziom wspomnianego hałasu, a więc szumu docierającego do naszych uszu, kształtuje się na poziomie nieco gorszym od testowanego niedawno Gainwarda Golden Sample, wyposażonego w mocniejszy układ HD4850. Dla przeciętnego użytkownika różnica w trybie 2D będzie jednak niemal zupełnie nie do wychwycenia. Podczas pracy, kiedy wentylator rozpędza się nawet do 64% wartości maksymalnej obrotów, poziom hałasu wzrasta dosyć znacznie, co przekłada się na odczuwalne przy stanowisku kolejne 2-3 decybele w stosunku do wspomnianego Gainwarda. „Zaobserwowany” wzrost w przypadku pomiaru generowania szumu w bliskiej odległości od wentylatora, jest już wyższy prawie o rząd wielkości (podwojenie hałasu). Pomimo, iż są to wartości wysokie (prawie 50dB) odczuwalność na stanowisku przy komputerze będzie o prawie 10dB niższa.
| regulacja prędkością | 2D idle [dB]/stanowisko | 2D idle [dB]/30cm od karty | |
| karta pasywna | - | 36,4 | 41 |
| Gain. HD4850 GS | auto/ 50% | 36,8 | 42,1 |
| Powercolor HD4830 | auto/37% | 37 | 42,4 |
| regulacja prędkością | 3D idle [dB]/stanowisko | 3D idle [dB]/30cm od karty | |
| karta pasywna | - | 36,4 | 41 |
| Gain. HD4850 GS | manual/ 60% | 37,6 | 45 |
| Powercolor HD4830 | manual/54% | 38,4 | 46,7 |
| Powercolor HD4830 | manual/64% | 39,8 | 49,5 |
Temperatury jakie udało się odnotować, także bardzo dobrze świadczą o zastosowanym prostym i jakże skutecznym module chłodzenia. Podczas spoczynku (praca w trybie 2D), układ zdołał się nagrzać do niewiele ponad 28stopni celsjusza, a przy intensywnej pracy w środowisku 3D, do nieco ponad 60stopni.
Temperatura karty w trybie 2D /ATT Monitoring
- Temperatura karty w trybie 3D /ATT Monitoring
Podkręcanie testowego HD4830 także nie nastręcza większych problemów. Jedynym, na jaki natrafiłem jest póki co brak wsparcia dla „nowego” układu przez narzędzia wbudowane w popularny program RivaTuner. Karta bardzo dobrze podkręca się jednak przy pomocy panelu ATiOverdrive oraz aplikacji ATi Tray Tools. Jeżeli chodzi o układ, udało się „wydusić” stabilne taktowanie, podobnie jak przy referencyjnych HD4850, na poziomie aż 690MHz.
Spod panelu ATiOverdrive bez problemu da się „osiągnąć” maksymalne stabilne wartości
Pamięci pozwalają na taktowanie wyższe od „nominału” o 170MHz (340 w trybie DDR), czyli do zegara 969MHz. Mając na uwadze stosunkowo niskie domyślne „takty” Radeona HD4830, overclocking można zatem uznać za bardzo udany.
RivaTuner, w obecnej wersji 2.11, nie jest w stanie rozpoznać nowej karty
Nic nie stoi jednak na przeszkodzie aby skorzystać z ATi Tray Tools (v1.6.1368beta)
Zmierzony pobór energii nowej karty ATi, ukazuje wyniki dosyć zbieżne z GeForce 9800GT, dla którego jest przecież głównym rywalem. Rozróżnienie tych konstrukcji w tym przypadku umożliwia jedynie test maksymalnego poboru, który dla Radeona HD4830 jest niższy o kilkanaście watów. W typowych warunkach wygląda to właśnie w ten sposób, choć tzw. „burn test”, wykonany z pominięciem optymalizacji sterownika, ukazuje wyniki wyższe w punkcie „peak” dla nowego HD-ka nawet o 40-50wat! Warto mieć to zatem na uwadze - karta wcale nie musi być mniej prądożerna od GeForce'a 9800GT. Wszystko zależy tu od odpowiedniej optymalizacji.
| 2D idle [W] | 2D AVC-1 (H.264) [W] | 3D typical [W] | 3D peak [W] | |
| HD4650 DDR2 | 85 | 104 | 130-140 | 148 |
| HD4670 GDDR3 | 85 | 104 | 150-160 | 170 |
| 9600GT | 103 | 120 | 160-170 | 183 |
| 9600GSO 384MB | 111 | 128 | 170-180 | 207 |
| H4830 | 113 | 133 | 190-210 | 216 |
| 9800GT | 115 | 132 | 190-210 | 233 |
| HD3870 GDDR4 | 96 | 115 | 200-220 | 235 |
| HD4850 GoldenSample | 110 | 129 | 200-220 | 236 |
| HD4850 | 128 | 145 | 210-240 | 248 |
| 9800GTX+ | 121 | 140 | 210-230 | 255 |
| HD4870 GDDR5 | 153 | 172 | 240-260 | 266 |
| HD4870 GDDR5 Toxic | 154 | 175 | 250-270 | 274 |
| GTX260 (192SP) | 123 | 154 | 230-250 | 281 |
| Gigabyte GTX260 (216SP) | 112 | 143 | 230-260 | 289 |
| CrossFireX 2xHD4850 Toxic | 185 | 209 | 310-350 | 366 |
**pobór energii przez całą jednostkę testową bez wyświetlacza
Wyposażenie karty jest bardzo mizerne, co wiąże się po pierwsze z minimalizacją kosztów, po drugie z zastosowaniem popularnych wyjść sygnału już na jej śledziu. Dostępne będą zatem: pojedyncze, cyfrowe złącze DVI, złącze HDMI, oraz analogowy D-Sub. Niestety nie uświadczymy tu analogowego i wciąż jeszcze szeroko wykorzystywanego złącza S-video.
W pudełku, oprócz sterowników znaleźć można ponadto prozaiczną instrukcję instalacji w wersji papierowej, a także pakiet programów CyberLink DVDSuite, oraz iClone SE.
Platforma testowa
- procesor: intel Core2Duo E8400 Wolfdale 3.0@3.8GHz 1.36V
- płyta głowna: Gigabyte GA-X48-DQ6 (iX48) CrossFireX s775
(bios F8A) - chłodzenie CPU: Scythe Ninja rev2
- pamięci RAM: OCZ Reaper HPC DDR2-1066 2x1GB CL5-5-5-15 CMD 2T
- dysk twardy: Seagate 250GB 7200.10, 16MBcache NCQ
(ST3250410AS) - monitor LCD: iiyama ProLite E2403WS 24”
- obudowa: Chieftec CH-03-PA MIDI Tower
- zasilacz :Chieftec CFT-620-A12S 620W
(+12V1 – 16A, +12V2 – 25A, +12V3 – 17A) – max 500W
(+5V – 30A, +3,3V – 28A) – max 180W
Sterowniki, system operacyjny i narzędzia:
- Windows XP Professional SP3 PL
- Windows VISTA Home Premium SP1 PL
- DirectX August'08 update
- intel INF update utility v9.0.0.1008
- nVIDIA PhysX driver v8.08.18 - GeForce 9 series/GTXseries
- nVIDIA PhysX driver v8.09.04 - Gigabyte GTX260 (216SP)
- ati: Catalyst 8.8 (8.522) – Radeon HD3xxx/4xxx series – Vista/XP
- ati: Catalyst 8.9beta (8.523) – Radeon HD4600 series – Vista/XP
- ati: Catalyst 8.9 (8.530) – Gigabyte HD4850 series / HiS IceQ4 – Vista/XP
- nvidia: ForceWare 177.92 beta – GeForce 9 series - Vista/XP
- nvidia: ForceWare 178.24 whql - Gigabyte GTX260 (216SP) - Vista/XP
- GPU-Z 0.2.8
- FRAPS 2.9.6
- RivaTuner 2.11
- ATiTrayTools 1.6.1386beta
- Fur Stability Benchmark
- AtiTool 0.27b4
Karty użyte do testu:
- Gainward HD4870 (750/3800 : 775/4000) 512MB GoldenSample
- Sapphire HD4870 (780/4000) 512MB Toxic
- MSI HD4870 (750/3600) 512MB
- Gainward HD4870 (700/2200) 512MB GoldenSample
- ASUS HD4850 (680/2100) 512MB TOP
- PowerColor HD4830 (575/1800) 512MB
- HiS HD3870 GDDR4 (777/2252) 512MB
- MSI HD4670 GDDR3 (750/2000) 512MB
- MSI HD4650 DDR2 (600/1000) 256MB
- Gigabyte GeForce GTX260OC (576/1242/1998) 896MB (216SP)
- Gigabyte GeForce GTX260 (576/1242/1998) 896MB (192SP)
- ASUS GeForce 9800GTX+ (740/1836/2200) 512MB
- ASUS GeForce 9800GT (600/1500/1800) 512MB HybridPower
- Gigabyte GeForce 9600GT (650/1625/1800) 512MB
- XFX GeForce 9600GSO (680/1700/1900) 384MB XXX
** poglądowy schemat rozmieszczenia punktów pomiaru generowanego hałasu [dB]
1.pierwszy punkt pomiarowy - karta
2.drugi punkt pomiarowy - stanowisko
Testy: 3DMark'06, 3DMarkVantage
W testach syntetycznych, w przypadku 3Dmark'06 szanse obydwu porównywanych kart zdają się być stosunkowo wyrównane. Sprawa komplikuje się jednak na niekorzyść GeForce'a, w momencie uaktywnienia wygładzania krawędzi. Co ciekawe, znacznie podkręcenie Radeona HD4830 pozwoli mu co najwyżej zbliżyć się do referencyjnie taktowanego HD4850. Nowszy benchmark, zgodny już z DirectX 10, to nieco większe dysproporcje, nie tylko jeżeli chodzi o bezpośrednie starcie z GeForce'm, ale także z mocniejszym, domyślnie taktowanym bratem (HD4850).
Testy: Gry z ustawieniami noAA
Testy w grach niemal potwierdzają sytuację z programów syntetycznych, co z reguły jest już niemałą rzadkością. Podkręcony HD4830 przegania referencyjne HD4850 jedynie w „Lost Planet”, zrównując się tu osiągami z konkurencyjnym GeForce'em (notabene niepodkręconym). W pozostałych tytułach, aby „złapać” za ostatni fps mocniejszą 850-tkę, nasze HD4830 musimy już porządnie podkręcić. Różnice między tymi kartami nie są duże (od kilku do kilkunastu procent), ale tu właśnie może leżeć „być albo nie być” w przypadku nowych gier i trybów wyższych od 1680x1050. Domyślnie taktowany GeForce jest kartą zauważalnie słabszą od Radeona HD4830, co nie przekreśla jednak zupełnie jego szans. Taką kartę możemy przecież także całkiem nieźle podkręcić.
Testy: Gry z ustawieniami AA
Nie zmieni to jednak wiele jeżeli chodzi o tryby z uaktywnionym wygładzaniem krawędzi. Tu zdecydowanie pierwsze skrzypce odgrywa nowocześniejsza architektura 'Terascale' układów RV770, niezależnie od jego wersji. Od kompletnej katastrofy GeForce'a ratuje jedynie niewielka strata w takich tytułach jak „World In Conflict”, „UT3”, czy „Lost Planet”.
Podsumowanie
Nareszcie, także w segmencie okupowanym przez GeForce 9800GT/8800GT mamy produkt, który może konkurować z w/w GeForce'ami, nie tylko prezentowaną wydajnością ale także ceną.
Praktycznie w każdym przeprowadzonym teście, za wyjątkiem „Lost Planet Extreme Conditon”, karta radzi sobie z propozycją nVIDII bez najmniejszych problemów. „Wyeksploatowane” nieco G92, będące sercem GeForce'a 9800GT, zbliżone osiągi prezentuje jedynie w rts-ie „World In Conflict”, oraz pamięciożernym „Stalkerze”; kładąc się w pozostałych tytułach już niemal bez walki „na macie”.
Legenda do tabelki:
+ : wskazanie / wygrana
/ (+) : ze wskazaniem na / pół punktu
- : bez wskazania
/ : remis
| cechy | Powercolor HD4830 | Gigabyte 9800GT zalman |
| specyfikacja DX | (10.1) + | (10.0) - |
| gabaryty karty | / | / |
| głośność chłodzenia | / | / |
| pobór energii | / | / |
| temperatura 2D | (28-29°C) + | (44-45°C) - |
| temperatura 3D | (61-62°C) + | (68-69°C) - |
| podkręcanie układu | 95MHz - | 170MHz + |
| podkręcanie pamięci | 170MHz / | 174MHz / |
| wsparcie dla PhysX | - | + |
| 3dmark'06 | /(+) | / |
| 3dmark'Vantage | + | - |
| Stalker | / | / |
| Bioshock | + | - |
| Unreal Tournament 3 | /(+) | / |
| Lost Planet EC | / | /(+) |
| ET: Quake Wars | + | - |
| Crysis | + | - |
| Half-Life 2 Episode Two | + | - |
| World in Conflict | / | / |
| Assassin's Creed | /(+) | / |
| Call of Juarez | + | - |
| NFS PROSTREET | + | - |
| cena | / | / |
| Ocena | 11,5pkt | 2,5pkt |
Popularność nowych kart ATi/AMD, w przypadku zbyt wysokich, utrzymujących się od jakiegoś czasu cen, może stać jednak pod niemałym znakiem zapytania. Aby ich opłacalność pozostała na dobrym poziomie, HD4830 nie powinien kosztować, w stosunku do mocniejszego HD4850, więcej jak 75-80% jego ceny, porównując oczywiście karty pochodzące od tych samych producentów.
Odstawiając jednak nieco na bok obecne koszty zakupu tego produktu, wydajność która jest tylko kilka, kilkanaście procent niższa od „pełnego” HD4850, pozwala na swobodną grę w rozdzielczości 1280x1024, praktycznie w każdy nowy tytuł, z detalami ustawionymi na maksymalny poziom.
Świetna propozycja od ATi, to także duże pole do popisu jeżeli chodzi o multimedia (UVD2 / Avivo HD), oraz co ważne dla węższej rzeszy użytkowników zgodność specyfikacyjna z OpenGL 3.0 oraz DX10.1. Czy warto zatem zainwestować w tę kartę mając na stanie np. monitor 19”? Odpowiedź brzmi – zdecydowanie tak. W przypadku wyższych przekątnych, lepszym wyborem okazuje się już HD4850, który po dodatkowym podkręceniu zaoferuje nieco lepsze osiągi, szczególnie w grach silnie wykorzystujących shadery, oraz zintensyfikowane teksturowanie.
Ocena karty która dotarła do testów, biorąc pod uwagę powyższą wydajność, niskie temperatury, niezły potencjał na overclocking, czy też akceptowalny pobór energii we wszystkich trybach pracy, znajduje moją przychylność. Jest to naprawdę świetny produkt w dobrej cenie, który nie ustrzegł się jednak kilku pomniejszych wad. Będą to z jednej strony prozaiczny brak gniazda S-video, a z drugiej, raczej głośne chłodzenie w trybie 3D.
Podziękowania dla firmy Powercolor za udostępnienie karty do testów: