Radeon HD 4800... GeForce 9800 GTX w poważnych opałach
Okazuje się, że czerwiec, to nie tylko gorący miesiąc rozpoczynającego się właśnie kalendarzowego lata, ale także "upał" panujący na rynku GPU. Cenowo - wydajnościowa wojna obydwu głównych graczy w segmencie układów graficznych, po niedawnej premierze "dżiforsów" GTX260 / GTX280, a także po dzisiejszej prezentacji Radeonów serii HD4800 wchodzi w kolejny etap.
Koncern ATI/AMD dziś właśnie, oficjalnie wprowadza nową rodzinę kart opartych o rdzeń RV770. Dotychczasowe jednoprocesorówki GeForce 9800GTX oraz 8800GTS-512/GT będą mieć zatem wreszcie realnego konkurenta.
W ostatnich dniach, dzięki wszechobecnym przeciekom prasowym, wiele mówiło się o realnej wydajności tych kart, oraz o ich poprawionej w stosunku do starszej rodziny architekturze. Dosyć niejednoznaczne informacje napływały w odniesieniu do liczby jednostek SP. Jak się okazało układ RV770 zawiera ich nie 480, czy też 640 ale aż 800!
Teoretyczna, zmiennoprzecinkowa wydajność tego chipa oscylować będzie zatem w okolicach 1,0-1,2 TFlopa w zależności od zegarów taktujących rdzeń układu. Jak wiadomo jest to wartość nieco wyższa nawet od niedawno zaprezentowanego przez nvidię GT200 (933 GFlops).
Ponadto, pięta achillesowa kart (niewielka liczba jednostek teksturujących w stosunku do układów konkurencji) to jak się wydaje także echo przeszłości. Jeżeli większość osób miała prawo przypuszczać, że firmie uda się wreszcie stworzyć chipa, który będzie w stanie zagrozić pozycji udanego G92 od nvidii, to chyba nikt jednak nie przypuszczał, że po uaktywnieniu wygładzania krawędzi nowe karty ATI nie pozostawią suchej nitki na popularnych do niedawna układach G92/G94.
Biorąc pod uwagę powyższe aspekty oraz konkurencyjną cenę Radeona HD4850, karty oparte o GeForce 8800GT / 8800GTS-512 jak i 9800GTX czekać może bardzo ciężki okres.
Architektura RV770
RV770 to już kolejny GPU zdolny do wykonywania kodu ShaderModel 4.1 (zgodność z API DirectX10.1). Nowe Radeony, wprowadzają jednak nową jakość do sprawdzonej architektury znanej z poprzednich układów (R600 / RV670).
Układ oznaczony jako RV770 składa się z niemal miliarda tranzystorów (956 milionów), zajmując przy tym powierzchnię (die size) niewiele mniejszą od 260mm2. To już druga generacja wydajnych chipów ATI wykonywanych w procesie produkcyjnym 55nm. Lepsze opanowanie litografii w tym procesie, pozwoliło firmie znacznie obniżyć koszty produkcji pojedynczego krzemowego wafla. Docelowo ma to efektywnie wpłynąć na cenę finalnego produktu, i jak widać po początkowych cenach jest tak w rzeczywistości.
Kolejna generacja architektury superskalarnej ATI, to nie tylko znaczne usprawnienia wydajności poszczególnych bloków wykonawczych (zwielokrotnienie ich liczby) ale również likwidacja słabych punktów na drodze, którą pokonują dane w poszczególnych blokach.
Nowe układy RV770 zawierają już 160 jednostek SP, co w porównaniu do starszych układów (64) jest ilością ponad 2,5 krotnie większą.
Architektura USSA (Unified Superscalar Shader Architecture) / Terascale Engine
Znając wcześniejszą budowę "komórek" stream procesorowych z RV670, wiemy jednak doskonale, iż całościowo znajduje się ich tu znacznie więcej : (4+1)5 * 160 = 800! Nie dziwi zatem parametr teoretycznej wydajności chipa określany na poziomie 1-ego i więcej TeraFlopa. W nowo zaprojektowanym rdzeniu producent podzielił jednostki SIMD na klastry po 10 "rdzeni", z których każdy posiada po 80SPu.
jedna ze 160-ciu "komórek" zawierających (4+1) pojedynczych SPu
ATI przebudowało także znaczną część rdzenia układu odpowiedzialną za efektywniejsze obliczenia arytmetyczno - logiczne wprowadzając, wzorem nvidii, dodatkowe 16KB bufory pamięci podręcznej (Local DataShare) dla każdego rdzenia SIMD, oraz (Global DataShare) do wymiany danych, alokacji i komunikacji pomiędzy 10 głównymi "rdzeniami" zawierającymi jednostki cieniujące SP. W strukturze obecnej architektury USSA (TeraScale Engine) znajduje się także 40 jednostek teksturujących (przypadających w liczbie po 4 na jeden z dziesięciu bloków SP), łącznie z dedykowanymi procesorami adresującymi TA.
schemat blokowy jednostki TU (Texture Unit)
Przebudowano także Render Back-Endy (RBE). Dzięki wsparciu dla funkcji "independent blending per render target", oraz usprawnieniom w Z/Stencil (podwojenie możliwych do wykonania operacji na sekundę) uzyskano znacząco lepszą wydajność trybów MSAA.
schemat blokowy RBE (Render Back-End)
Double Precision (FP64) - podobnie jak ma to miejsce w nowym układzie nvidii (GT200), RV770 posiada zdolność do wykonywania instrukcji zmiennoprzecinkowych o podwójnej precyzji (FP64). Mogą one zostać wykorzystane przy obliczeniach wymagających wysokiej dokładności wyników (zastosowania dedykowane do tej pory CPU). ATi szacuje wydajność w trybie 64-bitowej precyzji na 240GFlopów, co jest wartością dwukrotnie wyższą od możliwej do uzyskania na chipie konkurencyjnej nvidii (GT200). Double Precision, zgodne z normą IEE 754, jest także porównywalne wydajnościowo z zastosowaniem 5-iu czterordzeniowych procesorów x86.
256-bitowy kontroler pamięci potrafi wykorzystać nie tylko moduły GDDR3 zasilane napięciem 2.0V, ale również najnowszy standard GDDR5 (moduły zasilane napięciem 1.5V) o wysokiej częstotliwości pracy. Co bardzo istotne nowe kości nie potrzebują już stosowania skomplikowanego układu ścieżek na PCB, stąd zmniejszają się tu koszty projektowania oraz produkcji gotowej płytki.
UVD2 - Universal Video Decoder, został usprawniony o możliwość sprzętowych transformacji materiału video wysokiej rozdzielczości (HD) jednocześnie na dwóch źródłach. Daje to możliwość realnego wykorzystania funkcji takich jak m.in. "obraz w obrazie" (P-I-P).
Specyfikacja techniczna serii ATI Radeon HD 4800
- 956 million transistors on 55nm fabrication process
- PCI Express 2.0 x16 bus interface
- 256-bit GDDR3/GDDR5 memory interface
- MicrosoftR DirectXR 10.1 support
- Shader Model 4.1
- 32-bit floating point texture filtering
- Indexed cube map arrays
- Independent blend modes per render target
- Pixel coverage sample masking
- Read/write multi-sample surfaces with shaders
- Gather4 texture fetching
Unified Superscalar Shader Architecture
- 800 stream processing units
- Dynamic load balancing and resource allocation for vertex, geometry, and pixel shaders
- Common instruction set and texture unit access supported for all types of shaders
- Dedicated branch execution units and texture address processors
128-bit floating point precision for all operations
Command processor for reduced CPU overhead
Shader instruction and constant caches
Up to 160 texture fetches per clock cycle
Up to 128 textures per pixel
Fully associative multi-level texture cache design
DXTC and 3Dc+ texture compression
High resolution texture support (up to 8192 x 8192)
Fully associative texture Z/stencil cache designs
Double-sided hierarchical Z/stencil buffer
Early Z test, Re-Z, Z Range optimization, and Fast Z Clear
Lossless Z & stencil compression (up to 128:1)
Lossless color compression (up to 8:1)
8 render targets (MRTs) with anti-aliasing support
Physics processing support
Dynamic Geometry Acceleration
- High performance vertex cache
- Programmable tessellation unit
- Accelerated geometry shader path for geometry amplification
- Memory read/write cache for improved stream output performance
Anti-aliasing features
- Multi-sample anti-aliasing (2, 4 or 8 samples per pixel)
- Up to 24x Custom Filter Anti-Aliasing (CFAA) for improved quality
- Adaptive super-sampling and multi-sampling
- Gamma correct
- Super AA (ATI CrossFireXT configurations only)
- All anti-aliasing features compatible with HDR rendering
Texture filtering features
- 2x/4x/8x/16x high quality adaptive anisotropic filtering modes (up to 128 taps per pixel)
- 128-bit floating point HDR texture filtering
- sRGB filtering (gamma/degamma)
- Percentage Closer Filtering (PCF)
- Depth & stencil texture (DST) format support
- Shared exponent HDR (RGBE 9:9:9:5) texture format support
OpenGL 2.0 support
ATI Avivo HD Video and Display Platform
- 2nd generation Unified Video Decoder (UVD 2)
- Enabling hardware decode acceleration of H.264, VC-1 and MPEG-2
- Dual stream playback (or Picture-in-picture)
Hardware MPEG-1, and DivX video decode acceleration
- Motion compensation and IDCT
ATI Avivo Video Post Processor
- New enhanced DVD upconversion to HD new!
- New automatic and dynamic contrast adjustment new!
- Color space conversion
- Chroma subsampling format conversion
- Horizontal and vertical scaling
- Gamma correction
- Advanced vector adaptive per-pixel de-interlacing
- De-blocking and noise reduction filtering
- Detail enhancement
- Inverse telecine (2:2 and 3:2 pull-down correction)
- Bad edit correction
- Full score in HQV (SD) and HQV (HD) video quality benchmarks
Two independent display controllers
- Drive two displays simultaneously with independent resolutions, refresh rates, color controls and video overlays for each display
- Full 30-bit display processing
- Programmable piecewise linear gamma correction, color correction, and color space conversion
- Spatial/temporal dithering provides 30-bit color quality on 24-bit and 18-bit displays
- High quality pre- and post-scaling engines, with underscan support for all display outputs
- Content-adaptive de-flicker filtering for interlaced displays
- Fast, glitch-free mode switching
- Hardware cursor
Two integrated DVI display outputs
- Primary supports 18-, 24-, and 30-bit digital displays at all resolutions up to 1920x1200 (single-link DVI) or 2560x1600 (dual-link DVI)
- Secondary supports 18-, 24-, and 30-bit digital displays at all resolutions up to 1920x1200 (single-link DVI only)
- Each includes a dual-link HDCP encoder with on-chip key storage for high resolution playback of protected content
Two integrated 400MHz 30-bit RAMDACs
- Each supports analog displays connected by VGA at all resolutions up to 2048x1536
DisplayPortT output support
- Supports 24- and 30-bit displays at all resolutions up to 2560x1600
HDMI output support
- Supports all display resolutions up to 1920x1080
- Integrated HD audio controller with up to 2 channel 48 kHz stereo or multi-channel (7.1) AC3 enabling a plug-and-play cable-less audio solution
Integrated AMD XilleonT HDTV encoder
Provides high quality analog TV output (component/S-video/composite)
Supports SDTV and HDTV resolutions
Underscan and overscan compensation
MPEG-2, MPEG-4, DivX, WMV9, VC-1, and H.264/AVC encoding and transcoding
Seamless integration of pixel shaders with video in real time
VGA mode support on all display outputs
- ATI PowerPlay
- Advanced power management technology for optimal performance and power savings
- Performance-on-Demand
- Constantly monitors GPU activity, dynamically adjusting clocks and voltage based on user scenario
- Clock and memory speed throttling
- Voltage switching
- Dynamic clock gating
- Central thermal management - on-chip sensor monitors GPU temperature and triggers thermal actions as required
ATI CrossFireXT Multi-GPU Technology
- Scale up rendering performance and image quality with two GPUs
- Integrated compositing engine
- High performance dual channel bridge interconnect
Nowa rodzina kart: HD 4850 i HD 4870
Obydwie wersje nowych Radeonów zostały wyposażone w ten sam rdzeń RV770. Jak wynika z tabeli, ATi nie idzie ścieżką nvidii i nie "kastruje" swoich układów z części jednostek wykonawczych. W obydwu wersjach HD4800 pozostało tyle samo.
Radeon HD 4870
- Radeon HD 4850
Mocniejsza karta posiada szybszy o 125MHz zegar taktujący rdzeń (750MHz). Zastosowane tu pamięci, to niskonapięciowe moduły GDDR5 o bardzo wysokiej częstotliwości pracy. 1,94GHz (3,88Ghz efektywnie) daje to jej przepustowość na poziomie ponad 120GB/s, nawet pomimo "wąskiej" 256-bitowej szyny. Dzięki wysokiemu zegarowi oraz 40 jednostkom teksturującym TU, współczynnik wypełniania przekracza 30.000 MegaTexeli/s, a teoretyczna wydajność zmiennoprzecinkowa chipa oscyluje w granicach aż 1,2 TeraFlopa na sekundę.
Maksymalny pobór energii (TDP) dla tej konstrukcji podawany jest jako 160W, a więc całkiem podobnie jak przy GeForce 9800GTX. Przy takim poborze, kartę wyposażono już w dwie 6-pinowe wtyczki dodatkowego zasilania PEG. System chłodzenia z niewielkimi modyfikacjami do złudzenia przypomina doskonale znany moduł "suszarki" z Radeona HD2900XT. Mniejsze zapotrzebowanie na "prąd" od R200 daje jednak nadzieję na wydzielanie zdecydowanie mniejszej ilości hałasu, oraz uzyskanie niższej temperatury pracy.
| Radeon 2900XT | Radeon 3870 | Radeon 3870 X2 | Radeon 4870 | |
| nazwa rdzenia | R600 | RV670XT | 2x R680 | RV770 |
| technologia | 80nm | 55nm | 55nm | 55nm |
| licz. tranzys. powierz. rdzenia | 700 mln 408 mm2 | 666 mln 192 mm2 | 666 mln 192 mm2 | 965 mln 256 mm2 |
| maksymalne TDP | 200 W | 110 W | 200 W | 160 W |
| jednostki RBE jednostki TMU | 16 16 | 16 16 | 2 x16 2x 16 | 16 40 |
| jednostki SP | 64 (320) | 64 (320) | 2x 64 (640) | 160 (800) |
| zegar GPU | 742 MHz | 776 MHz | 825 MHz | 750 MHz |
| wydajność wypełniania | 11 870 MT/s | 12 416 MT/s | 26 400 MT/s | 30 000 MT/s |
| wydajność zmienn. | 475 GFlops | 497 GFlops | 1056 GFlops | 1200 GFlops |
| zegar pamięci | DDR 825 MHz ef. 1650 MHz | DDR 1125 MHz ef. 2250 MHz | DDR 900 MHz ef. 1800 MHz | DDR 1940 MHz ef. 3880 MHz |
| przepustowość pamięci | 103 GB/s | 70 GB/s | 2x 56 GB/s | 121 GB/s |
| ilość i typ pamięci | 512 MB GDDR 512-bit | 512 MB GDDR4 256-bit | 2x 512 MB GDDR3 256-bit | 512 MB GDDR5 256-bit |
| magistrala | PCI-E 16x 1.0/1.1 | PCI-E 16x 2.0 | PCI-E 16x 1.1 | PCI-E 16x 2.0 |
| chłodzenie | dwuslotowe | dwuslotowe | dwuslotowe | dwuslotowe |
| sprzętowe HD | tak AVIVO HD | tak AVIVO HD | tak AVIVO HD UVD | tak AVIVO HD UVD 2 |
| multi-GPU | CrossFire | CrossFire X | CrossFire | CrossFire X |
| dodatkowe zasilanie | 1x 6pin, 1x8-pin | 1x 6pin | 1x 6pin 1x 8pin | 2x 6pin |
Jak można się łatwo domyślić, "uboższy" brat HD4870 posiada obniżone zegary rdzenia oraz pamięci do poziomu odpowiednio 625 oraz 993MHz (efektywnie 1986MHz). Zastosowane moduły pamięci są tu jednak starszego typu - GDDR3. Mając na uwadze niższe czasy dostępu stosowane przy kościach GDDR3, strata wydawać by się mogło, będzie niewielka. AMD obiecuje jednak znacząco lepszą efektywność rdzenia RV770 przy zastosowaniu modułów GDDR5. Niższy współczynnik TDP - 110W jest niewiele wyższy od wartości Thermal Design Power obarczającej starszego Radeona HD3850 czy GeForce 8800GT; tu jak na prezentowaną wydajność jest zatem przyzwoicie. Zastosowane chłodzenie jednoslotowe to również kolejne "deja vu". Mieliśmy okazję podziwiać je przecież przy okazji premiery poprzedniej serii referencyjnych kart HD3850.
| Radeon 2900 Pro | Radeon 3850 | Radeon 4850 | |
| nazwa rdzenia | R600 | RV670 Pro | RV770 |
| technologia | 80 nm | 55 nm | 55 nm |
| licz. tranzys. powierz. rdzenia | 700 mln 408 mm2 | 666 mln 192 mm2 | 956 mln 256 mm2 |
| maksymalne TDP | 200 W | 95 W | 110 W |
| jednostki RBE jednostki TMU | 16 16 | 16 16 | 16 40 |
| jednostki SP | 64 (320) | 64 (320) | 160 (800) |
| zegar GPU | 600 MHz | 668 MHz | 625 MHz |
| wydajność wypełniania | 9 600 MT/s | 10 688 MT/s | 25 000 MT/s |
| wydajność zmienn. | 384 GFlops | 428 GFlops | 1000 GFlops |
| zegar pamięci | DDR 800 MHz (ef. 1600 MHz) | DDR 827 MHz (ef. 1654 MHz) | DDR 993 MHz ef. 1986 MHz |
| przepustowość pamięci | 100 GB/s | 51 GB/s | 62 GB/s |
| ilość i typ pamięci | 512 MB GDDR3 512-bit | 256 MB GDDR3 256-bit | 512 MB GDDR3 256-bit |
| magistrala | PCI-E 16x 1.1 | PCI-E 16x 2.0 | PCI-E 16x 2.0 |
| chłodzenie | dwuslotowe | jednoslotowe | jednoslotowe |
| sprzętowe HD | tak AVIVO HD | tak AVIVO HD UVD | tak AVIVO HD UVD 2 |
| multi-GPU | CrossFire | CrossFire X | CrossFire X |
| dodatkowe zasilanie | 1x 6pin, 1x8-pin | 1x 6-pin | 1x 6-pin |
Temperatura i pobór energii
Testowana, referencyjna karta HD4850 wyprodukowana przez PowerColor, nie odbiega w zasadniczy sposób od doskonale znanych pierwszych konstrukcji z Radeonem HD3850. Jednoslotowe rozwiązania pomimo, że mają swoje wady (głośność, słaba wydajność odprowadzania ciepła) mogą znaleźć amatorów wśród entuzjastów techniki łączenia 4-ech kart na płycie głównej z chipsetem AMD790FX - CrossFireX.
karta PowerColor HD 4850
- karta referencyjna HD 4850
Jeżeli chodzi o naszego testowego Radeona HD4850, notabene zamarkowanego przez producenta jako wersja ewaluacyjna, wynikła dosyć ciekawa sytuacja. W momencie załadowania systemu operacyjnego (bez instalacji sterownika), karta przegrzała się po około 10minutach, powodując jednocześnie zawieszenie systemu. Bardzo ważne okazało się tutaj odpowiednio "szybkie" zainstalowanie driverów, a tym samym ustalenie poprawnej pracy wentylatora i zegarów taktujących, nie wspominając o odpowiednim doborze napięcia zasilania w trybie 2D - obniżenie temperatury. Wersje sklepowe takich problemów raczej mieć nie powinny.
| prędkość wentylatora | GPU 2D wentylacja w obudowie | GPU 2D bez dodatkowej wentylacji | GPU 3D |
| 55-60% 4500-5000rpm | 57-58°C | 65-66°C | 91-95°C |
| * GPU-Z 0.2.4 wynik pomiaru obrotów (rpm) może nie zgadzać się z rzeczywistością | |||
Jako, że mamy do czynienia z nowością na rynku, nie ma obecnie zbyt wielu programów umożliwiających zaawansowaną kontrolę nad kartą opartą o rdzeń RV770.
RivaTuner 2.09 w chwili testów jeszcze nie współpracuje z kartami serii HD4800
Po części jednak możemy zaufać aplikacji GPU-Z oraz ATI Overdrive, choć w tym pierwszym przypadku część parametrów odnoszących się do obrotów wentylatora jest zdecydowanie niepoprawnie odczytywana. Wystarczy przecież wyobrazić sobie "odlatujący" z obudowy jednowirnikowy (około 10.000rpm dla 100% vent duty cycle) samolot HD4850, a wszystko stanie się jasne :) Tymczasem karta podczas pracy jest "zauważalnie" cichsza od podobnych w założeniu konstrukcji referencyjnych montowanych na GeForce'ach 8800GT.
GPU-Z - prosty monitoring, choć wciąż mało wiarygodny
Overdrive od ATI, pomimo ograniczonej funkcjonalności, posiada widoczną zaletę jaką jest możliwość podkręcenia układu, pamięci oraz monitoring aktywności GPU.
ATI Overdrive - prosty monitoring oraz overclocking
Pobór energii kart graficznych w warunkach przeciętnego testera, jest praktycznie niemożliwy - konieczność monitorowania sumarycznego przepływu prądu w gniazdach PCI-E oraz PEG (dodatkowego zasilania). Tym niemniej, wartości względne różnic pomiędzy kompletnymi systemami, mierzone standardowym miernikiem, powinny okazać się dosyć ciekawe.
| C'n'Q wyłączone | pobór energii całej platformy testowej [W] | |||
| karta graficzna | 2D spoczynek | 2D AVC-1 (H.264) | 3D typowe | 3D szczytowe |
| Radeon 3870 GDDR4 | 129 | 148 | 240~260 | 283 |
| Radeon 4850 GDDR3 | 147 | 173 | 260~280 | 304 |
| GeForce 9800 GTX | 158 | 186 | 270~290 | 321 |
| Radeon 3870 X2 | 153 | 179 | 340~370 | 397 |
| GeForce 9800 GX2 | 210 | 238 | 360~380 | 407 |
Karta Radeon HD4850 "pożera" około 20-25 Watt więcej od starszego brata HD3870 w typowych zadaniach do jakich wykorzystujemy komputer, oraz kilka, kilkanaście Watt mniej od GeForce'a 9800GTX. 110W TDP sugerowane przez ATI jest zatem wartością bardzo optymistyczną, choć jak widać po wynikach zupełnie możliwą. Pamiętajmy, że nie można odejmować od wartości 3D peak (maksymalnego zmierzonego chwilowego obciążenia) trybu 2D idle (spoczynku) celem orientacyjnego oznaczenia parametru TDP. Wpływ obciążenia pozostałych komponentów (chipset / napędy / pamięci / procesor) skutecznie to uniemożliwia.
Platforma testowa
- AMD Phenom 8650 - Triple-Core, 2300MHz @ 2900MHz
- MSI K9A2 Platinum rev1 (AMD 790FX) CrossFireX sAM2+ (bios v1.33beta)
- Coolermaster Hyper TX2 sAM2
- Kingston HyperX DDR2-1066 2x1GB CL 5-5-5-18 CMD 2T unganged mode
- Seagate 250GB 7200.10 ST3250410AS 16MBcache NCQ
- Chieftec CH-03-PA
- Chieftec CFT-620-A12S
Sterowniki, system operacyjny i narzędzia:
- Windows XP Professional SP3 PL
- Windows VISTA Home Premium SP1 PL
- DirectX March'08 update
- amd: AMD X2 driver 1.3.2.0.53 - WinXP
- nvidia: ForceWare 174.74 beta - GeForce 8 series - WinXP
- nvidia: ForceWare 175.12 beta/.16 whql - GeForce 8/9 series - Vista/XP
- nvidia: ForceWare 177.26 beta - GeForce GTX 280 - Vista/XP
- ati: Catalyst (8.471.1) Vantage Hotfix - Vista
- ati: Catalyst 8.5 / Assassin's Creed, HL2E2 - HD3870 G4, HD3870X2 - Vista
- ati: Catalyst 8.6 (8.501.1) - HD4850 - WinXP/Vista
- GPU-Z 0.2.4
- FRAPS 2.9.4
- RivaTuner 2.09
- Fur Stability Benchmark
Karty użyte do testu:
- nvidia GeForce GTX 280 (602/1296/2214) 1GB (referencyjna)
- ASUS GeForce 9800GX2 (602/1500/2000) 1GB
- ASUS GeForce 9800GTX (675/1688/2200) 512MB
- ASUS GeForce 8800GTS (650/1625/1950) 512MB
- BFG GeForce 8800GT (625/1560/1800) 512MB OC
- Gigabyte Gigabyte 9600GT (650/1750/1800) 512MB Zalman
- Gainward GeForce 8800GS (575/1438/1700) 384MB
- ASUS Radeon HD3870X2 GDDR3 (825/1800) 1GB
- Powercolor Radeon HD3870GDDR4 (776/2250) 512MB
- Gigabyte Radeon HD3870 GDDR3 (776/1890) 512MB Zalman
- ASUS Radeon HD3650 GDDR3 (725/1400) 512MB SILENT
Testy wydajności: 3DMark 06 (DX 9c)
Testy HDR (SM3.0) zawarte w benchmarku 3dmark'06 ukazują bardzo ciekawą sytuację. Karty Radeon HD4850 są wydajniejsze po uaktywnieniu antyaliasingu od podkręconego znacznie GeForce'a 9800GTX. Jeszcze kilka tygodni temu, spekulacje tego typu wywoływać mogły na twarzy niejednego fana kart nvidii co najwyżej uśmiech politowania :)
Testy wydajności: 3DMark Vantage (DX10)
Ta sama sytuacja powtarza się pod 3dmark Vantage. Im wyższe obciążenie (profile High i Extreme) tym zysk wydajności nad kartami GeForce 9800GTX będzie wyższy. Najważniejsze pytanie, które się nasuwa jednak, to gdzie w takim razie znajduje się w tej hierarchii bezpośredni konkurent jakim miał być GeForce 8800GT? :)
W odniesieniu do teoretycznych wartości wypełniania poszczególnych rdzeni, realna wartość "Texture Fillrate" będzie o wiele niższa. To co prezentuje sobą nowy Radeon można określić właściwie jednym tylko słowem - rewelacja. Przy 40-stu jednostkach TU, karta oferuje zbliżone możliwości do układu GTX 280, dla którego osiągnięta wartość wydaje się jednak być daleką od możliwości jakie drzemią w tym potężnym chipie.
Testy wydajności: STALKER
Test "S.T.A.L.K.E.R. - Cień Czarnobyla" wykazuje znaczną przewagę nowego Radeona HD4850 nad poprzednim "Radkiem" HD3870. Uzyskiwane wyniki są tu niemal identyczne jak na referencyjnie taktowanym GeForce'ie 9800GTX.
Testy wydajności: HALF LIFE 2 Episode Two
"Half-Life 2 Epiosode Two", również szereguje tę kartę w jednej linii z wydajnym 9800GTX, jednak tylko do momentu kiedy nie uaktywnimy anty-aliasingu. Po takiej operacji, nowy Radeon przegania ze swobodą podkręconego GTX'a, zrównując się tym samym z dwuprocesorówką HD3870X2.
Testy wydajności: BioShock (DX10)
W "Bioshocku" ponownie szybciej od 9800GTX, z tym że różnica jest tu jeszcze wyższa niż w poprzednich testach. Jakby tego było mało, ukazały się właśnie nowe sterowniki RC4 dla kart opartych o RV770 poprawiające w tej grze, już i tak nie małą, wydajność.
Testy wydjaności: Unreal Tournament 3
W "UT3" jest już nieco słabiej, widoczny wpływ wydajności CPU na poszczególne wyniki. Średnio jednak, jest nadal lepiej od GeForce 8800GT, i prawie na poziomie 8800GTS-512. Wciąż zatem całkiem przyzwoicie.
Testy wydajności: Lost Planet (DX10)
Pomimo wyraźnie zaznaczonej optymalizacji pod kątem kart nvidia, w "Lost Planet" po uaktywnieniu 8-krotnego wygładzania krawędzi, karta HD4850 jest wydajniejsza o kilka klatek od GeForce 9800GTX! W niższych ustawieniach wydajność oscyluje już tylko wokół 9600GT.
Testy wydajności: Enemy Territory: Quake Wars
Środowisko OpenGL i "Quake Wars" prezentują podobne wyniki jak w Half-Life'ie. Bez AA na poziomie 9800GTX, z antyalisingiem ... kolejna deklasacja rywala.
Testy wydajności: World in Conflict (DX10)
W "World In Coflict" wydajność nowego "graficznego" rozwiązania ATI/AMD plasuje się gdzieś pomiędzy GeForce'ami 8800GT, a GTS-512.
Testy wydajności: Assassin's Creed
Gra "TPP" jaką jest "Assassin's Creed", ponownie wykazuje współzbieżność wydajnościową HD4850 z kartą GeForce 9800GTX. W rozdzielczości Full-HD nowy Radeon jest jednak minimalnie szybszy, w niższej minimalnie wolniejszy. Różnice są jednak stosunkowo niewielkie.
Testy wydajności: Need For Speed PRO STREET
Test przeprowadzony na najmłodszej odsłonie "wyścigówki" Electronic Arts - NFS "ProStreet" to już - nie bójmy się użyć tego słowa - "dewastacja" GeForce'a 9800GTX. Ponad 10kl/s lepiej, aniżeli na mocno podkręconym GTX'ie mówi chyba samo za siebie.
Testy wydajności: CRYSIS (DX10)
"Crysis" potwierdza prawidłowość z poprzednich do tej pory przeprowadzonych testów. Radeon HD4850 zdaje się być konkurentem nie tyle dla GeForce'a 8800GT, co dla jego bardziej wydajnych jednoprocesorowych "braci", wyposażonych w 128 jednostek SP (8800GTS-512 oraz 9800GTX).
Podsumowanie
Sytuacja na rynku kart graficznych już dawno nie była tak interesująca. To co przed tygodniem zaoferowała nvidia (GeForce GTX280), raczej nie można było nazwać produktem dla mas. ATI, tak jak w przypadku poprzedniej serii HD3800 wstrzeliło się i tym razem w założony wcześniej docelowy target.
Co bardzo istotne, Radeon HD4850 na dzień dzisiejszy niemal "wymiótł" wszelkie jednoprocesorowe odmiany chipu G92 z zajmowanych do tej pory półek cenowych. Według AMD sugerowany koszt zakupu, który początkowo ustalony został na poziomie 549 zł, obecnie może spaść nawet do 499 zł za kartę HD4850 wyposażoną w 512MB pamięci GDDR3.
Jako, że jest to produkt w założeniu konkurujący z GeForce 8800GT, a jak widać po testach radzi sobie w ich części nawet z GeForce 9800GTX, takie pozytywne informacje to jak woda na młyn dla potencjalnych konsumentów, chcących nabyć upragnioną, wydajną a przy tym stosunkowo tanią "grafikę".
pierwsza sklepowa karta HD 4850 która trafiła do naszej redakcji,
to karta obudowie referencyjnej
Pierwsze "jaskółki" wprowadzenia na rynek nowych Radeonów już oczywiście widać. Jedną z nich jest znaczący spadek cen kart wyposażonych w GeForce 8800GT / GTS-512 oraz 9800GTX. Drugą - szybkie wprowadzenie podkręconej wersji ostatniej wspomnianej karty pod nazwą 9800GTX+.
GTX(plus) oprócz tego, że został wyposażony w rdzeń G92 wykonany w niższym procesie technologicznym (55nm), ma podniesiony do poziomu 738MHz dla rdzenia zegar. Shadery ustalone na poziomie 1836MHz, a pamięci GDDR3 na 1.1GHz (2.2GHz efektywnie). Sugerowana cena tej karty ma wynosić 229$, podczas gdy jej starsze wersje (bez plusika w nazwie) mają cenowo zrównać się z HD4850 (około 199$).
Patrząc jednak na wyniki wyżej podkręconego GTX'a w naszym zestawieniu, wydaje się, że jest to swego rodzaju "łabędzi śpiew". Nvidia, jeżeli już tego nie robi, to na pewno powinna pracować nad układami opartymi o architekturę GT200 w technologii 55nm, skierowanymi w te segmenty rynku, które obecnie zostały bardzo udanie "zaatakowane" przez wydajne i tanie Radeony HD4800.