Czy liczba linii PCI-Express wpływa na wydajność karty graficznej?

Zapewne przynajmniej raz staliście przed wyborem płyty głównej i chodziło wam o jak najlepszy model w jak najniższej cenie. Najlepsze konstrukcje na ogół są wyposażone w większą liczbę gniazd PCI-Express, które mogą obsłużyć nawet cztery Radeony lub GeForce'y, odpowiednio w technologii CrossFireX lub 4-way SLI.

Paweł Maziarz

Producenci często jednak stosują swego rodzaju trik, w postaci pięciu lub większej liczbie gniazd PCI-Express x16, spośród których jedynie dwa lub trzy są wyposażone w 16 linii transmisyjnych, a pozostałe pracują w trybie x4 lub nawet x1.

Image

Sztandarowym przykładem takiej konstrukcji jest model Big Bang-Marshal od MSI, który na osiem złączy x16 ma jedynie elektrycznie dwa pełnowymiarowe x16, dwa x8 oraz cztery x1. Warto jednak zaznaczyć, że taki stan rzeczy często jest spowodowany przez sam chipset, w który płyta została wyposażona. Pod tym względem najlepsze możliwości oferują flagowe chipsety Intela, AMD i NVIDII – od Intela odpowiednio X38, X48 i X58, od AMD 790GX, 790FX, 890GX i 890FX oraz od NVIDII nForce 750i SLI,  nForce 780a, nForce 780i SLI, nForce 790i SLI, nForce 980a. Modele te cechują się na tyle dużą liczbą linii PCI-Express 2.0, by podzielić je na dwa porty działające w trybie x16 lub cztery w trybie x8.

Producenci próbują obejść to ograniczenie, poprzez umieszczanie na płycie głównej mostka NVIDIA NF200 lub układu Lucid Hydra (dodatkowo pozwalającego na łączenie dwóch różnych GeForce'ów / Radeonów). W tym momencie warto również powiedzieć o ciekawym rozwiązaniu ASUSa o nazwie ROG Xpander. To duża płytka PCB z dwoma mostkami NF200, która umożliwia podłączenie czterech kart graficznych w trybie PCI-Express x16, ale tylko na płytach głównych ASUS Rampage III Extreme/Formula/Black Edition – domyślnie oferujących możliwość podłączenia czterech kart graficznych w trybie PCI-Express x8.

Wracając jednak do różnicy między teoretyczną a faktyczną przepustowością PCI-Expressów, problem oczywiście nie dotyczy jedynie najdroższych produktów, ale także tych tańszych – przykładowo na płycie głównej montuje się dwa PCI-Expressy x16, z czego jeden to prawdziwy x16, a drugi elektrycznie już tylko x4 (z mniejszą ilością styków). Trzeba przyznać, że bardziej jesteśmy skłonni zakupić płytę główną z - przykładowo - dwoma portami działającymi w trybie x16, niż jednym x16 i jednym x4. Analogicznie sprawa wygląda w przypadku bardziej „wypasionych” konstrukcji, z dajmy na to dwoma portami x8 i jednym x16, chętniej kupowanymi od tych z dwoma x8 i jednym x4. Dlaczego tak jest?

Sprawa jest banalna – zostawiamy sobie otwartą furtkę na ewentualną rozbudowę komputera o kolejną kartę graficzną. W naszych głowach istnieje przekonanie, że gniazdo PCI-Express z mniejszą niż 16 liczbą linii będzie ograniczać wydajność karty graficznej. Nie mówiąc już o wersjach x4 i x1, które są w naszym mniemaniu przeznaczone tylko dla kontrolerów, kart dźwiękowych, sieciowych lub telewizyjnych. Czy tak naprawdę jest? Niektórzy sądzą, że tak i te osoby stanowią zdecydowaną większość bardziej obeznanych w temacie posiadaczy komputerów*.

Mniejsza grupa osób jest przekonana, że w dużym stopniu tylko PCI-Express x4 i x1 ograniczy wydajność karty graficznej. Postanowiłem więc przeprowadzić testy, aby potwierdzić lub obalić teorię z ograniczaniem karty graficznej przez magistralę PCI-Express z mniejszą niż 16 liczbą linii transmisyjnych.

*wyniki na podstawie prywatnej ankiety przeprowadzonej wśród zaawansowanych użytkowników komputera

Spis treści

Krótko o magistrali PCI-Express 

Na samym początku należało by co nieco powiedzieć o magistrali PCI-Express. Nie chodzi tutaj jednak o to, by zagłębiać się w jej specyfikację, a o przypomnienie sobie jej wersji i fizycznej budowy. Dotychczas wydano trzy główne specyfikacje magistrali, które zostały oznaczone wersjami 1.0 (z 2003 roku), 2.0 (z 2005 roku) i 3.0 (z 2010 roku), z czego na razie tylko dwie pierwsze są wykorzystywane - trzecia czeka na zainteresowanie producentów sprzętu komputerowego.

Każda następna wersja magistrali posiada dwa razy większą przepustowość niż poprzednia. Przykładowo więc PCI-Express 2.x x16 oferuje przepustowość 16 GB/s, natomiast PCI-Express 1.x x16 tylko 8 GB/s. Wersje złącz PCI-Express można również podzielić na wykorzystanie linii transmisyjnych – każde dwukrotne zmniejszenie linii powoduje zmniejszenie przepustowości o dwa razy. Wraz z tym następuje zmniejszenie liczby pinów, a przez to czasami samej długości gniazda – o ile producenci nas nie oszukują. Możliwe warianty magistrali PCI-Express obrazuje poniższa tabelka, poniżej niej znajdziecie jeszcze zdjęcia magistral PCI-Express. Znajdziecie w niej również ilość styków, które wykorzystuje port PCI-Express w zależności od liczby linii.

Wersja magistrali Przepustowość Liczba styków
PCI-Express x1 1.x 500 MB/s 36 (2 x 18)
PCI-Express x4 1.x 2 GB/s 64 (2 x 32)
PCI-Express x8 1.x 4 GB/s 98 (2 x 49)
PCI-Express x16 1.x 8 GB/s 164 (2 x 82)
     
PCI-Express x1 2.x 1 GB/s 36 (2 x 18)
PCI-Express x4 2.x 4 GB/s 64 (2 x 32)
PCI-Express x8 2.x 8 GB/s 98 (2 x 49)
PCI-Express x16 2.x 16 GB/s 164 (2 x 82)
     
PCI-Express x1 3.0 2 GB/s 36 (2 x 18)
PCI-Express x4 3.0 8 GB/s 64 (2 x 32)
PCI-Express x8 3.0 16 GB/s 98 (2 x 49)
PCI-Express x16 3.0 32 GB/s 164 (2 x 82)
Image

 od góry PCI-Express x16, x4 i x1

Image

od góry PCI-Express x4, x8 i x16

Przygotowania do testów 

Przed testami chciałbym przedstawić jak przygotowałem komputer do przeprowadzenia testów. Jako, że moja płyta główna ASRock A785GXH/128M posiada tylko gniazdo PCI-Express 2.0 x16 i x4 musiałem odpowiednio zmodyfikować kartę graficzną do pracy z pozostałymi typami magistrali PCI-Express. Podczas przygotowań do testów próbowałem obsadzić kartę graficzną w porcie PCI-Express 2.0 x4. Niestety uznała ona, że to nie najlepszy pomysł i wolała bym korzystał ze zintegrowanego Radeona HD 4200 niż HD 5770 w trybie x4 :). Musiałem więc kombinować z gniazdem PCI-Express 2.0 x16 karty graficznej. Jak już wcześniej pisałem, złącze PCI-Express x16 posiada 164 styki (po 82 na każdej stronie laminatu karty bądź gniazda na płycie głównej) i to właśnie nimi „ustawiałem” dany tryb pracy magistrali. Tworząc brak połączenia między odpowiednimi stykami, powodowałem zmniejszenie liczby linii transmisyjnych, które umożliwiały komunikację między kartą graficzną, a płytą główną (dokładniej chipsetem). Oczywiście nie mogłem sobie pozwolić na nieodwracalne zmniejszenie linii (na przykład poprzez obcięcie gniazda na płycie głównej lub laminatu karty graficznej), a więc wybrałem mniej inwazyjny sposób. Zakleiłem odpowiednią liczbę styków na karcie graficznej taśmą i po takiej modyfikacji umieściłem ją w porcie na płycie głównej. Poniżej możecie zobaczyć zdjęcia z przerabiania ASUS Radeona HD 5770 :D.

Image
Image

ASUS Radeon HD 5770 ze standardowym złączem PCI-Express 2.0 x16

Image
Image

ASUS Radeon HD 5770 pracujący w trybie PCI-Express 2.0 x8 -

zasłonięte 66 styków (po 33 na obu stronach laminatu)

Image
Image

ASUS Radeon HD 5770 pracujący w trybie PCI-Express 2.0 x4 -

zasłonięte 100 styków (po 50 na obu stronach laminatu)

Image
Image

ASUS Radeon HD 5770 pracujący w trybie PCI-Express 2.0 x1 -

zasłonięte 128 styków (po 64 na obu stronach laminatu)

Platforma testowa

Procesor: AMD Athlon II X4 635 @ 3,5 GHz (14 x 250 MHz),

Chłodzenie procesora: SilentiumPC HE923 Spartan + Fander ROXO 92 mm,

Płyta główna: ASRock A785GXH/128M (BIOS 1.30),

Karta graficzna: ASUS Radeon HD 5770 512 MB (850 MHz / 4800 MHz),

Pamięć RAM: G.Skill PI DDR2 2 x 1 GB 1000 MHz CL5,

Dysk twardy: WD WD3200AAKS 320 GB,

Zasilacz: OCZ ModXStream Pro 500 W,

Obudowa: Cooler Master 690

System operacyjny: Windows 7 32 bit,

Sterowniki karty graficznej: AMD Catalyst 11.3,

Testy 

3DMark 2006

Image
Image

W 3DMarku 2006 karta graficzna niezależnie od wykorzystanych linii PCI-Express osiąga zbliżony wynik, choć wraz ze zmniejszaniem linii nieznacznie on maleje. Różnica między największą uzyskaną liczbą punktów (w trybie x16), a najmniejszą (w trybie x1) wynosi prawie 4%.

3DMark Vantage

Image
Image

W 3DMarku Vantage widać, że karta graficzna działająca w porcie PCI-Express x1, oferuje zdecydowanie niższą wydajność niż działające w portach o większej przepustowości. Procentowa różnica między najlepszym, a najgorszym wynikiem wynosi lekko ponad 12%.

3DMark 11

Image
Image

W najnowszej odsłonie 3DMarka - oznaczonej numerem 11 - jest podobnie jak w jego poprzedniej wersji. Największy spadek wydajności można zaobserwować w trybie x1, choć nie jest on aż tak duży jak w Vantage'u – wynosi 7%.

Unigine Heaven 2.5

Image
Image

Obserwując uzyskane wyniki w Unigine Heaven 2.5, można zauważyć podobieństwo do tych z dwóch najnowszych 3DMarków. Oznacza to więc, że obsadzenie HD 5770 jedynie w gnieździe PCI-Express x1 powoduje zauważalny, 13% spadek wydajności.

Aliens vs Predator

Image
Image
Image
Image

W Aliens vs Predator w niższych rozdzielczościach i detalach, spadek wydajności można zauważyć tylko podczas podłączenia karty graficznej do złącza PCI-Express, pracującego w trybie x1. W mniej wymagającym trybie wynosi on 18%, natomiast na średnich ustawieniach 15%. Kiedy uruchomimy grę w najwyższych detalach w wysokiej rozdzielczości, można zaobserwować, iż liczba klatek na sekundę zmniejsza się nawet po podłączeniu karty do PCI-Express x8. Oczywiście spadek wydajności w trybie x8 i x4 nie jest aż tak duży jak w trybie x1, gdzie wynosi aż 52%.

Batman: Arkham Asylum

Image
Image
Image
Image

Najnowszy Batman jest dosyć specyficzną grą, która pomimo dosyć ładnej grafiki (zgodnej z DirectX 9) nie wymaga naprawdę wydajnego sprzętu. W związku z tym w niższych rozdzielczościach i mniej wymagających detalach Radeon HD 5770 niezależnie od trybu pracy oferuje zbliżoną wydajność – procentowa różnica między największą, a najmniejszą liczbą klatek na sekundę wynosi 2%. Dopiero w rozdzielczości 1920x1080 i wysokich detalach wyraźnie widać spadek wydajności, ale tylko po podłączeniu karty do gniazda PCI-Express x1 – wynosi on 9%.

Call of Duty: Modern Warfare 2

Image
Image
Image
Image

Sytuacja w Call of Duty: Modern Warfare 2 jest całkowicie odmienna niż w Batmanie. Praktycznie w każdym trybie przeprowadzenia testu, mniejsza liczba linii magistrali PCI-Express zauważalnie wpływa na wydajność karty. Warto zwrócić uwagę na średnie i wysokie ustawienia gry, gdzie podczas korzystania z 16, 8 lub 4 linii możemy w pełni komfortowo cieszyć się grą, natomiast po włożeniu karty do najwolniejszego złącza wydajność na tyle maleje, że liczba klatek na sekundę spada poniżej progu płynności.

Crysis

Image
Image
Image
Image

Jak widzimy na wykresach, Crysis w dalszym ciągu jest grą, która na wyższych ustawieniach potrafi dać wycisk karcie graficznej ze średniej półki. Duże spadki wydajności są jednak widoczne tylko po podłączeniu karty graficznej do portu PCI-Express x1, natomiast w trybie x8 lub x4, spadki były bardzo małe lub co ciekawe były obecne delikatne wzrosty wydajności. Mogło być to jednak spowodowane błędami pomiarowymi. W zależności od ustawień graficznych, różnica między największą liczbą uzyskanych klatek na sekundę (nie zawsze podczas pracy w trybie x16), a najmniejszą (w trybie x1) wynosi od 6% do nawet 28%.

Colin McRae: DiRT 2

Image
Image
Image
Image

W DiRT 2 każde zmniejszenie linii magistrali PCI-Express powoduje zmniejszenie wydajności karty graficznej, ale tylko w dwóch najwolniejszych wersjach złącza PCI-Express jest on duży. Można zauważyć tutaj także jeden wyjątek - w najniższych detalach można zaobserwować delikatny wzrost płynności animacji podczas pracy karty graficznej w trybie x4. Prawdopodobnie jest to jednak błąd pomiarowy, który mógł być spowodowany niepowtarzalnością testu (o czym świadczy między innymi miejsce zajmowane w trakcie wyścigu jak i na mecie). Podobnie jak Modern Warfare 2, spadek wydajności Radeona HD 5770 umieszczonego w magistrali PCI-Express x1 jest tak duży (53% - 65%), że nie pozwala na komfortową rozrywkę w na każdych ustawieniach.

Devil May Cry 4

Image
Image
Image
Image

W Devil May Cry 4 zmniejszenie linii transmisyjnych powoduje zmniejszenie liczby fps-ów, ale dopiero podczas działania jej w trybie x1 przynosi wyraźny spadek wydajności. Umieszczenie karty graficznej w gnieździe działającym z prędkością x8 lub x4 nie powoduje dużego spadku wydajności – można by nawet powiedzieć, że jest on na granicy błędu pomiarowego.

Grand Theft Auto IV

Image
Image
Image
Image

W najniższych oraz średnich ustawieniach GTA IV w każdym trybie działa z podobną płynnością, a ewentualne różnice są na tyle małe, iż mogły zostać spowodowane błędem pomiarowym. Jedynie na najwyższych ustawieniach widać wyraźny spadek wydajności, po podłączeniu Radeona do dwóch wolniejszych gniazd – w trybie x4 spadek wynosi 8%, a w trybie x1 14%.

Mafia II

Image
Image
Image
Image

W Mafii II ma miejsce dosyć ciekawa sytuacja. Mianowicie, wraz ze zwiększaniem ustawień różnice między poszczególnymi trybami pracy karty graficznej się zacierają. Oznacza to więc, że w najniższych ustawieniach widoczna jest różnica między pracą w trybie x16, a x4 – nie mówiąc o x1 (tryb x8 działa bardzo podobnie jak x16). Po zwiększeniu ustawień do średnich spadek klatek na sekundę jest średni – wyraźnie widoczny jedynie w trybie x1. Po ustawieniu maksymalnych detali i dużej rozdzielczości, oferowana wydajność w trybie x1 jest praktycznie identyczna jak w trybie x16.

Metro 2033

Image
Image
Image
Image

Chyba każdy przyzna, że Metro 2033 to jedna z najbardziej wymagających gier obecnych na rynku (o ile nie najbardziej wymagająca). W najniższych ustawieniach spadek płynności jest widoczny podczas pracy karty graficznej w złączu PCI-Express x4 oraz x1 i co ciekawe jest on podobny. Wraz ze wzrostem ustawień różnice między kolejnymi trybami pracy karty graficznej są coraz większe. Procentowa różnica wydajności między najwyższych poziomem płynności animacji, a najniższym wynosi od 27% do 71%.

Unreal Tournament III

Image
Image
Image
Image

Sytuacja w już leciwym Unreal Tournamencie III jest dosyć dziwna. W najniższych ustawieniach, magistrala PCI-Express 2.0 x1 oferuje najwyższą wydajność, która się zmniejsza wraz ze zwiększaniem ilości linii transmisyjnych. Wraz ze zwiększaniem ustawień graficznych różnica ta jednak maleje, by w najwyższych ustawieniach graficznych sytuacja się odwróciła i było wszystko „normalnie”. Warto jednak zaznaczyć, że w każdym z trybów graficznych różnice w wydajności między pracą poszczególnych magistrali są na tyle małe by sądzić, iż zostały spowodowane błędem pomiarowym.

Podsumowanie 

Na samym początku chciałbym zauważyć pewną rzecz – każda następna wersja magistrali PCI-Express oferuje dwukrotnie wyższą przepustowość niż poprzednia. Jeżeli zatem, przykładowo, karta graficzna wykorzystuje magistralę PCI-Express 1.x x16, bez utraty wydajności możemy podłączyć ją do PCI-Expressa 2.x x8 na płycie głównej. Przykładem kart graficznych zgodnych z najstarszą wersją magistrali PCI-Express są wszystkie GeForce'y do serii 9000 oraz Radeony do serii HD 3000. Sprawa wyglądać będzie prawdopodobnie tak samo w przypadku złącza w wersji 3.0, które zostanie  wykorzystane być może w dwuprocesorowym Radeonie HD 7990.

Niewątpliwie najlepszą wydajność karty graficznej osiągniemy po podłączeniu jej do magistrali PCI-Express x16. Jeżeli jednak nie mamy do dyspozycji złącza o pełnej liczbie linii (na przykład w sytuacji kiedy chcemy podłączyć dwie karty graficzne w technologii CrossFire / SLI) bez problemu możemy wykorzystać gniazdo o dwukrotnie mniejszej przepustowości, działające w trybie x8. W większości przypadków ogranicza ono wydajność akceleratora graficznego w znikomym stopniu.

Image

Większość płyt głównych z chipsetem zapewniającym wsparcie tylko dla dwóch gniazd PCI-Express x8 jest dobrą ofertą dla mniej majętnych klientów. Konstrukcje tego typu kosztują zdecydowanie mniej, niż te z chipsetem z wyższej półki (nie wspominając o tych posiadających mostek NF200 lub układ Lucid Hydra, które jeszcze dodatkowo zwiększają liczbę linii PCI-Express) posiadającymi wsparcie dla co najmniej dwóch gniazd PCI-Express x16. Przypuszczam na podstawie testów, że obie konstrukcje (z dwoma złączami x16 oraz dwoma x8) w większości przypadków oferować będą podobną wydajność, a za zaoszczędzone pieniądze przy zakupie płyty głównej można dopłacić do wydajniejszej karty graficznej. W tym momencie warto powiedzieć o ciekawych konstrukcjach ASRocka o oznaczeniu 870 Extreme3 oraz 870 Extreme3 R2.0 (z podstawką AM3+). Modele te zostały wyposażone w chipset AMD 870 (najsłabszy z serii 800), który posiada tylko 22 linie PCI-Express. Producent ten wpadł na ciekawy pomysł i wyposażył płyty w dwa porty PCI-Express, które razem mogą działać z szybkością x8 / x8, a nie jak w pozostałych konkurencyjnych płyt z tym chipsetem w trybie x16 / x4.

Sytuacja wygląda trochę gorzej w przypadku podłączenia karty graficznej do magistrali PCI-Express posiadającej 4 linie. Zdecydowanie częściej występuje tutaj spadek wydajności w stosunku do pełnowymiarowego PCI-Expressa x16, a najbardziej są one widoczne w wysokich ustawieniach. Jeżeli jednak przykładowo mamy do dyspozycji jedynie port PCI-Express x16 oraz x4 (przykładowo jak w omawianych wyżej płytach głównych z chipsetem AMD 870) i chcemy skorzystać z technologii CrossFire lub SLI, to bez zastanowień powinniśmy skorzystać z obu złącz. Co prawda wydajność będzie trochę mniejsza niż w przypadku trybu x16 / x16 lub x8 / x8, ale różnica ta nie będzie na tyle duża by wydajność tandemu w stosunku do pojedynczej karty zauważalnie nie wzrosła.

Największy spadek wydajności – co chyba oczywiste – występuje podczas działania karty graficznej w trybie x1. Praktycznie w każdym przypadku jest on bardzo wyraźny, natomiast po ustawieniu wyższej rozdzielczości i ustawień graficznych liczba klatek na sekundę obniża się do poziomu niepozwalajacego na komfortową rozrywkę. Nie warto zatem łączyć kart graficznych, które będą podłączone do złącza z 16 liniami oraz jedną linią. Uwzględniając spadki wydajności technologii multi-GPU (CrossFire lub SLI) takie połączenie da bardzo mały lub nawet zerowy wzrost wydajności, a druga z kart graficznych się po prostu zmarnuje.

Wybrane dla Ciebie
ZACZEKAJ! ZOBACZ, CO TERAZ JEST NA TOPIE