Nehalem - nowa architektura
Opis architektury procesora przygotował Marcin Bieńkowski
Nową architekturę zastosowaną w Nehalemie Intel nazywa czwartą odsłona architektury Core. Głównym jej założeniem jest wprowadzenie do budowy procesorów modułowości, co sprawia, że cała konstrukcja układu jest bardzo elastyczna. Dostępne w układzie niezależne moduły wykonawcze podzielone zostały na dwie grupy. Pierwsza z nich, tzw. grupa core, obejmującej rdzenie procesorów i niezbędne jednostki zasilające oraz zegar. W drugiej grupie uncore znalazły się pozostałe elementy procesora. Co ważne obydwu częściach układu można elastycznie, w zależności od rynkowych potrzeb dodawać lub odejmować elementy funkcjonalne układu, dzięki czemu będzie można dostosować produkowane układy do aktualnych wymagań klientów, nawet jeśli wcześniej procesory niebyły w danej konfiguracji produkowane.
Podział Nehalema na moduły core i uncore
Pierwsze procesory Intel Core i7 będą układami czterordzeniowymi. Niemniej bez najmniejszego problemu przez Intela mogą być również produkowane procesory jedno-, dwu-, trzy-, cztero-, sześcio- jak i ośmiordzeniowe. Prawdopodobnie jedno- i dwurdzeniowe Nehalemy trafią na rynek jako przeznaczone do maszyn typu entry level Celerony, zaś układy sześcio- i ośmiordzeniowe będą to kości serwerowe. Trzeba jednak zaznaczyć, że nie jest w tej chwili pewne czy Intel zdecyduje się ostatecznie na produkcję układów jedno- i trzyrdzeniowych. Istotne jest jednak to, że wszystkie typy procesorów, niezależnie od liczby rdzeni, będą produkowane na jednym kawałku krzemowego wafla.
Modułowa budowa nowych procesorów ma pozwolić również na elastyczne integrowanie w strukturze procesorów wielopoziomowych pamięci cache. W zależności od potrzeb, wielkość pamięci cache trzeciego może być w zmniejszana lub zwiększana. Mało tego w procesorach serwerowych i przeznaczonych do wydajnych stacji roboczych przewidziano istnienie pamięci cache L4. Oczywiście, zarówno pamięć cache L3, jak i L4 pojawiają się w procesorach Nehalem w ramach modułu uncore.
Najważniejszą nowością wprowadzoną do procesorów Intel Core i7 w ramach segmentu uncore jest wbudowanie w układ kontrolera pamięci RAM. Kontroler taki w ramach modułowej architektury może w zależności od potrzeb zostać rozbudowany lub w niektórych wersjach procesorów usunięty. Zintegrowanym z procesorem kontrolerem pamięci dotychczas dysponowały jedynie procesory firmy AMD. Kontroler taki zmniejsza czas dostępu do danych przede wszystkim dzięki wyeliminowaniu pośrednictwa chipsetu płyty głównej. Przyspieszenie transmisji danych ma szczególne znaczenie zwłaszcza w wypadku maszyn wieloprocesorowych czyli np. zaawansowanych stacji roboczych i serwerów. Wówczas poszczególne procesory nie blokują sobie nawzajem dostępu do magistrali systemowej.
Podobnie w wypadku kontrolera RAM, część modeli Nehalemów może mieć większą, a z kolei inne mniejszą liczbę linii Quick Path Interconnect zastępujących magistralę FSB. W dostępnych dokumentach Intela znaleźć też można informacje na temat możliwości wbudowania w procesory Nehalem modułu karty graficznej.
Krzemowa struktura czterordzeniowego Nehalema
Szczegóły budowy
Z podanych przez Intela informacji wynika, że najbardziej zaawansowany ośmiordzeniowy Nehalem składa się z 731 milionów tranzystorów. Każdy rdzeń może jednocześnie przetwarzać dwa wątki, co daje sumaryczną mozliwość obsłużenia 16 różnych wątków na pojedynczym ośmiordzeniowym układzie. Wynika z tego, że Intel wrócił do stosowania technologii współbieżnej wielowątkowości Hyper-Threading znanej z układów Pentium 4. Oczywiście, obie technologie nie są pod względem szczegółowych rozwiązań takie same. Wynika to z innej wewnętrznej mikroarchitektury. Jak udało nam się dowiedzieć w Nehelemie mamy do czynienia z trzecią generacją technologii Hyper-Threading. Układy Intel Core i7 mają też w stosunku do Penrynów rozszerzoną liczbę rozkazów SSE, która nosi nazwę SSE 4.2.
Jak już wspomniałem, jedną z najważniejszych zmian w architekturze Nehalema jest zintegrowanie w jego strukturze kontrolera pamięci RAM. W procesorach Intel Core i7 znajdzie się kontroler obsługujący w sposób trzykanałowy pamięci DDR3 800, 1066 i 1333 MHz. Już w tej chwili na rynku dostępne są specjalne konfekcjonowane zestawy zawierające po trzy moduły RAM DDR3. Oczywiście, w chwili gdy włożymy tylko jeden lub dwa moduły w złącza pamięci na płycie głównej wówczas moduły RAM będą obsługiwane odpowiednio w sposób jedno lub dwukanałowy.
Z wiadomości przekazanych przez Intela najistotniejszą informacją jest to, że nie przewidziano procesorów Intel Core i7 obsługujących pamięci DDR2. Oczywiście, dzięki modułowej architekturze procesora taka teoretyczna możliwość istnieje, niemniej producent nie zamierza z niej skorzystać. Użytkownicy modyfikujący swoje komputery będą zatem musieli oprócz płyty głównej i procesora zakupić również nową pamięć.
Procesory Intel Core i7 korzystać będą wyłącznie z modułów pamięci DDR3
Wróćmy teraz na chwilę Istotną nowością wprowadzoną do architektury Nehalema jest użycie nowego, specjalnego łącza międzyprocesorowego, które wykorzystywane jest także do komunikacji z chipsetem płyty głownej. Łącze QPI (Quick-Path Interconnect), bo o nim mowa, pozwala na bardzo szybką, bezpośrednią komunikację między procesorami i elementami płyty głównej. Prędkość transmisji dochodzi do 25,6 GB/s przy zastosowaniu standardowych czterech linii QPI o przepływności 6,4 GB/s każda. Jak twierdzi producent, dzięki QPI uzyskano ponad dwukrotny wzrost wydajności w międzyukładowej transmisji danych w stosunku do wieloprocesorowych systemów komputerowych korzystających z tradycyjnej magistrali FSB.
W Nehalemie magistrala FSB zastąpiona została nową magistra QPI
Zmiany mikroarchitektury
Przejdźmy teraz do zmian w wewnętrznej mikroarchitekturze procesorów Core i7. Samo jądro jest dość zbliżone do jądra Penryn, niemniej zostało one zoptymalizowane, tak aby przyspieszyć szybkość wykonywania poszczególnych rozkazów. Według danych producenta Nehalem potrafi szybciej o ok. 33% wykonywać wewnętrzne mikrooperacje.
Niemniej najistotniejsze modyfikacje dotknęły 512 KB pamięć cache L2. Pamięć ta charakteryzuje się krótkimi czasami opóźnień. Co ciekawe, komórki pamięci cache L2 składają się z ośmiu, a nie jak do tej pory z sześciu tranzystorów. Nowa ośmiotranzystorowa pamięć cache wymaga bowiem niższych napięć zasilających.
W pamięci cache L2 pojawiły się nowe mechanizmy odpowiadające za przewidywanie dalszej części programu i pobieranie z wyprzedzeniem potrzebnych danych do pamięci cache L2. Są to moduł przewidywania rozgałęzień oraz 512 wejściowy bufor TLB (Translation Lookaside Buffer), w którym przechowywane są fragmenty tablicy stron pamięci operacyjnej komputera. Na nowo zaprojektowano również mechanizmy dostępu do pamięci cache.
Kolejną nowością jaką znajdziemy w architekturze Nehalema jest przeprojektowany bufor BTB (Branh Target Buffer) drugiego poziomu. Odpowiada on za sprowadzanie danych do pamięci cache. Nowy jest także bufor RSB (Return Stack Buffer). Ma on na celu zapobiegać błędnemu przewidywaniu pojawiających się w trakcie wykonywania programu instrukcji powrotnych.
Pamięć cache L1 procesora Nehalem nie różni się od pamięci L1 Penryna. Ma ona również pojemność 64 KB – po 32 KB dla instrukcji i danych. Ostatnim poziomem pamięci cache jest współdzielona przez wszystkie rdzenie pamięć podręczna trzeciego poziomu L3. W wypadku procesora czterordzeniowego ma ona 8 MB pojemności. Dzięki zastosowaniu pamięci cache L3 zmniejszona zostaje liczba bezpośrednich odwołań procesora do pamięci głównej RAM, co przekłada się na zwiększenie wydajności obliczeń i zmniejszenie zużycia energii.
Główne zmiany w mikroarchitekturze procesorów Intel Core i7
Nehalem z wbudowaną grafiką
Wróćmy teraz na chwilę do układów Intel Core i7 z w wbudowanym modułem graficzny. Co prawda takie procesory mają się pojawić na rynku dopiero pod koniec 2009 roku lub na początku 2010 roku, ale taki procesor może być ważny dla wielu użytkowników chcących korzystać z tanich biurowo-internetowych komputerów.
Wykorzystana w Nehalemie karta graficzna ma być pod względem sprzętowym zgodna z bibliotekami OpenGL 2.0 i Microsoft DirectX 10 oraz modelem cieniowania Shader Model 4.0. Duży nacisk położony został na dekodowanie materiałów wideo. Dzięki wbudowanym w moduł graficzny dekoderom, może on odciążyć jednostkę centralną komputera od pracochłonnego wykonywania takich operacji związanych z dekodowaniem obrazu jak, jak obliczanie odwrotnej, dyskretnej transformaty kosinusowej (iDCT), kompensacji ruchu, deinterlacingu i korekcji kolorów. Sprzętowe dekodowanie materiałów wideo możliwe będzie zarówno dla materiałów wideo zarówno w zwykłej rozdzielczości, jak i rozdzielczości HD. Pliki wideo mogą być zapisane w formatach AVC, VC1 i MPEG-2.
Nehalem ma mieć możliwość wbudowania modułów graficznych
Dwoma nowatorskimi technologiami związanymi z obróbką materiałów wideo są technologie Panel Fitter 2 oraz Non-Linear Anamorphic Scaling. Pierwsza z nich odpowiada za sprzętowe skalowanie obrazu, dostosowując go do aktualnej rozdzielczości wyświetlacza. Drga pozwala na przeskalowywanie obrazów zapisanych w formacie 4:3 do panoramicznego formatu 16:9 w sposób nieliniowy. Działa ona tak, aby obraz był jak najmniej zniekształcony w miejscach, w których koncentruje się wzrok widza. Algorytm skalowanie rozpoczyna rozciąganie od środka ekranu, a kończy przy jego krawędzi, przy czym deformacje w środku są minimalne, a na krawędziach największe, ale jednocześnie najmniej widoczne dla widza.
Zarządzanie zasilaniem
Bardzo interesującą technologią wprowadzoną w procesorach Intel Core i7 jest technologia dynamicznego zarządzania zasilaniem – Nehalem Turbo Mode. Pozwala ona na niezależnie odłączanie lub włączania zasilania dla każdego z rdzeni. Możliwe jest na przykład przejście pojedynczego rdzenia w tryb głębokiego uśpienia C6, niezależnie od pozostałych jednostek. Co więcej, prędkość działania zegara taktującego pozostałe rdzenie może w tym czasie być podniesiona, co ma na celu zwiększenie wydajności przetwarzanych zadań jednowątkowych przy jednoczesnym zachowaniu ogólnego bilansu cieplnego dla procesora. Istotne jest także to, że Nehalem Turbo Mode włączany jest z poziomu BIOS-u i nie wymaga dodatkowych sterowników w systemie operacyjnym.
Nehalem Turbo Mode
Cały system zasilania Nehalema jest bardzo elastyczny. Każdy moduł core i uncore, czyli zarówno same rdzenie, jak i pozostałe jednostki, takie jak pamięć cache L3, systemy I/O, kontroler pamięci RAM, kontrolery QPI są zasilane oddzielnie. W ramach każdej jednostki można niezależnie regulować zarówno napięcie zasilające, jak i częstotliwość jej taktowania. Do zarządzania systemem zasilania Nehalema zaprojektowano jednostkę Power Control Unit. Co ważne jest ona programowalna, dzięki czemu istnieje możliwość zmiany schematów zasilania w zależności od pojawiających się potrzeb.
Nowe gniazdo
Wbudowanie w procesory Intel Core i7 kontrolera pamięci DDR3 oraz zastosowanie nowej magistrali systemowej spowodowały, że nowy procesor musi korzystać z nowej podstawki. Gniazdem tym jest LGA 1366, które zastąpi obecnie używany socket LGA775.
Oczywiście wraz z Nehalemem pojawią się też nowe chipsety. Dla procesorów Intel Core i7 przeznaczony jest chipset X58 Express znany też pod kodową nazwą Tylersburg. Dla wielu osób istotną informacją jest to, że w chipsetach X58 zaimplementowano obsługę systemów graficznych SLI firmy Nvidia korzystających z dwóch lub trzech kart graficznych. Do niedawna na platformie Intela można było wyłącznie stosować wielokartowe systemy CrossFire firmy ATI.
Core i7 aka Bloomfield. Chipset x58
Oficjalne logo rodziny Core i7
Mikro architektura procesorów nazywana do tej porty ogólnikowo Nehalem, docelowo ma zastąpić wszystkie obecnie produkowane przez Intela procesory. Otrzymamy zatem Nehalema w wersji dla serwerów, desktopów a także dla notebooków. W pierwszej kolejności jak to zwykle bywa, procesory z tej rodziny trafią do naszych komputerów domowych. Ta pod rodzina została nazwana nazwą kodową Bloomfield, i to właśnie niej poświecony jest dzisiejszy artykuł.
Core i7 aka Bloomfield
W dniu premiery na rynek trafią trzy procesory z rodziny Core i7 oznaczone jako model 920, 940 oraz Extreme 965. Nowe procesory różnią się głównie częstotliwością taktowania wynoszącą odpowiednio 2.66, 2.93 oraz 3.2 GHz, oraz przepustowością łącza QPI. Wszystkie trzy korzystają z nowej podstawki Socket B o 1366 wyprowadzeniach, oraz mają zintegrowany trzy kanałowy kontroler pamięci. Zerknijcie do tabelki.
Porównanie rozmiarów procesorów.
| Model | Core i7 920 | Core i7 940 | Core i7 Extreme 965 |
| Taktowanie | 2.66 GHz | 2.93 GHz | 3.2 GHz |
| W trybie Turbo Boost | 2.93 GHz | 3.20 GHz | 3.46 GHz |
| Ilość rdzeni (wątków) | 4 (8) | 4 (8) | 4 (8) |
| Cache L1 | 4x 32 kB + 4x 32 kB | 4x 32 kB + 4x 32 kB | 4x 32 kB + 4x 32 kB |
| Cache L2 | 4x 256 kB | 4x 256 kB | 4x 256 kB |
| Cache L4 | 8 MB | 8 MB | 8 MB |
| QPI | 2.4 GHz (4.8 GT/s) | 2.4 GHz (4.8 GT/s) | 3.2 GHz (6.4 GT/s) |
| BLCK | 133 MHz | 133 MHz | 133 MHz |
| Mnożnik min | 12 | 12 | 12 |
| Mnożnik max | 20 | 22 | 24 (odblokowany) |
| Mnożnik Turbo Boost | 22 | 24 | 26 |
| Technologia wykonania | 45 nm | 45 nm | 45 nm |
| TDP | 130 W | 130 W | 130 W |
Za sprawą prawie dwukrotnie większej liczby wyprowadzeń, procesor jest znacznie większy niż dobrze nam znane procesory dla podstawki LGA 775. Nie jest na całe szczęście dwa razy większy, jak to sugerowała by liczba padów. Niestety ma to jeden efekt uboczny. Wraz ze zmianą rozmiarów procesora i co za tym idzie podstawki, niestety zmienił się także rozstaw dziur montażowych do zestawów chłodzących. Pomimo że sam mechanizm jego mocowania pozostał bez zmian, to niestety stare zestawy mocujące nie będą pasowały. Wraz ze zmianą platformy na Nehalema niestety trzeba będzie przywitać się także z nowym zestawem chłodzącym.
Większość najciekawszych informacji na temat samej architektury procesora przedstawił Wam już mój przedmówca. Niemniej zanim przejdziemy dalej chciałbym tutaj wspomnieć o jednej ciekawej cesze nowej rodziny Core i7. Chodzi o technologię Intel Turbo Boost. Zapewne wielu z Was zastanawiało się, co oznacza dodatkowa częstotliwość taktowania podana w tabele wraz z tą domyślną. Otóż w momencie, gdy nie wszystkie rdzenie są wykorzystane, jeśli jeden z nich przejdzie w tryb głębokiego uśpienia - system może zwiększyć częstotliwość taktowania pozostałych rdzeni ponad częstotliwość domyślą. Dzięki temu szczególnie aplikacje jedno-wątkowe będą mogły pracować nieco szybciej niż na standardowej częstotliwości taktowania. Szkoda tylko, że wzrost częstotliwości zegara jest tak mały. Całość działa niezależnie od systemu operacyjnego i nie wymaga żadnych sterowników, to spory plus dla użytkowników systemów operacyjnych innych niż Windows.
Chipset X58
Core i7 to nie tylko procesory. To także nowy chipset. Jego ekstremalny wariant, zgodnie z polityka Intela otrzymał oznaczenia X58 oraz kodową nazwę Tylersburg. Co prawda trzy tygodnie temu mieliście okazję przeczytać artykuł poświęcony temu chipsetowi. Niemniej myślę, że warto zebrać wszystkie informację w jednym miejscu.
Schemat blokowy X58
Intel podobnie jak to miało miejsce już wcześniej, projektując nowy chipset skupił się na mostku północnym, natomiast mostek południowy został żywcem przeniesiony ze wcześniejszych konstrukcji. W zależności od decyzji producenta płyty głównej będzie to ICH10 lub ICH10R.
X58 niesie ze sobą dwie zasadnicze nowości. Pierwsza, niemal rewolucja to oczywiście przeniesienie kontrolera pamięci bezpośrednio do procesora, pomimo że nie jest to w zasadzie cecha chipsetu, ale samej platformy - o tym jednak czytaliście już wyżej. Druga równie przełomowa, to obsługa technologii SLI - po raz pierwszy w historii chipsetów Intela. Do tej porty z SLI mogli korzystać tylko szczęśliwi (lub nie) nabywcy płyt głównych bazujących na chipsetach nVidia.
Uważni czytelnicy zapewne zauważyli, że X58 dysponuje "tylko" 36 liniami PCI-e 2.0 dlatego w podstawowej konfiguracji będzie możliwe uruchomienie dwóch kart graficznych korzystających ze złącz o pełnej szerokości x16. Określenie "tylko" celowo znalazło się w cudzysłowowi ponieważ zarówno x48 jak i nForce 790i dysponują 32 liniami PCI-e 2.0, a więc mniejszą ilością niż X58. Oczywiście nic nie stoi na przeszkodzie, aby te 36 linii rozdzielić nawet na 4 sloty o 8 liniach adresowych każdy. Niemniej nVidia ma inna propozycję.
nForce 200. Kontroler, który doda do systemu dodatkowe 32 linie adresowe PCI-e 2.0. Jest jeden mały haczyk. Nie dość, że ten mały chipsecik będzie kosztował producentów około 30 dolarów, czyli ponad połowę ceny samego X58 - którego wyceniono na 52 dolary - to na dodatek z mostkiem północnym będzie komunikował się tylko przy pomocy interfejsu PCI-e 1.0 x16. Paranoja? Przeanalizujmy to raz jeszcze. Z jednej strony mamy 32 linie PCI-e 2.0 o łącznej przepustowości 16GB/s, a z drugiej 16 linii adresowych PCI-e 1.0 o przepustowości zaledwie 4GB/s. To tak jakby na końcu grubego węża ogrodowego zainstalować lejek. Ciśnienie oczywiście wzrośnie, ale czy przepustowość? Oczywiście nVidia twierdzi, że takie pasmo wystarczy. Trudno powiedzieć, jak jest w praktyce. Niestety żadna z testowanych przeze mnie płyt głównych nie została w niego wyposażona. Być może producenci stwierdzili, że lepiej będzie po prostu podzielić dostępne linie na więcej slotów?
Skoro kontroler pamięci został przeniesiony do procesora, to czym tak na prawdę będzie zajmował się X58? Wygląda na to, że poza pośredniczeniem w komunikacji między mostkiem południowym i procesorem, jedynym jego zadaniem będzie obsługa interfejsu PCI-e 2.0. Skoro tak, to dlaczego jest taki ogromny? Zerknijcie na fotki chipsetu. X58 to bez wątpienia chipset o największym rdzeniu, jaki do tej pory widziałem. X48, który domyślnie przykryty jest płytką rozpraszającą ciepło, po jej zdjęciu okazuje się mniejszy. Co prawda poprzednik Tylersburga obsługiwał o 4 linie PCI-e 2.0 mniej, ale w odróżnieniu od niego miał zintegrowany podwójny kontroler pamięci, zdolny obsłużyć zarówno DDR2 jak i DDR3. Jedynym wytłumaczeniem tego faktu jest obecność kontrolera łącza QPI. Być może to ten interfejs wymaga aż tylu tranzystorów. Odpowiedz na to pytanie zna tylko Intel.
Skoro już o QPI mowa, warto przypomnieć, że ta taktowana zegarem 3.2GHz magistrala w obecnej postaci dysponuje maksymalną przepustowością na poziomie 25.6 GB/s. To dwa razy więcej niż dotychczasowe FSB taktowane zegarem 1.6GHz. Pamiętajmy jednak że FSB była do tej porty używana także do przesyłania danych między procesorem, a pamięcią RAM. Nehalem ma do tego dedykowany, wbudowany kontroler pamięci w strukturze procesora. Podobnie zresztą jak do tej porty miało miejsce w procesorach AMD rodziny K8 i wyższej. Te 25.6 GB/s to znacznie więcej niż potrzeba w chwili obecnej. X58 po zsumowaniu przepustowości wszystkich dostępnych interfejsów jest w stanie dostarczyć do procesora dane z szybkością maksymalną około 20 GB/s. Dla porównania, konkurencyjny HyperTransport 3.0 wyciąga dokładnie 20.8 GB/s. Tak na prawdę nowa magistrala będzie miała ogromne znaczenie głównie w systemach składających się z więcej niż jednego procesora. Czyli w stacjach roboczych i serwerach.
Czy to wszystkie nowości oferowane przez X58? Otóż nie. Są jeszcze dwie, które chociaż warto wymienić. SATA Port Disable oraz USB Port Disable. Jedyną oferowaną przez nie funkcją jest możliwość wyłączenia pojedynczego portu SATA lub USB. Zastanawiacie się pewnie, do czego mogło by się to przydać? Otóż Intel tłumaczy, że wyłączenie poszczególnych portów zapobiega nieautoryzowanemu przesyłaniu danych w środowiskach korporacyjnych. W przypadku SATA jako potencjalne zagrożenie wskazuje się coraz powszechniejsze porty eSATA. Pamiętajcie, że komputer pracujący z kontrolerem SATA w trybie AHCI umożliwia podłączenie urządzeń Serial ATA na gorąco. Bez potrzeby resetowania komputera
Procedura testowa. Testowane płyty główne
Kilka słów wyjaśnienia należy się opisowi testów, jakie przeprowadziłem. Benchmark otrzymał do testów całą platformę ewaluacyjną od Intela. Jej specyfikacje znajdzie poniżej. Zgodnie z procedurą mieliśmy wykonać testy obu użyczonych procesorów dokładnie w tej konfiguracji. Brakujący procesor Core i7 940 zasymulowałem obniżając mnożnik i częstotliwość taktowania QPI procesora Core i7 Extreme 965.
Dodatkowo, aby nieco urozmaicić artykuł wypożyczyłem trzy płyty największych producentów: Asusa, Gigabyte oraz MSI. Niestety zestawem Intela mogłem dysponować tylko przez bardzo krótki okres czasu, dlatego nie udało mi się poprzekładać wszystkich komponentów do wypożyczonych niezależnie płyt głównych. W ich testach użyłem innych komponentów, zmieniła się pamięć oraz dysk twardy. Taktowanie pamięci RAM było ustawione na 1066 MHz, zamiast domyślnych 1333 MHz aby zachować porównywalność wyników z testami na płycie Intela.
Dla porównania, na stronie z wynikami znalazły się wszystkie dotychczasowe wyniki testów procesorów jakie udało mi się do tego czasu popełnić. Są one opisane odpowiednio jako wyniki z pierwszego testu CPU oraz wyniki z drugiego testu CPU. Jeśli kogoś interesuje metodologia wykonania tych testów, zapraszam do przejrzenia odpowiednich artykułów.
Specyfikacja platformy ewaluacyjnej Intela:
- Płyta główna: Intel DX58SO
- Procesory: Core i7 920 oraz Core i7 965 Extreme
- Pamięć RAM: Qimonda 3x 1GB DDR3 1066 MHz
- Dysk SSD: Intel X25-M 80GB
Dodatkowo w ramach testów skorzystaliśmy jeszcze z następujących komponentów:
- Obudowa:Chieftec Aegis
- System operacyjny: Windows Vista SP1
- Zasilacz: Chieftec 850W
- Karta graficzna: Zotac GeForce 9800GT
- Pamięć RAM: OCZ 3x2GB DDR2 1333 MHz
- HDD: Seagate 7200.10 250 GB SATA II
Aby nieco urozmaicić test, postanowiliśmy także sprawdzić jak nowe procesory radzą sobie na topowych płytach głównych czołowych producentów. Będą to:
- Asus P6T Deluxe
- MSI Eclipse SLI
- Gigabyte GA-EX58-UD5
Do testów użyłem następujących programów:
Testy CPU z 3Dmark 2006
3DMark '06 to znany i ceniony przez wszystkich benchmark kart graficznych. Na potrzeby testów procesorów wykorzystamy jedynie część pełnego przebiegu testów - testy CPU. Interesują nas zatem wyniki CPU Score, oraz czątkowe CPU1 i CPU2
SiSoft Sandra Procesor Aritmetic
SiSoft Sandra to prawdziwy kombajn służący do testowania różnych podzespołów komputera. W tym teście wykorzystamy dwa zestawy benchmarków - Procesor Arithmetic oraz Procesor Multi-Media Benchmark. Oba dają dwa zestawy wyników, osobno dla ALU i FPU.
Cinebench R10
Cinebench to program mierzący wydajność procesora za pomocą renderingu sceny 3D. Umożliwia on zbadanie wydajności pojedynczego rdzenia, a także łącznej wydajności wszystkich rdzeni. Niejako przy okazji możemy stwierdzić, jak dobrze skalują się procesory z więcej niż jednym rdzeniem. Wbrew pozorom nie obserwujemy liniowego wzrostu wydajności po dołożeniu kolejnej jednostki wykonawczej.
PCMark Vantage
PCMark Vantage to kolejna aplikacja ze stajni Futuremark, program testuje ogólną wydajność komputera symulując pracę normalnych aplikacji. Na potrzeby testu podamy wszystkie wyniki cząstkowe poszczególnych testów bez zagłębiania się się w ich składowe.
Crysis GPU benchmark
Crysis to jedyna gra, której użyjemy w teście procesorów. Dzięki niej sprawdzimy czy procesor w jakikolwiek sposób wpływa na szybkość działania tej jednej z najbardziej wymagających gier w historii. Do testów wykorzystamy benchmark GPU w konfiguracji: DX9, Detale: High, Rozdzielczość: 1280x0124. Używamy wersji v1.2.1
Super PI
Super PI to program do obliczania liczby PI o zadanej długości liczby znaków. Przyjęło się jednak używanie go jako benchmarka procesorów. W tym celu obliczane są liczby PI o długości 1 i 32 milionów znaków. Program podaje wynik w sekundach, bądź minutach i sekundach. Im mniejszy wynik, tym lepiej. Uzywamy wersji mod1.5 XS
Wyniki Sandra, Dhrystone ALU
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Sandra, Whetstone ISSE3
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Sandra, Multi-Media Int
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Sandra, Multi-Media Float
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Cinebench, Rendering 1 CPU
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Cinebench, Rendering x CPU
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Cinebench, Rendering SMP Speed Up
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki 3DMark '06, CPU Score
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki 3DMark '06: CPU 1 i CPU 2
Wynik z drugiegp testu CPU
Wynik z pierwszego testu CPU
CPU 2
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Crysis, Avg FPS
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Crysis, Min i Max FPS
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
- Maksymalne FPS
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, Memory
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, TV and Movies
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, Gaming
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPUdrugiego
Wyniki PCMark Vantage, Music
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, Communication
Wynik z drugieo testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, Productivity
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, HDD Test
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki PCMark Vantage, wynik ogólny
Wynik z drugiego testu CPU
Wynik z pierwszego testu CPU
Wyniki Super PI. Podsumowanie
Gdybyście zastanawiali się, dlaczego w przypadku PC Marka Vantage wyniki na platformie Intel są tak wysokie. Wyjaśniam, że chodzi o zastosowany w niej dysk SSD, Intel X25-M. Dopiero teraz wykonując testy także na klasycznym dysku twardym, zdałem sobie sprawę jak ogromny wpływ na wyniki PC Marka Vantage ma użyty do testów dysk twardy. Warto o tym pamiętać na przyszłość.
Jeśli zaczniemy przyglądać się wynikom nieco bliżej, zapewne zastanawiać będzie ogromna zbieżność otrzymanych rezultatów na wszystkich testowanych płytach głównych. Ostatecznie jednak warto uzmysłowić sobie fakt, że testowane płyty główne dzieli tak na prawdę bardzo niewiele. Procesor ma już kontroler pamięci wewnątrz własnej struktury, dlatego chipset będzie miał marginalny wpływ na wydajność jego pracy - bardziej będą liczyły się jego możliwości w kwestii obsługi sprzętu, np ilość linii PCI-e. Nawet gdyby chipset miał wpływ na osiągi, to wszystkie testowane płyty używają dokładnie tego samego modelu. Jeśli bardziej wnikliwie zaczniecie się przyglądać wynikom, to zauważycie że między zwycięzcą a przegranym różnica rzadko przekracza 3%. Taka rozbieżność ma tylko znaczenie statystyczne, nie ma natomiast żadnego wpływy na odczuwalną wydajność zestawu. Dlatego jeśli będziecie decydować się na zakup płyty głównej pod Core i7, powinniście skupić się na jej możliwościach. Wydajność będzie zbliżona.
Ta sytuacja jest szczególnie niebezpieczna dla AMD, które będzie miało bardzo duży problem aby chociaż zbliżyć się wydajnością do nowych procesorów Intela. W chwili obecnej najszybszy procesor Intela jest wydajniejszy od najszybszego procesora AMD w niektórych testach syntetycznych nawet kilkukrotnie. Oczywiście w praktyce ta przewaga jest znacznie mniejsza, niemniej nadal w wykonanych przeze mnie testów nierzadko sięga kilkudziesięciu procent! Szczerze trzymam kciuki wszystkich kończyn za nowe procesory AMD Shanghai. Brak konkurencji na rynku zaszkodzi nam wszystkim. Sytuacji nie poprawia fakt, że procesory Intela świetnie się podkręcają. Z tym u AMD jest niestety niezbyt dobrze.
Skoro już jesteśmy przy podkręcaniu. Zapewne dziwicie się, dlaczego w artykule nie ma wyników testów podkręcania Core i7. Odpowiedź jest prozaiczna. Po prostu nie starczyło mi na to czasu. Cztery płyty główne wymagały instalacji 4 systemów operacyjnych oraz 4 kompletów sterowników. Następnie na każdej z nich trzeba było potworzyć testy procesorów w trzech ustawieniach. W międzyczasie zmieniały się biosy płyt, co wymagało choćby weryfikacji wyników. Aby uzmysłowić Wam ogrom pracy, jaki trzeba włożyć w przygotowanie tego tekstu wystarczy chyba, jeśli wspomnę że w chwili obecnej dochodzi 5 rano. Za niecałą godzinę będziecie mieli okazję przeczytać to, co właśnie kończę pisać.
Wracając jednak do pokręcania. Oczywiście trochę pobawiłem się Core i7. Pomimo, że nie wiem jeszcze czy zestaw w takiej konfiguracji jest w 100% stabilny, mogę powiedzieć iż bez większych problemów udało mi się osiągnąć około 3.9 GHz. Moim zdaniem jak na zupełnie nową rodzinę procesorów, to wynik jest bardzo dobry! Na dowód dołączam oczywiście zrzut z CPU-z.
Testy O/C procesora nie były jedynym planowanym elementem, którego nie zdążyłem wykonać. Ubolewam nad faktem, że trzy naprawę rewelacyjne płyty główne zostały potraktowane nieco po macoszemu w tej recenzji. Strony im poświęcone należy traktować raczej jako rzuty okiem, aniżeli pełne testy. Każda z nich zasługuje bowiem na dedykowany artykuł jej poświecony. Takie artykuły wkrótce po premierze Core i7 pojawią się na łamach Benchmarka. Zaglądajcie do nas regularnie.
Na sam koniec zostawiłem sobie jeszcze jeden aspekt premiery Core i7. Chodzi oczywiście o aspekt finansowy. Testowane przeze mnie dziś płyty główne kosztują grubo powyżej tysiąca złotych. Jeśli uważnie przeczytaliście cały artykuł, zdajecie sobie pewnie sprawę że rozbudowa obecnego komputera do czegoś opartego na Core i7 będzie się wiązała z wymianą większości komponentów. Płyta głowna, procesor i pamięć RAM to oczywiste elementy. Pamiętajmy jednak, że trzeba zmienić także chłodzenie. Jeśli zdecydujecie się na płytę Intela, to należy pamiętać także o posiadaniu zasilacza z 8-pinową złączką +12V, napędu optycznego SATA, a także myszki i klawiatury z portami USB. Rozumiecie do czego zmierzam? Nehalem jest diabelnie szybki, ale w chwili obecnej jest także diabelnie drogi!
redakcja dziękuje następującym firmom:
Intel - za wypożyczanie platformy testowej, oraz procesorów do testów.
ASUS- za wypożyczenie płyty głównej do testów.
Gigabyte - za wypożyczenie płyty głównej do testów.
MSI - za wypożyczenie płyty głównej do testów.
Chieftec - za udostępnienie obudowy i zasilacza do testów.
Komputronik - za udostępnienie pozostałych komponentów do testów.