Prezentacja Penryn'a. Fakty na temat 45 nm
Penryn to nazwa, którą dziennikarze i użytkownicy zwykli nazywać nową serię procesorów Intela, będącą następcą dotychczasowych chipów Conroe. Tak naprawdę jednak, sama nazwa kodowa Penryn dotyczy jedynie układów mobilnych. Mimo to, stała się ona na tyle popularna, że również nowe procesory desktopowe i serwerowe określane są przez samego Intela jako "należące do rodziny Penryn".
Justin Rattner, dyrektor ds nowych technologii w Intelu, prezentuje wafel z 45nm układami Penryn.
Co zmieniło się wraz z nadejściem Penryna? Po pierwsze technologia produkcji. Nowa seria będzie wytwarzana już w 45 nm, co jest krokiem naprzód w stosunku do obecnie stosowanej do produkcji Core 2 Duo technologii 65 nm. Oprócz zmniejszonych rozmiarów tranzystorów, co jest konsekwencją nowego wymiaru technologicznego, nowe chipy wykorzystują również technologię High-k. Oznacza to, że do tworzenia bramek wykorzystywany jest hafn i metal, a nie krzem i polisilikon, jak dotychczas. W efekcie ma to spowodować zwiększenie prędkości przełączania tranzystorów, co przekłada się na wyższą wydajność procesora. Nowa technologia oraz zmniejszony wymiar technologiczny wiążą się również ze zmniejszeniem marnotrawstwa energii - mniej "wyciekającego" prądu to jego mniejszy pobór i zredukowane nagrzewanie się procesora. Dzięki temu najprawdopodobniej uda się też uzyskać wyższe zegary taktowania, niż miało to miejsce w przypadku chipów Conroe - a trzeba przy tym pamiętać, że już one podkręcały się naprawdę dobrze.
Nas najbardziej interesują desktopowe wersje nowych procesorów. Będą to: Wolfdale oraz Yorkfield. Ten pierwszy jest dwurdzeniową odmianą z maksymalnie 6MB cache L2, charakteryzującą się poborem mocy (TDP) na poziomie 65W. Natomiast Yorkfield to czterordzeniowy układ, zawierający do 12MB cache L2, z TDP od 95 do 130W, w zależności od modelu.
modele nowych procesorów Intela
Na rynku najpierw pojawi się najszybszy model z nowej serii - Yorkfield sprzedawany pod nazwą Core 2 Extreme (a także czterordzeniowy serwerowy Harpertown). Będzie to miało miejsce w czwartym kwartale 2007 roku i ma pokazać światu przewagę wydajnościową Intela nad konkurencją. Kolejne, (nieco) mniej wydajne procesory zostaną zaprezentowane odrobinę później, w pierwszym kwartale 2008. Będą to: czterordzeniowe Yorkfieldy w zwykłych, nie "ekstremalnych" wersjach, a także dwurdzeniowe Wolfdale. Oprócz tego, na rynku pojawią się mobilne Penryny oraz serwerowe Wolfdale-DP i Dunningtony.
- Ciekawe fakty: Ile to właściwie jest 45 nanometrów?
- W jednym metrze znajduje się 1 miliard nanometrów (nm).
- Pierwszy tranzystor skonstruowany w laboratoriach Bella w 1947 roku można było wziąć do ręki, a teraz na powierzchni jednej czerwonej krwinki mogłyby zmieścić się setki nowych, 45-nanometrowych tranzystorów Intela.
-
Gdyby domy kurczyły się w takim samym tempie, jak tranzystory, nie dałoby się zobaczyć domu bez mikroskopu. Aby zobaczyć 45-nanometrowy tranzystor, potrzeba bardzo zaawansowanego mikroskopu.45 nm - porównanie rozmiarów
• Gwóźdź = 20 milionów nm
• Ludzki włos = 90 000 nm
• Pyłek ambrozji = 20 000 nm
• Bakteria = 2000 nm
• Tranzystor Intela = 45 nm
• Wirus nieżytu nosa = 20 nm
• Atom krzemu = 0,24 nm - Cena tranzystora w jednym z intelowskich procesorów następnej generacji - o nazwie kodowej Penryn - będzie mniej więcej jedną milionową średniej ceny tranzystora w 1968 roku. Gdyby ceny samochodów spadały w takim samym tempie, nowe auto kosztowałoby dziś mniej więcej centa.
- W średnicy ludzkiego włosa można zmieścić ponad 2000 tranzystorów 45-nanometrowych.
- Można zmieścić ponad 30 milionów tranzystorów 45-nanometrowych na główce od szpilki, której średnica wynosi około 1,5 milionów nm (1,5 mm).
- Ponad 2 miliony tranzystorów 45-nanometrowych zmieściłoby się w kropce (której powierzchnia wynosi ok. 1/10 milimetra kwadratowego) na końcu tego zdania.
- Tranzystor 45-nanometrowy może włączać się i wyłączać ok. 300 miliardów razy na sekundę. W czasie, który zajmuje włączenie i wyłączenie tranzystora, wiązka światła przebywa mniej niż ćwierć centymetra.
Ulepszona architektura
Główne założenia, które przyświecały inżynierom Intela podczas projektowania Penryna to zwiększenie wydajności procesora przy takim samym taktowaniu oraz podwyższenie samej częstotliwości taktowania. Niejako przy okazji, w Penrynie postanowiono również zmniejszyć zapotrzebowanie na prąd, co jest zgodne z polityką Intela polegającą na zwiększaniu tzw. "Performance per Watt", czyli wydajności w przeliczeniu na jednostkę mocy. Chodzi o to, żeby tworzyć procesory, które przy zbliżonym poborze energii będą w stanie pracować coraz wydajniej. Cele te osiągnięto na drodze ewolucyjnych zmian, bez dramatycznego przeprojektowywania układu. Takim drastycznym redesignem, między innymi obejmującym integrację kontrolera pamięci na procesorze, będzie dopiero architektura Nehalem, która ma pojawić się na rynku pod koniec 2008 roku.
architektura pojedynczego rdzenia w procesorach z rodziny Penryn
Co poprawiono w architekturze Conroe? Po pierwsze, przyspieszono dzielenie. Nowe algorytmy Fast Radix-16 Divider pozwalają na zwiększenie wydajności dzielenia niemal dwukrotnie, umożliwiają też szybsze niż dotąd wyliczanie pierwiastków. Dzięki temu w jednym cyklu zegara procesor jest w stanie przetworzyć cztery bity - zamiast dwóch, jak dotychczas. Nowy algorytm dzielący został zaprojektowany na tyle uniwersalnie, że może być wykorzystywany zarówno do operacji na liczbach zmiennoprzecinkowych, jak i całkowitych.
Kolejna nowość to 47 nowych instrukcji, nazwanych zbiorczo mianem SSE4 (a dokładniej, SSE 4.1). Jest to kolejne i jednocześnie największe poszerzenie listy rozkazów SSE w historii procesorów Intela. Nowe instrukcje są przydatne między innymi do zwiększenia wydajności kodowania plików wideo, czy generowania grafiki trójwymiarowej. Wykorzystujące je specjalistyczne oprogramowanie potrafi dzięki nim pracować niemal 2 razy szybciej.
Z SSE4 wiąże się nowy silnik Super Shuffle Engine. Pozwala on na szybsze wykonywanie rozkazów SSE - nawet o kilkaset procent. 128-bitowe operacje SSE mogą być teraz wykonywane w jednym cyklu zegara, co ciekawe, bez konieczności rekompilacji oprogramowania. Oznacza to, że dotychczasowy soft wykorzystujący SSE powinien dość mocno zyskać na wydajności.
W Penrynie zwiększeniu ulegnie rozmiar pamięci podręcznej drugiego poziomu. Dwurdzeniowe procesory będą wyposażone w maksymalnie 6MB pamięci cache L2, natomiast czterordzeniowcom dostanie się 12 MB. W procesorach czterordzeniowych, pamięć L2 będzie podzielona na dwie części, po połowie dla każdego z rdzeni. Oprócz zwiększenia rozmiaru, Intel dokonał też ulepszeń w architekturze, mających na celu redukcję opóźnień w dostępie do danych umieszczonych w pamięci L2.
Inne zmiany, już o mniejszym ciężarze gatunkowym to Split Load Cache, czyli poprawione algorytmy przydzielania pamięci L2 do poszczególnych jąder procesora, czy Enhanced Intel Virtualization Technology, będąca udoskonaloną, szybszą wersją stosowanej już od jakiegoś czasu u Intela technologii wirtualizacji. Wzrośnie też prędkość taktowania szyny procesora - oferowane będą modele z 1600 MHz PSB.
podsumowanie nowości w architekturze procesorów z rodziny Penryn
Mobilne wersje Penryna otrzymają dodatkowo nowe możliwości oszczędzania energii. Będą to: Deep Power Down Technology oraz Enhanced Dynamic Acceleration Technology. Deep Power Down ma na celu zdecydowaną redukcję zapotrzebowania procesora na prąd w momencie, kiedy nie jest on obciążony wykonywaniem ton instrukcji. Wyłączany jest wówczas cache L1 i L2 oraz zegar taktujący rdzeń. Z kolei Dynamic Acceleration Technology to sprytny pomysł na zwiększenie wydajności procesora w momencie, kiedy wykorzystywany jest jedynie jeden jego rdzeń (np. w grach działających na jednym wątku). Polega on na zwiększeniu taktowania jednego z rdzeni procesora w momencie, kiedy drugi niczym się nie zajmuje. Dzięki temu niedobór wydajności wynikający z nieużywanego drugiego rdzenia rekompensowany jest przez większą prędkość pierwszego. Technologia została przy tym tak przemyślana, aby nie wymykać się poza ramy określonego dla danego procesora poboru mocy (TDP).
Wydajność w teorii
Ulepszenia zastosowane w procesorach z rodziny Penryn mają bezpośrednio przełożyć się na wzrost wydajności. Jednak będzie on odczywalny w różnym stopniu w różnych aplikacjach. Zalety Penryna (a dokładniej, jego nowych instrukcji) w największym stopniu zobaczymy w aplikacjach wykorzystujących nowy zestaw instrukcji SSE4, takich jak np. DivX 6.6.1. Tam nowy procesor ma dać ponad 60% wzrost wydajności. Z kolei w dotychczasowych aplikacjach, których programiści nic o SSE4 nie wiedzieli, przyspieszenie wyniesie zaledwie kilka, kilkanaście procent (zazwyczaj ok. 5-10%). Z jednej strony nie jest to rewolucja, ale z drugiej, przy tym samym zegarze otrzymujemy o 10% szybszy procesor. Można więc w przybliżeniu założyć, że w większości zadań 2.66 GHz Penryn będzie odpowiadał wydajnościowo 2.9 MHz Conroe, co nie jest złym wynikiem.
Platforma testowa. Testy PC Mark Vantage
Do naszych testów wypożyczyliśmy z firmy Komputronik jedną z nowocześniejszych maszyn, wyposażoną w procesor Core2 Quad Q6600 podkręcony do 3GHz (szyna FSB 1333). Z tą samą częstotliwością i szyną FSB pracuje nadesłany nad do testów z firmy Intel Core 2 Extreme QX9650 (Penryn).
Oto specyfikacja maszyny, na której dokonamy porównania:
- referencyjna płyta główna nVidii z chipsetem nForce 780i
odświeżona wersja znanego 680i, z poprawionym kontrolerem pamięci oraz obsługą PCI-Express 2.0 - procesor Intel Core2 Quad Q6600 (fabrycznie 2.4GHz)
podkręcony do 3GHz poprzez szynę FSB 1333 MHz, napięcie podniesione do 1.4V - pamięci KINGSTON 2x1GB DDR2 1066 MHz CL 5.5.5.15, napięcie 2.2V
- referencyjne karty graficzne nVidii GeForce 8800 Ultra 768MB
zegary referencyjne 612/2160MHz (GPU/pamięć) - dysk twardy 500GB Seagate Barracuda 7200.10
16MB cache, Serial ATA II, zapis prostopadły
- zasilacz TAGAN BZ 1300 W
PC Mark Vantage
PCMark Vantage to najnowsza wersja kompleksowego testu całego systemu i jak już wspominaliśmy w chwili premiery tego benchmarka, działa on tylko pod systemem Windows Vista. Obok wykresów wydajności zamieściliśmy informacje, jakie testy wchodzą w skład poszczególnych zestawów (suite), abyście mogli szybko wyciągnąć wnioski, jaki wpływ ma moc CPU na poszczególne operacje.
Jak widać powyżej, na bazie 12 kluczowych testów, Vantage uznał maszynę wyposażoną w Penryna o około 9% wydajniejszą, od Conroe podkręconego do 3GHz.
Zobaczmy teraz, jak sprawa przedstawia się w konkretnych zestawach testów:
Testy: World in Conflict, Lost Planet
A teraz przekonajmy się, czy nowsza i wydajniejsza architektura Penryna przyda się nam w grach 3D. Na pierwszy ogień jak zwykle 3Dmark06.
Jedynie na ostatnim wykresie, odnoszącym się do testu wydajności CPU, widać jakąś znaczącą różnicę w wynikach i dużą przewagę jednostek cztero- nad dwurdzeniowymi. W pozostałych przypadakch, wpływ procesora na osiągane przez kartę FPS jest raczej znikomy.
World in Conflict - DirectX10
Testy w rozdzielczości 1920x1200, z efektami graficznymi ustawionymi na najwyższy poziom (tekstury skompresowane). Wykresy przedstawiają liczbę klatek z każdej sekundy demka. Wnioski można wyciągnąć podobne, jak w przypadku 3DMarka.
Core2 Extreme X9650 (Penryn) (FSB 1333MHz)
- Core2 Quad Q6600 @ 3GHz (FSB 1333MHz)
- Core2 Quad Q6600 - 2.4GHz (FSB 1066MHz)
- Core2 Duo E6400 @3GHz (FSB 1500MHz)
- Lost Planet - DirectX10
Testy w bardzo wymagającym demku Lost Planet obalają mit, jakoby moc CPU miała tu kluczowy wpływ na liczbę FPS. Jak widać ani częstotliwość, ani liczba rdzeni, ani ilość pamięci cache - wyłącznie czysta moc płynąca z GPU karty graficznej.
Podsumowanie
Cóż, jak widać po przeprowadzonych przez nas testach, w większości zastosowań Penryn nie jest niczym niezwykłym. Czasem trochę szybszy, ale bez znaczących różnic - oczywiście do czasu, aż uruchomimy oprogramowanie wykorzystujące rozkazy SSE4. Rzuca się w oczy mniejszy pobór energii i niższa temperatura pracy pod obciążeniem - procesor jest wówczas prawie do 20% chłodniejszy. Te dwie ostatnie cechy z całą pewnością będą porządane w przypadku modeli z segmentu 'średniego'. W topowych maszynach - do których testowany przez nas QX9650 bez wątpienia jest dedykowany - różnica pomiędzy poborem prądu na poziomie 680 a 640W będzie mniej zauważalna.
Jeśli ktoś chce dzisiaj kupić komputer z procesorem Intela, to nie ma specjalnie po co czekać na Penryna i może bez żalu wybrać jeden z obecnych procesorów z serii Conroe. Natomiast za kilka miesięcy Conroe zacznie być wycofywany z rynku i wówczas jedynym wyborem pozostanie Penryn - generalnie nieco usprawniony i chłodniejszy od poprzednika.
Z naszych testów wyłania się też kilka innych ciekawych wniosków. Po pierwsze, jeśli myślimy przede wszystkim o giercowaniu, wystarczy zainwestować w solidną płytę główną i niedrogiego Core2 (np: E6550 2,33GHz), a po podkręceniu szyny FSB otrzymamy wystarczająco dużo mocy z CPU, aby karta graficzna pracowała optymalnie.
Z kolei jeśli chodzi nam po głowie super wydajna maszyna z czterordzeniowym procesorem, kapitalnym pomysłem będzie zakup względnie taniego Quad Q6600 i podkręcenie go do 3GHz. Otrzymamy wydajność porównywalną z produktem, za który Intel chce na dzień dzisiejszy aż 3500 zł. 'Zaoszczędzone' pieniądze można wydać na dobre chłodzenie, wydajniejszą grafikę, albo nawet dwie grafiki, bo przecież niezależnie od tego, jak wydajne, chłodne i podatne na podkręcanie będą nowe procesory Intela, tylko dzięki nim Crisis'a w trybie UltraHIGH nie odpalimy ;)