Firma Intel przedstawiła plany produkcji nowej generacji procesorów wysokiej wydajności (HPC), przeznaczonych do wykonywania skomplikowanych obliczeń.
Według Kirk Skaugena, wceprezesa Intel Data Center Group, firma przygotowuje rodzinę potężnych układów opartych na architekturze nowej generacji Many Integrated Core (MIC). Układy te mają znacznie zwiększyć szybkość przetwarzania danych, złożonych obliczeń naukowych i finansowych, jak również modelowania zmian klimatycznych.
Obecnie udostępniono developerom niewielką liczbę układów MIC o nazwie kodowej Knights Ferry. Jest, to układ składający się z 32 rdzeni, a każdy z nich pracuje z szybkością 1,2 GHz, co daje ponad 500 GigaFLOPa (miliardów operacji zmiennoprzecinkowych na sekundę) wydajności. Knights Ferry zostały wyprodukowane w 32-nanometrowej technologii.
Pierwsze komercyjne układy Many Integrated Core będą nosić nazwę Knights Corner. Pojawią się nie wcześniej niż w 2011 roku i będą zawierać ponad 50 rdzeni w jednym układzie. Zostaną wyprodukowanie w technologii 22 nanometrów.
Źródło: compulenta
Miodzio. I pomyśleć że jeszcze parę lat temu, żeby mieć 2 procki na pokładzie to trzeba było wydać kuuupę kasy, a cztery to już był wypas zahaczający niemal o wojskową technologię :-)
Radeon HD 5670 ma wydajność 620 GFlops to więcej niż te procki...co jest nie tak?
Jakby Radeonowi HD 5670 dołożyć gniazda na przynajmniej 32 GB pamięci, jakieś SATA na tymczasowe dane i port InfiniBand to już tylko by brakowało dobrego wsparcia dla programistów.
Radeon ma taką wydajność przy pojedyńczej precyzji obliczeń a ten procesor przy podwujnej precyzji a w kartach innych niż gtx 4xx wydajność przy przejściu z po1 precyzji do po2 spada około 5x w fermi dzięki min cache l1 i l2 spadek jest tylko dwukrotny. Pozatym radeon ma tak jak i wszystkie inne karty poważną wadę może zająć się tylko jednym wątkiem naraz a więc systemu na nim nie postawisz (chyba że masz kilkadziesiąt takich kart lecz niema puki co systemu który by korzystał z mocy karty graficznej).
Wielkim przebojem to nie będzie jak to ma 500 Gflop mocy to tyle co fermi a fermi jest teraz i do tego nie kosztuje tragicznie duzo (jak na sprzęt serwerowy) 10tys zł za wersje z 3GB ram a do przyszłego roku konkurencją intela na tym rynku nie będzie fermi a fermi2 produkowane w 28 nm i zapewne coś ze stajni amd oraz byćmorze caustic graphics wypuści swoje dzieło o niższym poborze mocy i wyższej wydajności niż dotychczas.
Trochę się chyba mylisz :P
Bo procesor też wykonuje tylko jeden wątek w danym momencie ;)
Szczególnie ten pięćdziesięciorzdzeniowy. Przecież wiadomo, że zwiększa się liczbę rdzeni tylko po to, aby się ładnie we wzorki układały :P
Każdy rdzeń wykonuje jeden wątek na raz (chyba, że wyposażony jest w funkcję hyper-threading), tak więc teoretycznie jesteśmy w stanie zwiększyć wydajność programu tyle razy, ile wątków on posiada - pomijając narzut na synchronizację. W praktyce niestety gry tego nie potrafią i całą robotę zrzucają na karty graficzne - bo tak wychodzi szybciej.
Procesor ma te przewagę w stosunku do karty graficznej, że może wykonywać dowolne operacje w dowolnym porządku, podczas gdy układy graficzne stosują przetwarzanie równoległe/potokowe o ściśle określonym przebiegu, w ściśle określonej architekturze zaprojektowanej do wykonywania przewidzianych zadań.
Radeon ma taką wydajność przy pojedyńczej precyzji obliczeń a ten procesor przy podwujnej precyzji a w kartach innych niż gtx 4xx wydajność przy przejściu z po1 precyzji do po2 spada około 5x w fermi dzięki min cache l1 i l2 spadek jest tylko dwukrotny. Pozatym radeon ma tak jak i wszystkie inne karty poważną wadę może zająć się tylko jednym wątkiem naraz a więc systemu na nim nie postawisz (chyba że masz kilkadziesiąt takich kart lecz niema puki co systemu który by korzystał z mocy karty graficznej).
Wielkim przebojem to nie będzie jak to ma 500 Gflop mocy to tyle co fermi a fermi jest teraz i do tego nie kosztuje tragicznie duzo (jak na sprzęt serwerowy) 10tys zł za wersje z 3GB ram a do przyszłego roku konkurencją intela na tym rynku nie będzie fermi a fermi2 produkowane w 28 nm i zapewne coś ze stajni amd oraz byćmorze caustic graphics wypuści swoje dzieło o niższym poborze mocy i wyższej wydajności niż dotychczas.
No to co powiesz na temat HD5850 ten już ma podwójną... tak jak HD4850 ;)
"Przede wszystkim nowa architektura pozwala na znaczne skrócenie czasu obliczeń o podwójnej precyzji FP64 (zgodnych z normą IEEE754).
Wydajność silnika Cypress w tym trybie oceniana jest na 544 GFlops – dla porównania potencjał chipa RV770 wynosi około 240GFlopsa. Jak na tym tle wypada NVIDIA z kartami serii Tesla? Model C1060 przy 64-bitowej precyzji zaoferuje zaledwie 78 GFlopsów, a taktowane zegarem 1,2GHz dwa układy GT200b „jedynie” 150 GFlopsów."
A cashe L1 i L2 radeony od dawna mają.
Tak tak... ten co podałem to nie Fermi ... tak kopiowałem. Faktycznie Fermi nie dla desktopów ma z 700Gflopsów.
Nie porównuje tutaj ati do nv tylko to co ati i nv potrafią już dziś do tego co intel chce wprowadzić za rok. Programiści i twórcy GPU od niedawna pracują nad zaprzęgnięciem mocy kart do wielowątkowych obliczeń więc nie wróże temu dziełu intela zbyt świetlanej przyszłości. Być może 2mld $ wywalonych larrabe nie wysatrczająco uświadomiło intela że coś robią źle w projekcie wielordzeniowych procków. No chyba że próbują wpechnąć na siłę do tego cuda to co wymyślili pracując nad jedną ze swoich większych porażek.
Wiem że hd 5850 obsługuje podwójną precyzje. Wszystkie karty od GF8600 i hd 3850 to potrafią.
Aż w końcu uzyskają świadomość i przestaniemy być potrzebni... :/
Świadomość własnych ograniczeń? Bo ktoś im ten prąd musi jeszcze organizować do działania i za niego płacić... ;)
wygloada jakby do tej prezentacji pozyczyli makiete Ferni od nVidii, :D
PS, jezeli im tak zalezy na operacjach zmenno-przecinkowych to sa jakies 3 lata do tylu za kartami graficznymi - 500 GigaFLOPa dzisiaj to jest raczej "sredniawa" karta graficzna. Ponad 1TF juz sie w laptopach zdarza - wiec nie wiem o co ten caly szum
Słowo klucz to podwójna precyzja.
A to racja. Co prawda da się bez niej obejść, ale wymaga to ostrożności i często dodatkowego programowania.
a czy ta "podwujna precyzja" zmniejsza wydajnosc 8 krotnie? tak sie pytam bo najwydajniesze desktopowe karty graficzne siegaja 4TFlops.
Najwydajniejszą desktopową kartą pod względem mocy jest radek 5870 ma 2.7 Tflop a nie 4 (5970 to sklejka 2 kart) z tych 2.7 tflop w radkach do po2 precyzji zostaje ~550Gflop czyli spadek dla kart seri 5xxx jest 5krotny w układach fermi moc z 1.2 gflop spada do ~540 (o ile dobrze pamiętam) czyli okolo 2.2x.
Dla porównania procesor core i7 975 ma moc obliczeniową dla podwójnej precyzji ~80 gflops.
Intel stwierdził że jest już rynek na koprocesory masowo-równoległe i zaczął wbijać gwóździe w trumnę Nvidi. Sprytnie i skutecznie, cała kasa wydana przez zielonych na reklamę Tesli, zostanie skonsumowana przez Intela.
Jeszcze tylko microsoft musi podpatrzeć Snow Leoparda, coby wiedzieć jak obsłużyć tyle procesorów, bo jak narazie to windows może sobie pomarzyć...
[url=http://www.chip.pl/news/sprzet/procesory/2010/05/50-rdzeniowy-procesor-intela-wytworzony-w-technologii-22-nm]CHIP.PL/url]
McGregorS -> może zdradzisz nam jakąś wielką tajemnicę o tych rdzeniach i o ogryzkach? No nie bądź taki, otwórz nam oczy na niezmierzoną potęgę pecetów pracujących pod Śnieżną Panterą. My już czujemy się niegodni, ale odpuść nam nasze winy i daj skosztować owocu ze Świętego Drzewa Appla.
Odwiedzilem paryzewo pare tygodni temu i wchodzac do louwru znalazlem w srodku pod piramida skle 'nadgnilego jablka". pomyslcie jak ja sie czulem... niegodny pobytu w muzeum, a co dopiero w jablku w srodku wspanialego muzeum! jak robak doslownie. :)
ludzie nie porownujcie wydajnosci procesorow do kkart graficznych. karty graficzne sa wyspecjalizowane w pewnych zadaniach i nie nadaja sie do kazdego typu obliczen. wysztkie lub prawie wszystkie superkomputery oparte sa o procesory mimo ze sa kilkadziesiat razy slabsze od gpu. 500gflopsow to mega wydajnosc jak na procesor. najpotezniejsze dzisiejsze procki do pc maja nie wiecej niz 100gflopsow a rewolucyjny cell 218gflops.
Niestety Cell cierpi na bardzo duze spadki wydajnosci i dlatego IBM calkowicie anulowal projekt i wczelkie prace rozwojowe tej architektury.
po za tym wulfen zapomniałeś dodać, że cell ma 218 GFLOPS przy pojedynczej precyzji, natomiast przy podwójnej precyzji, ta wydajność spada około 10x, a to już nie rewelacyjny wynik.
"ponad 500 GigaFLOPa (miliardów operacji zmiennoprzecinkowych na sekundę)"
Powinno być FLOPS zamiast FLOP; to 'S' na końcu oznacza właśnie napisane w nawiasie sekundy.
FLOPS = FLoating point Operations Per Second
500GFLOPS 500GFLOPSom nie równe. Rozumiem, że można liczyć 500G* float+float (w tym przypadku double), ale liczą się jeszcze inne kwestie. Np. przepustowość pamięci do urządzenia oraz pewnie też sposób dostępu do niej. Myślę, że można na to urządzenie spojrzeć jak na niegdyś też nietypowe układy FPU do PC (patrz 8087). Wszytko będzie zależało od wydajności i możliwych zastosowań takiej karty. Poczekajmy na premierę i chociaż szacunkową cenę tego układu.
z ostatnich 30 dni
odsłon: 160019
odsłon: 95217
odsłon: 35908
odsłon: 34499
odsłon: 28500
odsłon: 26462
odsłon: 24804
odsłon: 22657
odsłon: 21694
odsłon: 18809
odsłon: 18613
odsłon: 18176
odsłon: 17249
odsłon: 15862
odsłon: 15635
odsłon: 15458
odsłon: 14922
odsłon: 14523
odsłon: 14310
odsłon: 13462
odsłon: 13443
odsłon: 13010
odsłon: 12392