Procesory

Omówienie problemu

z dnia 2007-12-17

Tu i tam w internecie można przeczytać, że problem związany z czterordzeniowymi procesorami AMD ograniczył dostawy Opteronów „Barcelona”. Sprzętowy błąd dotyka wszystkich odmian i częstotliwości czterordzeniowych procesorów AMD, dotyczy on także świeżo wprowadzonych procesorów Phenom 9500 i 9600. Mimo że AMD nie sprzedaje już czterordzeniowych procesorów Opteron największym sprzedawcom serwerów, ani indywidualnym użytkownikom, to sprzedaje Phenomy dużym dystrybutorom i firmom składającym pecety. W rzeczywistości AMD wiedziała o błędzie zanim nastąpiła premiera Phenoma, mimo że oficjalne oświadczenie wspominało, że problem dotyczył tylko Phenomów taktowanych częstotliwością 2.4 GHz i więcej.

Dla przypomnienia, błąd jest problemem na poziomie samego układu obejmującym logikę TLB cache L3, która w specyficznych warunkach jest w stanie doprowadzić do zawieszenia systemu. AMD pracuje już nad poprawką dla tego problemu, ale negatywnie wpływa ona na wydajność. AMD publicznie oświadczyła, że obejście tego problemu niesie ze sobą obniżenie wydajności o około 10 procent, choć jedno ze źródeł podaje straty na poziomie 10-20 procent.

Według informacji podanych przez Michaela Sauciera, który pełni funkcje Desktop Product Marketing Manager w AMD, efekty błędu TLB są odczuwalne, gdy układ poddawany jest dużemu obciążeniu. AMD podała wcześniej, że obróbka danych wirtualizacji może prowadzić do występowania tego problemu, ale Saucier wyjaśnił, że również i inne obliczenia mogą być powodem zawieszania systemu. Określił problem porównaniem do „biegacza, który wgrywa mimo że nikt się tego nie spodziewał,” i dodał, że prawdopodobieństwo, że błąd doprowadzi do zawieszenia się systemu jest niezwykle małe.

Najwyraźniej zaprzeczając poprzednim oświadczeniom AMD w tej kwestii, Saucier kategorycznie zaprzeczył jakiemukolwiek związkowi pomiędzy błędem TLB, a częstotliwością taktowania układu. Dodał także, że nie ma żadnego związku pomiędzy częstotliwością taktowania i obniżeniem wydajności przez łatkę opartą na BIOSie przeznaczoną dla 'błędu'. AMD wcześniej wymieniała błąd TLB jako główny powód opóźnienia 2.4 GHz odmiany Phenoma.

Saucier wyjaśnił prawdziwą naturę rozwiązania problemu, którą AMD zaproponowała producentom płyt głównych i komputerów. Poprawka ma formę uaktualnienia BIOSu, a łatka dla BIOSu zawiera uaktualnienie mikrokodu procesora. Uaktualnienie wyłącza tę część logiki TLB układu, która wywołuje problemy. Saucier wskazał, że cache L3 „wciąż działa” mimo wyłączonej logiki. Dodał także, że w przypadku istniejących już układów AMD nie ma zamiaru stosować poprawki w innej postaci.

AMD przygotowuje sprzętową poprawkę, która pojawi się w kolejnej odsłonie układu o nazwie B3. Przyszłe wariacje Phenoma, łącznie z planowanym modelem Phenom 9700 taktowanym z częstotliwością 2.4GHz i 9900 o częstotliwości 2.6, będą zawierały poprawkę. AMD planuje wymienić obecne modele Phenom 9500 i 9600 na nowe 9550 i 9650, oparte na układzie B3. Saucier przewiduje, że w najlepszym wypadku zobaczymy je nie wcześniej niż w połowie pierwszego kwartału 2008 roku.


AMD twierdzi, że przekazała producentom płyt głównych poprawkę BIOSu. Saucier powiedział, że wskazówki firmy dla partnerów zawierają w BIOSie opcję włącz/wyłącz. AMD ma także plany uaktualnienia narzędzia Overdrive overclocking w Windowsie, które pozwoli użytkownikom włączać i wyłączać łatkę erraty. Saucier dodał, że AMD myśli, że łebscy użytkownicy mogą wybrać wyższą wydajność w zamian za pogodzenie się z niewielkim prawdopodobieństwem, że ich system może zawiesić się w wyniku problemu z TLB.

Jednak uaktualnienie BIOSu obchodzące problem nie jest jeszcze udostępnione przez największych producentów płyt głównych opartych na układzie AMD 790FX i przeznaczonych dla procesora Phenom. Zadano pytania każdemu z nich i oczekujemy na ostateczną odpowiedź kiedy zobaczymy uaktualnienie BIOSu.

Według Sauciera, partnerzy OEMowi AMD zostali poinformowani o błędzie jeszcze przed premierą i powinni już mieć przygotowane poprawki.

Rzecznik prasowy AMD, Phil Hughes, powiedział w wywiadzie, że problemowi TLB została przypisana errata numer 298. Gdy zapytano go kiedy można się spodziewać, że AMD uaktualni swoją dokumentację techniczną o tę erratę, Saucier powiedział, że osoba odpowiedzialna za uaktualnienia jest „na urlopie”. Mimo tego przewiduje, że poprawka pojawi się „pod koniec tego roku”.

Nieprzypadkowo, obecność błędu TLB może tłumaczyć dziwne zachowanie zespołu PR AMD przed premierą Phenoma. Decyzja o wykorzystaniu 2.6GHz elementów i wymaganie od prasy, aby były one testowane w kontrolowanym środowisku nabiera w tym kontekście sensu. W związku z tym, że gdy pojawią się Phenomy taktowane z częstotliwością 2.6GHz, powinny one być oparte na odmianie B3 układu wyposażonego w poprawkę dla erraty TLB, co pozwoli AMD w uzasadniony sposób zaprzeczać jakoby wydajność miała być ograniczona przez poprawkę opartą na BIOSie. Saucier potwierdził, że testowe systemy podczas prasowego spotkania w Tahoe nie miały włączonej poprawki.

PR AMD uparcie zaprzeczał lub ignorował zapytania dotyczące sampli produkcyjnych Phenomów 9500 i 9600 w dniach poprzedzających premierę. Działo się tak aż do chwili gdy niektóre serwisy podały, że zaopatrzą się w procesory za pomocą innych źródeł. Wówczas rozesłano kilka sampli Phenoma 9600.

Przeprowadzone benchmarki nie były oparte na poprawionym BIOSie, ale wykazały, że wyniki niektórych testów wydajności 2.3GHz Phenoma są zawyżone. Przetestowany został rdzeń o częstotliwości 2.3GHz z 2.0GHz północnym mostkiem, ponieważ takie właśnie częstotliwości przypisane są do Phenoma 9600. Produkcyjne sample Pheoma 9500 i 9600 wyposażone są w północny mostek o częstotliwości 1.8GHz. W związku z tym, że cache L3 działa z częstotliwością mostka północnego, częstotliwość ta odgrywa ważną rolę w ogólnej wydajności Phenoma. Potwierdzono już niższe wyniki wydajności w niektórych testach.

Biorąc pod uwagę wszystko czego dowiedzieliśmy się w przeciągu ostatnich kilku dni, wiadomo, że wydajność Phenoma 9600 jest przeceniana. Dokładnie dowiemy się gdy poznamy wyniki testów systemu opartego na Phenomie z poprawką dla TLB.

Mimo że firmie udało się opracować rozwiązanie problemu, tak czy siak jest to poważny orzech do zgryzienia dla AMD. Każdy układ musi przejść procedurę erraty. Można to traktować podobnie do błędów znanych z systemu. Część z nich jest niegroźna i bardzo łatwo je usunąć po premierze za pomocą uaktualnienia kodu. Ten niestety wymaga trochę więcej pracy, stąd też opóźnienie. Mimo wszystko i tak mogłoby być gorzej. Przynajmniej AMD nie wzywa do zwrotów układów.

Od samej premiery wspomniane procesory czterordzeniowe Opteron, a dokładniej ich wersja Barcelona, objęta była programem ochrony procesora. Firma podaje, że układ jest dostępny, ale użytkownicy mają poważne problemy, aby go nabyć.

AMD potwierdziła, że errata lub błąd w Barcelonie musi zostać rozwiązany zanim układ trafi do sklepów. Klienci najbardziej wydajnego segmentu rynku zostaną teraz otoczeni opieką, ale przeciętny Kowalski i tak nie zobaczy czterordzeniowych Opteronów aż do przyszłego roku.

Niektóre raporty donoszą, że AMD wstrzymała wysyłkę Opteronów ze względu na ich wady, ale rzecznik prasowy firmy zaprzecza tym rewelacjom.

„Nie wstrzymaliśmy procedury wysyłkowej,” powiedział Phil Hughes. „Jest to chwilowa przerwa w wysyłce dużej liczby. Wysyłamy Barcelony ze względu na konkretne zobowiązania w dużych transzach.”

AMD wydaje się bawić językiem, co nie daje powodów do optymizmu. Po pierwsze, informuje się, że nie jest to „przerwa w dostawach” ponieważ AMD tak naprawdę wcale nie wysyła produktu. Co więcej, jeszcze niedawno przedstawiciele AMD mówili o sprzedaży na poziomie setek tysięcy Opteronów w tym roku. Zapowiadali także nadejście szybszych wersji Opteronów w 2007 roku.

Niedługo po tym, odkryto, że IBM wycofał wyniki testów przeprowadzonych na serwerach opartych na Opteronach ponieważ nie był w stanie wysyłać systemów w określonym czasie i spełnić wymogów ustanowionych przez SPEC (the Stnadard Performance Evaluation Corp.). Tak więc IBM z pewnością stanął w obliczu zmiany procedur wysyłkowych.


AMD potrzebuje dodatkowych opóźnień w dostawach Barcelony tak samo jak potrzebuje problemów finansowych i kadrowych po połknięciu producenta kart graficznych. Biorąc to wszystko pod uwagę, prawdziwe dostawy Barcelony pojawią się około rok później niż planowała to AMD. Kolejnym problemem jest malejące zaufanie do firmy spowodowane trudnościami z wyprodukowaniem bezbłędnego układu. Jeśli Barcelona trafi do sprzedaży w pierwszym kwartale, to i tak będzie rok po tym, jak AMD planowała wprowadzić ten układ na rynek. AMD potrzebuje Barcelony nie tylko po to, aby podbudować reputację firmy, ale także aby zgarnąć odpowiednie zyski. Nie od dziś wiadomo, że rynek procesorów serwerowych jest o wiele bardziej dochodowy niż rynek zwykłych pecetowych układów.

Tymczasem Intel właśnie wpompował na rynek kolejną flotę szybszych, bardziej oszczędnych Xeonów i planuje agresywnie przyspieszyć produkcję w przyszłym roku. Jego druga generacja czterordzeniowych procesorów Penryn pojawiła się już w ofertach dla sprzedawców serwerów. Kolejna generacja chipów zwanych Nehalem zapożyczy od układów AMD te funkcje, które sprawiły, że produkty AMD stały się tak popularne i udane.

Akcje AMD spadły o 3.68 procenta, w związku z czym cięciom uległy także szacunkowe przychody firmy.

na podstawie materiałów przeczytanych w sieci.

marketplace

Komentarze

0
Zaloguj się, żeby skomentować
avatar
Dodaj
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.

    Nie dodano jeszcze komentarzy. Bądź pierwszy!