Wytrzymałość dysków SSD
*Aktualizacja: Trzeci dysk uległ uszkodzeniu, a zatem test dobiegł końca. Przygotowaliśmy podsumowanie z wnioskami - więcej informacji na stronie 13 artykułu.
Podczas wyboru dysku SSD interesuje nas pojemność, wydajność i oczywiście cena. To jednak nie wszystko, bo świadomi konsumenci coraz częściej zwracają uwagę też na żywotność nośnika – w końcu kości pamięci mają ograniczoną wytrzymałość i po pewnym czasie odmówią współpracy, a bezpieczeństwo naszych danych też jest bardzo istotne. No właśnie, czy parametr wytrzymałości nośników jest dla nas tak interesujący, jakoby mogło się to wydawać?
Aby odpowiedzieć na to pytanie, najpierw należy przyjrzeć się wytrzymałości nośników półprzewodnikowych. Producenci posługują się tutaj parametrem TBW (Total Bytes Written), który określa limit danych, jaki można zapisać na nośniku, ale… do momentu utraty gwarancji. Czasami też można spotkać się ze skrótem DWPD (Disk Write per Day), a więc krotnością pojemności dysku, jaką można codziennie zapisać również do momentu utraty gwarancji. Jak się okazuje, obydwa parametry najczęściej mają niewiele wspólnego z prawdziwą wytrzymałością dysków półprzewodnikowych.
Powszechnie stosowane kości pamięci MLC NAND wytrzymują 3000 – 10 000 cykli programowania i kasowania (w przypadku mniej popularnych kości TLC NAND wytrzymałość jest trochę niższa, natomiast w przypadku SLC NAND znacznie wyższa). Oprócz tego stosowane są rozmaite techniki, które mają na celu wydłużenie żywotności kości pamięci. Gdy przeliczymy obydwie wartości, wyjdzie na to, że współczynnik TBW/DWPD często jest zaniżany i dysk powinien charakteryzować się znacznie większą wytrzymałością. W takim razie na jaką wytrzymałość dysków tak naprawdę możemy liczyć? Postanowiliśmy to sprawdzić w praktyce.
Na kolejnych stronach przedstawimy dokładną procedurę testową i wyniki wytrzymałości dysków – z uwagi na czasochłonną metodologię, będą one zamieszczane w formie aktualizacji artykułu.
Platforma testowa i metodologia
Zastosowany system operacyjny i oprogramowanie:
- Windows 7 Ultimate 64-bit SP1
- Anvil's Storage Utilities 1.1.0
Jak przekonać się o faktycznej wytrzymałości dysków SSD? Najlepiej to sprawdzić w praktyce, a więc po prostu trzeba na nich zapisywać tak dużo danych, aż kości pamięci odmówią współpracy. Warto jednak zauważyć, że każdy nośnik charakteryzuje się innym limitem, a więc dokładna wartość nie może odnosić się do serii lub partii produkcyjnej – po przetestowaniu kilku sztuk i porównaniu wyników, co najwyżej można tutaj ustalić wartość orientacyjną.
Postanowiliśmy więc przetestować wytrzymałość dysków właśnie w taki sposób, a za przykład posłużyły nam trzy całkowicie nowe nośniki OCZ ARC 100 o pojemności 240 GB (zainteresowanych dokładną specyfikacją i wydajnością odsyłamy do testu). Modele te dość dobrze nadają się do zobrazowania różnicy w żywotności faktycznej i tej deklarowanej przez producenta, bo współczynnik TBW określono tutaj tylko na niecałe 22 TB, ale do ich budowy wykorzystano kości pamięci Toshiba A19 nm MLC NAND - stosowane też w dyskach z wyższej półki o znacznie wyższym wskaźniku TBW (np. OCZ Vector 180 – 89 TB).
Pozostało jeszcze omówić procedurę zapisu tak dużej porcji danych. Posłużyliśmy się tutaj pakietem Anvil's Storage Utilities 1.1.0, w którym zaimplementowano tryb Endurance, służący do testowania dysków półprzewodnikowych właśnie pod kątem wytrzymałości. Aplikacja automatycznie zapisuje losowe dane (w naszym przypadku niepodatne na kompresję), aż do momentu osiągnięcia limitu komórek pamięci. Ostrzegamy zatem przed nierozważnym korzystaniem z programu, bo może on prowadzić do uszkodzenia dysku i nieodwracalnej utraty zgromadzonych na nim danych.
Procedura testowa jest czasochłonna, bo może ona potrwać nawet kilka miesięcy. Ustaliliśmy więc, że będziemy na bieżąco monitorować stan nośników i po osiągnięciu kolejnych „kamieni milowych” aktualizować artykuł o nasze spostrzeżenia i wyniki. Pierwszym naszym celem jest zapisanie 1 TB danych, a więc kolejnej aktualizacji spodziewajcie się już niedługo.
1 TB zapisanych danych
Wszystkie dyski zapisały po 1 TB danych i nie zauważyliśmy jakichkolwiek problemów z działaniem. Nie powinno to być dla nikogo zaskoczeniem, bo jeszcze daleko do limitu zapisu danych wynikającego z gwarancji (TBW) – przypominamy, został on ustalony mniej więcej na poziomie 22 TB.
We wszystkich przypadkach odczyt systemu S.M.A.R.T. jest w normie (jedynie w trzecim dysku wzrósł parametr Accumulated Runtime Bad Blocks), a żywotność dysków nadal wynosi 100%.
Przy okazji sprawdziliśmy też wydajność nośników w benchmarku wbudowanym w aplikację Anvil's Storage Utilities. Jak nietrudno się domyśleć, również jest ona w normie.
Kolejnym etapem będzie zapisanie 22 TB danych, a więc limitu wynikającego z gwarancji producenta.
22 TB zapisanych danych
Kolejny etap testu za nami. Wszystkie dyski zapisały 22 TB danych – choć jest to limit zapisu określany przez współczynnik TBW, nośniki nadal działają i nie zanosi się na szybką zmianę takiego stanu rzeczy. Główna różnica jest taka, że już wykorzystaliśmy gwarancję producenta (jest ona udzielana na 3 lata lub przekroczenie współczynnika TBW).
Odczyt wskaźnik S.M.A.R.T. bez większych niespodzianek – żywotność wszystkich dysków spadła do 92%, niemniej jednak nadal jest ona określana jako dobra. Trzecia próbka pozostaje z jednym uszkodzonym blokiem.
Jak wygląda kwestia wydajności? Tutaj już jest gorzej – wydajność zapisu raczej nie uległa zmianie, ale za to zauważyliśmy zauważalny spadek sekwencyjnego odczytu danych (mniej więcej z 450 MB/s do 360 MB/s). Jesteśmy ciekaw czy przy kolejnych etapach testu przypadłość ta będzie się pogłębiać, czy też zatrzyma się na takim poziomie.
Kolejnym etapem naszego testu będzie zapisanie 50 TB danych. Jak myślicie, wszystkie dyski wytrzymają takie obciążenie?
50 TB zapisanych danych
Dotarliśmy do kolejnego etapu testu – wszystkie dyski zapisały po 50 TB danych. Choć jest to ponad 2-krotnie więcej, niż producent określił jako współczynnik TBW, nośniki nadal działają i mają się całkiem dobrze.
Według statusu S.M.A.R.T., żywotność dysków wynosi 80% - można zatem powiedzieć, że nadal są w dobrym stanie. W międzyczasie platforma miewała jednak problemy ze stabilnością, co skutkowało zawieszeniem systemu lub niekontrolowanym restartem – mówi nam o tym parametr Power Cycle Count (Unplanned).
Co ciekawe, wydajność dysków wróciła do normy. Wygląda więc na to, że były to tylko chwilowe problemy i przekroczenie współczynnika TBW nie oznacza spadku osiągów. Jesteśmy ciekawi, jak to będzie wyglądać przy późniejszych etapach testu wytrzymałości.
No właśnie, kolejny cel jest trochę bardziej odległy, bo wynosi aż 100 TB zapisanych danych.
100 TB zapisanych danych
Zapisaliśmy już ponad 100 TB danych – choć jest to ponad 4-krotność parametru TBW, wszystkie dyski nadal mają się dobrze. Zerknijmy zatem w system S.M.A.R.T….
Żywotność nośników spadła do 59%, aczkolwiek jest w dobrym stanie. Nie odnotowaliśmy żadnych innych niepokojących odczytów (oprócz tych z wcześniejszych etapów testu).
Jeżeli chodzi o wydajność, od czasu nowości właściwie nie uległa ona zmianie. Jesteśmy ciekawi, czy przy kolejnym etapie osiągi też pozostaną takie same.
No właśnie, kolejnym etapem testu będzie zapisanie aż 200 TB danych. Z uwagi, iż będzie on wymagał już zdecydowanie więcej czasu, najprawdopodobniej spotkamy się dopiero za kilkanaście dni.
200 TB zapisanych danych
Wracamy po dłuższej przerwie z kolejnymi obserwacjami odnośnie testu wytrzymałości dysków OCZ ARC 100. Zapisaliśmy już ponad 200 TB danych, co stanowi prawie 10-krotność współczynnika TBW – przypominamy, że gwarancja udzielana przez producenta obowiązuje na 22 TB. Jak to wpłynęło na żywotność nośników?
CrystalDiskInfo oszacował wytrzymałość dysków jeszcze na 18%, aczkolwiek nadal kwalifikuje się ona jako dobra. W międzyczasie nie napotkaliśmy na żadne niepokojące objawy czy wskazania.
Jak wygląda kwestia wydajności? Od nowości praktycznie się nie zmieniła, choć najnowsze pomiary są nieznacznie niższe względem tych ostatnich. Czyżby zatem dyski powoli traciły swoje właściwości?
No właśnie, kolejnym krokiem w teście wytrzymałości będzie zapisanie 300 TB danych. Już zabieramy się do pracy, a więc kolejnej aktualizacji artykułu możecie spodziewać się za kilkanaście dni.
Pierwszy dysk uszkodzony
Stało się! Pierwszy dysk (próbka B) odmówił współpracy po zapisaniu prawie 240 TB danych – oczywiście mowa tutaj o danych przesłanych do dysku przez system, bo na kościach NAND, z uwagi na specyfikę zapisu pamięci półprzewodnikowych, zapisano blisko 360 TB danych. Co ciekawe, jest to ponad 10-krotnie więcej niż wynosi współczynnik TBW (22 TB), a więc deklarowany limit zapisu danych w ramach gwarancji udzielanej przez producenta.
Problemy objawiły się brakiem odpowiedzi ze strony nośnika – nie można było wykonać na nim żadnych operacji, aplikacja CrystalDiskInfo miała problemy z wykryciem nośnika, a systemowy menadżer zadań w ogóle go nie wykrywał. Po ponownym uruchomieniu komputera, dysk nie był już w ogóle wykryty przez płytę główną. Odnotowaliśmy również znacznie wydłużony czas uruchamiania systemu operacyjnego, gdy do płyty była podłączona niedziałająca próbka.
CrystalDiskInfo miał problemy z poprawnym wykryciem uszkodzonej próbki
Wytrzymałość wszystkich trzech nośników oszacowano na 4% i oznaczono ją jako wartą uwagi – jak widać, ostrzeżenie było całkowicie uzasadnione, ale szacowana żywotność wcale nie musi oznaczać prawdziwej żywotności dysku. W pozostałych dwóch nośnikach nie odnotowaliśmy innych niepokojących sygnałów, poza właśnie zmniejszeniem wskaźnika wytrzymałości.
Jak się okazuje, zapisanie prawie 240 TB danych praktycznie nie wpłynęło na osiągi nośników i nadal oferują one bardzo zbliżone rezultaty (różnice są na granicy błędu pomiarowego).
Jeżeli wszystko pójdzie zgodnie z planem, powinniśmy się spotkać za kilkanaście dni, gdy pozostałe dwa dyski zapiszą łącznie 300 TB.
Aktualizacja
Wysłaliśmy uszkodzony dysk do producenta w celu przeprowadzenia ekspertyzy. Ze względu na znaczne przekroczenie dopuszczalnego limitu zapisu danych, uszkodzeniu uległy właśnie kości pamięci NAND. Jednocześnie producent planuje wydać nowe oprogramowanie dla dysków SSD na bazie kontrolera Barefoot 3 (w tym właśnie ARC 100), które zwiększy wytrzymałość zapisu danych, nawet po przekroczeniu limitu deklarowanego przez producenta (TBW). Wychodzi więc na to, że nowe oprogramowanie może nie tylko rozwiązywać napotkane problemy, ale też udoskonalać sam dysk – i to ponad to co deklaruje sam producent. Brawa dla producenta!
300 TB zapisanych danych
Zgodnie z założeniami dotarliśmy do kolejnego etapu testów. Obydwa dyski mają „przebieg” przekraczający 300 TB, co stanowi praktycznie 14-krotność limitu gwarancyjnego (TBW). Zobaczmy jak to wpłynęło na nośniki.
System S.M.A.R.T. od około 250 TB wskazuje na zerową wytrzymałość nośników, więc ich stan został oznaczony jako zły. Jak widać, wskazania wcale nie muszą pokrywać się z rzeczywistością, bo nośniki działają i mają się całkiem dobrze – nawet po zapisaniu 300 TB nie odnotowaliśmy żadnych innych niepokojących sygnałów.
Wydajność dysków również nie uległa znacznej zmianie – wyniki testów Anvil's Storage Utilities są porównywalne z całkowicie nową sztuką.
Kolejnym etap przewiduje zapisanie 400 TB danych i powinien potrwać kolejne kilkanaście dni. Jak myślicie, obydwa dyski podołają wyzwaniu?
400 TB zapisanych danych
Dobrnęliśmy do kolejnego etapu testów – obydwa nośniki przetworzyły już 400 TB danych i nadal działają. Zobaczmy zatem jak to wpłynęło na ich żywotność i wydajność.
System S.M.A.R.T. już mniej więcej od 250 TB określa stan dysków jako zły, aczkolwiek pozostałe parametry nie uległy zmianie i nadal nic nie wskazuje na szybkie uszkodzenie próbek testowych. Jesteśmy pod wrażeniem!
Wydajność właściwie też nie uległa zmianie, bo wyniki z benchmarka Anvil's Storage Utilities mniej więcej pokrywają się z odczytami z poprzednich etapów. Ewentualne różnice mieszczą się w granicach błędu pomiarowego.
Dobrze myślicie, kolejny etap przewiduje przetworzenie aż 500 TB danych. Jesteśmy ciekaw czy obydwa nośniki do niego dotrwają, bo zadanie jest naprawdę wymagające.
Drugi dysk uszkodzony
Wracamy po dłuższej przerwie i od razu nadrabiamy zaległości. Nie dotarliśmy jednak do zaplanowanego etapu testów, bo w międzyczasie uszkodzeniu uległ drugi nośnik – tym razem próbka oznaczona literą „C”. Dysk przetworzył niespełna 495 TB danych, natomiast na kościach pamięci zostało zapisane prawie 735 TB.
Objawy uszkodzenia były identyczne, jak w przypadku poprzedniego modelu - nie można było wykonać na nim żadnych operacji, natomiast systemowy menadżer urządzeń w ogóle go nie wykrywał. Po ponownym uruchomieniu komputera nośnik nie był już w ogóle wykrywany przez płytę główną, co właściwie potwierdziło najczarniejszy scenariusz.
Już od jakiegoś czasu system S.M.A.R.T. informował o zerowej kondycji nośników - status ten nie uległ zmianie (podobnie zresztą jak wskazania poszczególnych atrybutów). Aplikacja CrystalDiskInfo miała jednak problemy z poprawnym wykryciem uszkodzonego nośnika.
Producent długo pracował nad zidentyfikowaniem usterki, ale w końcu winowajcą okazało się nie do końca dopracowane oprogramowanie dysku. W sporadycznych przypadkach, gdy nośnik jest już mocno wyeksploatowany, mogło dojść do uszkodzenia ważnych danych i tym samym uszkodzenia całego dysku.
Uszkodzony nośnik nie poszedł jednak na marne, bo przysłużył się do opracowania aktualizacji oprogramowania – aktualnie jest ono jeszcze w fazie testów, ale niebawem powinno zostać udostępnione publicznie. Kolejny plus dla producenta.
Sprawny nośnik działał bez zarzutów, a jego wyniki wydajności były porównywalne do tych z poprzednich etapów testu.
Do zapisania planowanych 500 TB pozostały niecałe 3 TB, ale właściwie nie ma sensu się rozdrabniać i celujemy w kolejny etap - jeżeli wszystko pójdzie zgodnie z planem kolejna aktualizacja pojawi się dopiero po zapisaniu 600 TB.
Trzeci dysk uszkodzony
Ekspertyza drugiego dysku uległa przedłużeniu, a więc trzeci dysk prawie przez dwa miesiące cierpliwie czekał na wznowienie testów. Gdy tylko opublikowaliśmy aktualizację artykułu, ruszyliśmy z testami i... spotkało nas niezbyt miłe rozczarowanie. Okazało się, że nośnik nie był chętny do współpracy – wprawdzie został wykryty przez komputer, ale miał on problem z wykryciem struktury katalogów. Nie pomogło też zwykłe formatowanie lub nawet wyzerowanie komórek pamięci. W głowie zrodziła się jedna myśl – czyżbyśmy mieli do czynienia ze zjawiskiem ograniczonej retencji danych?
Oczywiście także i tym razem odesłaliśmy dysk do laboratorium producenta, który potwierdził nasze przypuszczenia. Znaczne przekroczenie gwarantowanego limitu zapisu danych oraz długi czas pozostawienia nośnika bez zasilania, wpłynął na problemy z integralnością zapisanych danych, a to z kolei uniemożliwiło poprawne wykrycie nośnika i jakikolwiek zapis w obszarze komórek pamięci. Trzeci dysk okazał się zatem uszkodzony.
Podsumowanie i wnioski
Test pozwolił doświadczalnie sprawdzić wytrzymałość nośników i przy okazji obalić kilka mitów. Oprócz tego firma OCZ zobowiązała się do wydania nowej wersji oprogramowania dla swoich dysków, która m.in. w oparciu o nasze testy, pozwoli jeszcze bardziej zwiększyć żywotność modeli bazujących na kontrolerach z linii Barefoot 3. Trzymamy za słowo!
Oczywiście, zawsze można mieć jakieś “ale”, bo np. znacznie ciekawszy - z punktu widzenia czytelnika - byłby test porównawczy kilku różnych konstrukcji, wliczając w to modele bazujące na różnych typach pamięci. Mogliśmy też sprawdzić wpływ pamięci podręcznej lokowanej w obszarze pamięci RAM (np. Crucial Momentum Cache, Plextor PlexTurbo lub Samsung RAPID) - według deklaracji producentów, rozwiązania te pozwalają nie tylko zwiększyć wydajność nośników, ale też zmniejszyć ilość danych zapisywanych w pamięci NAND i w efekcie zwiększyć żywotność całego SSD. Problem jednak w tym, że nie wszyscy producenci są w stanie poświęcić swoje sample dla dobra nauki.
Wprawdzie nie podejrzewaliśmy, że potrwa to tak długo (aż osiem miesięcy), ale w końcu czego się nie robi dla naszych czytelników. Czas ten na pewno nie poszedł jednak na marne, bo wpadliśmy na kilka interesujących wniosków.
1. Każda sztuka dysku charakteryzuje się inną awaryjnością
Wytrzymałość dysku SSD w głównej mierze zależy od zastosowanych kości pamięci - nie tylko ich typu (SLC/MLC/TLC NAND), ale także litografii w jakiej zostały wykonane (im wyższy proces, tym teoretycznie większa wytrzymałość). Nie można jednak powiedzieć, że wszystkie dyski z takimi samymi pamięciami charakteryzują się identyczną żywotnością. Jest wręcz przeciwnie - potwierdził to nasz test, bo choć wykorzystaliśmy trzy takie same dyski, to każdy z nich został uszkodzony po zapisie innej porcji danych.
Wniosek ten przy okazji jest argumentem stojącym za inną bardzo ważną zasadą - pamiętajmy o wykonywaniu kopii zapasowych, gdyż tak naprawdę nie znamy dnia ani godziny, gdy nasze dane zostaną bezpowrotnie utracone.
2. Kości pamięci nie zawsze są najsłabszym ogniwem dysku SSD
Podejrzewaliśmy, że dyski zostaną uszkodzone po osiągnięciu limitu zapisu komórek pamięci (czyli po zapisaniu w pamięci NAND mniej więcej 700 TB). Tak się jednak nie stało, co może wskazywać, że w testowanym przez nas modelu OCZ ARC 100 mniej wytrzymałe okazały się inne komponenty dysku. Jesteśmy ciekawi, jakby to wyglądało w przypadku modeli bazujących na mniej wytrzymałych kościach TLC NAND.
3. Dysk może zapisać więcej danych niż deklaruje to producent (i S.M.A.R.T.)
Współczynnik TBW służy jedynie sztucznemu ograniczeniu gwarancji udzielanej przez producenta, ale w żaden sposób nie określa on wytrzymałości danego nośnika – za przykład warto podać choćby pierwszy dysk, który zdołał zapisać ponad 10-krotność współczynnika TBW. Mit podający, że współczynnik TBW jest wyznacznikiem żywotności SSD został obalony. Przy okazji warto również wspomnieć, że z realną wytrzymałością mało wspólnego ma też parametr kondycji podawany przez S.M.A.R.T..
4. Ograniczona retencja danych nie taka straszna jak ją malują
Często pomijanym problemem dysków półprzewodnikowych jest ograniczona retencja danych. Zjawisko to polega na zanikaniu ładunków elektrycznych z komórek pamięci (a więc właśnie danych), gdy przez odpowiedni czas nie jest do nich doprowadzane zasilanie. Wpływ na to ma również temperatura przechowywania niepodłączonego dysku, bo im jest ona wyższa, tym czas wymagany do zaniku ładunku jest krótszy. Ze względu na ograniczoną ilość dysków nie byliśmy w stanie dokładniej zbadać tego zjawiska, niemniej jednak w domowych warunkach raczej nie powinniśmy się obawiać o swoje dane. Komputer powinien być jednak uruchamiany nie rzadziej niż raz na kilkanaście dni.
5. Przy typowym użytkowaniu komputera nie musimy się martwić o żywotność dysku SSD
Jest to chyba najważniejszy wniosek płynący z naszego artykułu. Do testów wykorzystaliśmy syntetyczną procedurę, która pozwoliła w jak najkrótszym czasie zapisać jak największą porcję nieskompresowanych danych – realnie byliśmy w stanie przetworzyć około 2,5 TB danych w czasie 24 godzin. Podczas typowego użytkowania komputera dysk zapisuje dane znacznie rzadziej. Przyjmuje się, że typowy Kowalski w ciągu dnia zapisze na swoim nośniku nie więcej niż 10 GB danych (jak nie mniej).
Biorąc pod uwagę gwarantowaną wytrzymałość modelu OCZ ARC 100 240 GB na poziomie prawie 22 TB, po przeliczeniu daje nam to wytrzymałość na poziomie 6 lat. Warto jednak zauważyć, że jest to bardzo niski próg, bo w przypadku innych modeli deklaracja ta jest na poziomie 50 – 150 TB. Testy pokazały, że realna wytrzymałość (przyjmując też awaryjność innych komponentów) jest jeszcze wyższa, więc tak naprawdę szybciej wymienimy SSD na nowocześniejszy model, aniżeli ulegnie on uszkodzeniu. Oczywiście pod warunkiem, że nie wykorzystamy go do profesjonalnych zastosowań, charakteryzujących się dużo większym obciążeniem.
6. Kondycja dysku nie ma wpływu na jego wydajność
Kolejnym bardzo istotnym wnioskiem jest wpływ kondycji dysku na jego wydajność… a raczej brak jej wpływu. Okazuje się bowiem, że nośnik zawsze oferował mniej więcej taką samą wydajność - niezależnie czy dopiero wyjęliśmy go z opakowania, czy też jego kontroler przetworzył setki terabajtów i jeszcze więcej miały “na liczniku” pamięci NAND. Warto tutaj pamiętać o aktywnych funkcjach TRIM i Garbage Collection, które mają zbawienny wpływ na szybkość działania używanego nośnika.