
Firma Stability AI wprowadziła nowy model Stable Diffusion 3.0 - Stable Diffusion 3.0 Medium BF16, który został zoptymalizowany pod kątem procesorów AMD Ryzen AI.
AMD we współpracy ze Stability AI opracowało wersję modelu Stable Diffusion 3.0 Medium w formacie Block FP16, dostosowaną do jednostek NPU opartych na architekturze AMD XDNA 2. Model został zaprojektowany z myślą o nowych laptopach z procesorami AMD Ryzen AI, gdzie może działać lokalnie z pełną precyzją i bez nadmiernych wymagań sprzętowych.
Model jest już dostępny w narzędziu Amuse 3.1 by Tensorstack, które obsługuje tryb HQ na kompatybilnych urządzeniach. Nowy model jest przystosowany do pracy na laptopach z procesorami AMD Ryzen serii 7040 i 8040 (z wyjątkiem Ryzen 5 7540U, Ryzen 5 8540U, Ryzen 3 7440U i Ryzen 3 8440U), a także na nowszych jednostkach z serii AMD Ryzen AI 300 oraz Ryzen AI 300 serii MAX.
Niższe wymagania pamięci
Stable Diffusion to model sztucznej inteligencji służący do generowania obrazów na podstawie opisów tekstowych (tzw. tekst-to-obraz). Wykorzystuje technikę dyfuzji, aby stopniowo przekształcać losowy szum w realistyczne obrazy zgodne z podanym promptem.
Wersja Block FP16 umożliwia uruchomienie modelu na laptopach wyposażonych w 24 GB RAM, przy realnym zużyciu pamięci na poziomie około 9 GB. Format BF16 pozwala na zachowanie wysokiej jakości generowanych obrazów bez agresywnej kompresji.
Dzięki temu generowanie obrazów AI w pełnej precyzji staje się dostępne na szerszej gamie sprzętu konsumenckiego.
Wbudowane skalowanie obrazu do 4 MP
Model wykorzystuje dwustopniową ścieżkę działania, która najpierw generuje obraz w rozdzielczości 1024×1024 px, a następnie skaluje go do 2048×2048 px. Proces odbywa się w całości lokalnie, bez potrzeby użycia zewnętrznych narzędzi.
AMD chwali się, że ostateczny rezultat to obraz o jakości wystarczającej do zastosowań drukarskich lub profesjonalnej prezentacji. Przy okazji zaprezentowano też kilka przykładowych grafik.
foto na wejście: Adobe Stock
Komentarze
2Jeżeli ktoś faktycznie generuje mnóstwo grafik i potrzebuje dużej mocy obliczeniowej, to wybiera usługę w subskrypcji lub składa własną stację roboczą. Nie ma potrzeby grzania laptopa.
Laptop jest użyteczny, gdy nosimy go z miejsca na miejsce i możemy szybko na nim pracować. A generacja obrazów zawsze chwilę trwa, szczególnie w przypadku dużej rozdzielczości. Nie ma sensu gapić się na pasek postępu na laptopie i czekać, aż dostaniemy odpowiednią grafikę (a SD zazwyczaj wymaga wielu prób).