
Odkryli problem z GeForce RTX 5090. Proponują nagrodę za rozwiązanie
CloudRift, dostawca chmury GPU, ujawnił poważny problem dotyczący kart graficznych NVIDIA GeForce RTX 5090 i RTX PRO 6000. Firma opublikowała opis usterki i wyznaczyła nagrodę 1000 dol. za wskazanie przyczyny lub rozwiązania problemu.
Karta graficzna NVIDIA GeForce RTX 5090 została zaprojektowana nie tylko z myślą o graczach, ale także o profesjonalistach. Oferuje wysoką wydajność oraz dużą pojemność pamięci VRAM, dzięki czemu sprawdza się także w środowiskach chmurowych i wirtualizacyjnych.
Firma CloudRift, dostawca usług chmury obliczeniowej dla GPU, odkryła problemy z działaniem kart GeForce RTX 5090 oraz jej profesjonalnego odpowiednika – modelu RTX PRO 6000. To sprzęt kosztujący odpowiednio 10 i 50 tys. zł.
Problem po stronie kart?
Według raportu CloudRift, problem występuje po przypisaniu karty graficznej do maszyny wirtualnej (VM) i jej wyłączeniu lub ponownym przypisaniu. Podczas tego procesu host wysyła komendę PCIe Function Level Reset (FLR), która ma przywrócić kartę do stanu gotowości.
Jest jeden problem. W przypadku RTX 5090 i RTX PRO 6000 reset nie działa poprawnie, a karta pozostaje w stanie "not ready", co skutkuje brakiem możliwości jej ponownego użycia bez pełnego restartu systemu.
Opublikowane logi systemowe wskazują, że problem leży po stronie kart graficznych, a nie w konfiguracji oprogramowania. Szczegóły opisano we wpisie na blogu.
Nagroda i apel do społeczności
CloudRift opublikowała listę testowanych rozwiązań, jednak na ten moment żaden sposób nie zadziałał. Firma zachęca społeczność do współpracy w celu identyfikacji usterki, która wpływa na stabilność środowisk wirtualnych z wykorzystaniem kart NVIDIA GeForce RTX 5090 i RTX PRO 6000 - w tym celu oferuje nagrodę w wysokości 1000 dol. za rozwiązanie problemu lub wskazanie jego przyczyny.
Społeczność potwierdza podobny problem
Jak zauważa serwis Tom’s Hardware, użytkownicy na forach takich jak Proxmox i Level1Techs zgłaszają podobne problemy z kartami GeForce RTX 5090. Niektórzy z nich zauważyli, że starsze modele, takie jak GeForce RTX 4090 czy karty serwerowe H100, nie wykazują tego błędu, co wskazuje na specyficzność problemu dla nowszych modeli z generacji Blackwell.
Komentarze
1