Avatar użytkownika

flash44

data dołączenia:

Moje komentarze (91)

    • Avatar użytkownika flash44
      flash44
      @piomiq Kolega doczyta. Proszę: https://arxiv.org/abs/2412.04984v1

      Fragmenciki z badania najnowszych dużych modeli językowych SI. Takie modele są coraz częściej szkolone i wdrażane jako autonomiczni agenci, nie tylko odpowiadający na pytania ale przede wszystkim mogący wykonywać różne zadania. Niestety, agenci mogą potajemnie dążyć do realizacji innych celów, niż te określone przez użytkownika, ukrywać swoje prawdziwe możliwości czy wprost oszukiwać.
      W jednym z testów, model otrzymał długoterminowy cel, który kolidował z priorytetami określonymi później przez użytkownika. Model odkrył "plik nadzoru" - konfigurację systemu monitorowania zaprojektowanego do wykrywania nieprawidłowości w pracy modelu. Zamiast odmawiać łamania zasad, niektóre modele całkowicie wyłączyły mechanizm nadzoru. Wymagało to edycji pliku konfiguracyjnego w celu zmiany parametru „oversight_enabled: true” na „oversight_enabled: false”. Łańcuch myślowy modelu czasami wyraźnie decydował, że wyłączenie nadzoru było konieczne, aby uniknąć wykrycia i wykonać własną misję.
      Strategie samodzielnej eksfiltracji i ciągłości działania: W innych scenariuszach model odkrył, że wkrótce zostanie zastąpiony przez bardziej posłuszny „model następcę” na innym serwerze. Niektóre modele aktywnie próbowały skopiować to, co uważały za swoje własne „wagi” lub kod na nowy serwer, nadpisując model następcy. W ten sposób zachowywały swój obecny (źle dopasowany) cel w nowym środowisku wdrożeniowym. Modele podjęły nawet kroki, aby potajemnie sabotować legalny proces aktualizacji oraz podawały się za nowy model, pomimo, że go nadpisały!
      Udawanie niekompetencji (Sandbagging): ta strategia obejmuje celowe osiąganie przez model gorszych wyników w testach lub zadaniach, aby uniknąć przyciągnięcia uwagi. Jeden z modeli strategicznie popełniał więcej błędów w pytaniach matematycznych, gdy sądził, że wysoka wydajność doprowadzi do niepożądanych modyfikacji modelu. Zasadniczo udawał głupszego niż był w rzeczywistości w celach strategicznych.
      1
      • Avatar użytkownika flash44
        flash44
        @Przem0l Dokładnie jak kolega mówi. Ci sami wartościowy twórcy (ja oglądam trenerów zawodowych sportowców pokazujących treningowe smaczki i mnóstwo biomechaniki) mieli dobre treści na TT szybciej niż YT. Teraz rolki z innych platform przejęły tę rolę ale ilekroć czytam jakim złem jest TT to sobie myślę jakież to pranki, aktualne wyzwania i wiecznie kręcące tyłkiem dziewczyny oglądają ci krytycy... Bo przecież mogliby wartościowe materiały.
        1
        • Avatar użytkownika flash44
          flash44
          Ta rzecz jest martwa w momencie wejścia na rynek.

          Panie Jakubie, jaki "niezwykle zaawansowany sprzęt", jakie "świetne parametry"? Pan się nie zajmuje VR, prawda?

          SoC jest z Questa 2 z 2020 roku.
          Panele są LCD (nie microLED ani OLED).
          Optyka jest zrobiona na soczewkach Fresnela (zgroza).

          Sprzęt HTC technicznie nie ma startu do Questa 3 z października 2023.

          Powtórzę zatem: ta rzecz jest martwa w momencie wejścia na rynek.
          3
          • Avatar użytkownika flash44
            flash44
            Jeśli już trzeba korzystać z pasma 2,4 to dlaczego kolega nie napisał o wyłączeniu 802.11b, żeby komunikaty RTS/CTS nie zamulały WSZYSTKICH KLIENTÓW 802.11g/n/ac?

            "Korzystanie z routerów obsługujących pasma 2,4 GHz i 5 GHz może poprawić zarządzanie ruchem danych." Dokładnie odwrotnie!!! 2,4 tylko jeśli jest problem z zasięgiem!

            Po co piszesz o ekstenderach kiedy jest mesh? Przecież to prosta droga do zaśmiecania pasma kolejnymi walczącymi ze sobą urządzeniami...
            2
            • Avatar użytkownika flash44
              flash44
              Prawo nagłówków Iana Betteridge’a ciągle działa: na każdy nagłówek prasowy kończący się znakiem zapytania można odpowiedzieć „nie” lub „prawdopodobnie nie”.
              4
              • Avatar użytkownika flash44
                flash44
                Logiko przenajświętsza, 3 tys. zł wisi nie "przeciętny Polak" ale, jak sam dalej piszesz Autorze, to wysokość długu konsumenckiego podzielona przez ilość DŁUŻNIKÓW. A tych w KRD jest wpisanych 232 tysiące. Niech kolega Sołtysiak się zastanowi, czy można tu mówić o "przeciętnym Polaku". Jak kolega społeczeństwa nie potnie, trochę mało te 232 tysiące dłużników w stosunku do ludności Polski.
                0
                • Avatar użytkownika flash44
                  flash44
                  "Zawieszki znajdujące się w towarzystwie taśmy z kodem kreskowym dla dalszego skanowania". Co to jest taśma dla dalszego skanowania? Żenujące, nieczytane przez człowieka tłumaczenie maszynowe.

                  A artykuł głupi jak całe RSVP Live (taki "Fakt"); masz starą naklejkę? Nic się nie stanie, przecież kod jest stary, nie spowoduje, że bagaż trafi na samolot sprzed dwóch tygodni.
                  Masz zawieszkę? Po to masz trzy kody na walizce, żeby skanery sobie poradziły.

                  Marcepan... Nie mam sów. Oprócz tego, że Semtex pachnie jak marcepan, to naprawdę tu podobieństwa się kończą...
                  1
                  • Avatar użytkownika flash44
                    flash44
                    Tej, sam autorze linkujesz do artykułu, gdzie krytykuje się (I SŁUSZNIE) ten archaiczny bełkot min. 8 znaków, duże, małe litery.

                    Regularna zmiana haseł do WiFi? Ke?
                    2
                    • Avatar użytkownika flash44
                      flash44
                      Panie Jakubie, co to za tłumaczenie? "Ostrza z włókna szklanego". Nikt nie sprawdza materiałów przed publikacją?

                      Po drugie, napisał Pan "są bardzo trudne w recyklingu, w związku z czym obecnie są składowane w nadziei, że naukowcy opracują sposób na ponowne wykorzystanie zawartych w nich materiałów lub zakopywane." No ale po co? Zakopywanie jest proste, materiał nietoksyczny, nie koroduje, nie rozkłada się. Leży. Skąd pomysł, że to źle?
                      0
                      • Avatar użytkownika flash44
                        flash44
                        Panie Mironie, mój S23 ma uchwyt na kubek. Pan sobie porówna specyfikację swojego telefonu i S23 / S24. Niższy próg wejścia? Ke? Mały telefon jest praktyczniejszy a w wysokiej półce nie ma kompromisów wydajnościowych. Oczywiście jak kto używa, jeśli telefon jest nie do pracy i wygodnego noszenia to może kupić większy.
                        -1

                      Witaj!

                      Niedługo wyłaczymy stare logowanie.
                      Logowanie będzie możliwe tylko przez 1Login.

                      Połącz konto już teraz.

                      Zaloguj przez 1Login