Oprogramowanie

Komputer dorówna człowiekowi przy porównywaniu obrazów

przeczytasz w 2 min.

Skuteczne i szybkie algorytmy

Opracowana na uniwersytecie Carnegie Mellon technika porównywania zdjęć potrafi niezwykle skutecznie wykrywać podobne obrazy. Przyda się w przyszłości nie tylko do usprawnienia i przyspieszenia wizualnych wyszukiwarek, ale przyczyni się do postępu w pracach nad rozwojem robotów.

Nowe narzędzie skutecznie wykrywa podobne zdjęcia, nawet jeśli wykonano je o innej porze roku, z innej perspektywy, a nawet kilkadziesiąt lat temu. Co więcej potrafi dopasować zdjęcia przypominające malowany obraz, a nawet szkic.

Mechanizmy stosowane w Google Images, Google Googles lub organizerach zdjęć bazują na podobieństwach w kolorach, kształtach i kompozycji, co jest zawodnym rozwiązaniem, gdy obrazy nie są do siebie bardzo podobne. W przypadku drobnych różnic, np. innej perspektywie lub kolorystyce, skapitulują.

Lew wyszukiwanie wizualne Google
Google Image nakarmiony jedynie zdjęciem lwa zwrócił listę podobnych zdjęć, na którym nie ma ani jednego wizerunku króla zwierząt.

Lew wyszukiwanie tekstowe Google
Zapytanie „lew” dało zgoła inne wyniki, co oznacza, że problem nie leży w niewystarczająco bogatej bazie zdjęć Google.

Nowa technika za najważniejsze przy porównywaniu zdjęć uznaje te elementy obrazu, które są dla niego unikalne, a nie te, które można znaleźć na milionach innych zdjęć. Podobieństwa wykrywane są na poziomie pikseli, a nie całego obrazu, co gwarantuje wysoką skuteczność działania. Abhinav Gupta, jeden z kierowników projektu zwraca uwagę, że prawdopodobnie tak samo działa mechanizm porównywania obrazów u człowieka. Zwraca on uwagę na szczegóły, np. rzadki kształt kopuły budynku, ale nie na cały budynek. Z tego samego powodu niezwykle szybko wykrywa podobne twarze, co dla komputerów nadal jest dużym wyzwaniem


Jednym z pracowników zespołu jest Tomasz Malisiewicz, co z pewnością daje się zauważyć, a raczej usłyszeć.

Nauczenie wspomnianego narzędzia umiejętności oceniania unikalności danych elementów obrazu nie było prostym zadaniem. Inna sceneria to inne elementy, które należy uznać za unikalne. Rozwiązanie wykorzystuje zatem algorytm, którego działanie oparte jest na danych (ang. data-driven). Skuteczność wykrywania podobnych obrazów przerosła oczekiwania naukowców.

Aleksiej Efron i Abhinav Gupta, kierujący zespołem, który opracował wspomniane narzędzie, zajmują się robotyką. Sugeruje to, że technologie związane z „komputerowym widzeniem” są priorytetem podczas prac. Niemniej można sobie wyobrazić możliwość wdrożenia algorytmu do wizualnych wyszukiwarek internetowych i aplikacji foto-wideo, co sprawi, że wreszcie będą działać tak jak chcemy.

Warto wspomnieć o istniejącym już narzędziu Photosynth stosowanym do tworzenia modeli 3D, czy o technologii PhotoDNA stosowanej przez Facebook do wykrywania zdjęć zawierających niepożądane treści. Również one bazują na porównywaniu zdjęć, ale zdaniem naukowców z Carnegie Mellon University nie są tak uniwersalne.
 

Więcej o praktycznych technologiach jutra:

Źródło: Carnegie Mellon University

Komentarze

10
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Konto usunięte
    1
    Po prostu genialne :P
    • avatar
      Warmonger
      1
      Nareszcie! Przyda się przy wyszukiwaniu np. screenów z gier czy aplikacji, zdjęć w większej rozdzielczości czy po prostu tego, czego chcę mieć więcej.

      Jak dla mnie to najważniejszy news miesiąca, nie żaden Modern Warfare :P.
      • avatar
        xfire25
        1
        hmmm mam mieszane odczucia - niby wszystko fajnie tylko jak pójdą krok dalej i np. wkleję swoje zdjęcie to mi wyszuka wszystkie zdjęcia na których jestem w internecie :P?
        • avatar
          Szymon331
          -1
          O kurka. Chyba czas przeszukać internet i wywalić z niego wszystko co moje.
          Uf uf, dobrze że nie mam konta na "twarzoksiążce" chyba czas zablokować bloga ;)
          • avatar
            Maciej Lewczuk
            0
            W okolicach 4tej minuty muzyczka z Vabanku jest chyba? ;D
            • avatar
              .Alx.
              0
              Tak naprawdę tego typu rozwiązania wykorzystane będą głównie w systemach monitoringu w celu jeszcze sprawniejszego rozpoznawania i identyfikacji twarzy oraz przedmiotów.

              Jednym z bardziej zaawansowanych systemów tego typu jest INDECT, rozwijany przez Krakowskie AGH za pieniądze UE - 15 mln euro.
              "AGH odniosła ogromny sukces w skali Unii Europejskiej. Projekt INDECT „Inteligentny system informacyjny wspierający obserwację, poszukiwanie i detekcję dla bezpieczeństwa obywateli w środowisku miejskim” opracowany przez prof. Andrzeja Dziecha z Katedry
              Telekomunikacji przy współpracy naukowców z Wydziału Elektrotechniki, Automatyki, Informatyki i Elektroniki"

              Oczywiście, my "musimy" wierzyć, że to wyłącznie dla naszego dobra...