Google

"Nieskończony zoom" to już nie tylko serialowy mit. Zobacz, co potrafi Google

Jakub Szczęsny
"Nieskończony zoom" to już nie tylko serialowy mit. Zobacz, co potrafi Google
16

Wielu z Was oglądało pewnie seriale kryminalne (na przykład nieśmiertelne CSI), w których śledczy potrafili nieskończenie powiększać niektóre zdjęcia i odczytywać z nich na przykład tablice rejestracyjne, albo rozpoznawać twarze podejrzanych o przestępstwo osób. Oczywiście, w tego typu produkcjach wygląda to jak magia, wręcz bajeczka. A tymczasem, mechanizm Google oparty na uczeniu maszynowym potrafi coś podobnego - oczywiście w nie tak spektakularnym stopniu jak narzędzia serialowych śledczych.

Chyba nikomu nie trzeba mówić, że podczas powiększania grafik, trudno jest utrzymać wysoki poziom szczegółowości. Oczywiście, "Photoshop ninja" może dopracować powiększony obraz tak, że wyciągnie niektóre utracone detale. Ale i takie rzeczy "nie są z gumy". Człowiek też nie da rady zrobić wszystkiego. Tutaj do głosu dochodzi jednak technologia i Google ma w zanadrzu ciekawe rozwiązanie, które automatycznie wyciągnie szczegóły z powiększonego obrazu. System RAISR (Rapid and Accurate Image Super-Resolution) jest w stanie wykonać wspomniany "zoom" bez poszarpywania krawędzi i zachowując pewien poziom szczegółowości w czasie rzeczywistym, nawet na urządzeniach mobilnych.

Oczywiście, Google jest świadome tego, że na rynku już istnieją podobne rozwiązania, jednak uznaje, że są one nie zawsze tak skuteczne jak RAISR, a dodatkowo - działają nieco wolniej. Gigant chwali się, że opracowany przez niego system jest szybszy od alternatyw nawet o 100 razy.

Najciekawsze jest jednak to, że RAISR działa w oparciu o uczenie maszynowe

RAISR uczy się, jak wygląda obraz w wysokiej jakości i próbuje dostosować do tego modelu wejściową grafikę. Jednak bierze pod uwagę również takie czynniki, jak jasność, kolory, ich nasycenie i dobiera do grafiki filtry, które może zastosować, by wyciągnąć z niej jak najwięcej pożądanych szczegółów. Dodatkowo, sprawdzany jest wejściowy format grafiki, korzysta z tych informacji by określić pierwotną strukturę obrazka. Wtedy RAISR zajmie się również artefaktami powstałymi w wyniku działania różnych metod kompresji danych.

Tego typu rozwiązanie może się przydać nie tylko w "serialowych zastosowaniach", jednak tu trzeba przyznać, że i RAISR z gumy nie jest i pewne ograniczenia posiada. Wyjściowy obrazek nie jest idealnie czysty i szczegółowy. Ale, w przypadku urządzeń mobilnych może być to niemały krok naprzód, by stworzyć rozwiązanie pozwalające na "bezstratny" zoom cyfrowy. W czasie rzeczywistym będziemy w stanie powiększyć obraz w aparacie i zrobić zdjęcie bez obawy o nadmierne szumy, czy utratę szczegółowości. Dodatkowym argumentem przemawiającym za takim zastosowaniem systemu RAISR jest fakt, iż działa on zdecydowanie szybciej od konkurencyjnych rozwiązań, a zatem wyniki jego pracy ujrzymy już na krótko po wykonaniu ujęcia smartfonem.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Więcej na tematy:

Google