oczy google
28

Nie uwierzysz jak głęboko sięga sztuczna inteligencja Google

A sięga naprawdę bardzo głęboko. Doskonale nam wiadomo, że Google żyje z pozyskiwania i oferowania następnie informacji, ale rzadko się zastanawiamy, w jaki sposób do nich dociera. W przypadku Map Google, czy też Street View, są to specjalne samochody, które robią zdjęcia w 360 stopniach, a następnie maszyna analizuje to, co zostało uchwycone. Dopiero teraz zaczyna się zabawa.

Wśród zdjęć zrobionych za pomocą samochodów uczestniczących w zbieraniu informacji dla Street View można znaleźć sporo ciekawych rzeczy – szyldy sklepowe, nazwy ulic, znaki drogowe – wszystko to powoduje, że Google dostarcza nam coraz lepsze dane na temat miejsc, w które chcemy się udać. Jest z tym jeden problem – o ile zwykły tekst jest dla nas oczywisty i zrozumiały, dla maszyny już nie musi taki być. Ta musi się nauczyć, co oznaczają symbole, za pomocą których się porozumiewamy i przetworzyć to następnie na przydatne dla nas dane w usłudze.

Wykorzystanie sieci neuronowych oraz machine learningu jest tutaj kluczowe. Wyobraźcie sobie armię pracowników Google, którzy jeżdżą od ulicy do ulicy, robią zdjęcia, a następnie sami, na własną rękę analizują to, co zostało uchwycone na zdjęciach. Każdy znak drogowy, każdy szyld, każdą tabliczkę z nazwą ulicy. Należy również przeanalizować każdy układ dróg na skrzyżowaniu, obowiązujące zasady podstawowych manewrów. Ludzie potrzebowaliby na to mnóstwo czasu – dobrze wyuczona w tym kierunku maszyna zrobi to o wiele szybciej i… taniej. Wystarczy, że damy programowi wolną rękę, a ten będzie nam co jakiś czas zgłaszał efekty swoich działań. Możemy go poprawić, a na podstawie poprawnych predykcji i nieznacznych modyfikacji udoskonali się na tyle, że będzie w stanie ów proces przeprowadzać sam – bez udziału kogokolwiek innego.

Google

Efekty działania maszyny Google można znaleźć we Francji

Gigant korzysta ze zdjęć zgromadzonych w Street View i poddaje je obróbce maszynie, która analizuje wszystko, co zostało dostrzeżone okiem kamery. Już teraz Google może się pochwalić 85 – procentową skutecznością w odczytywaniu nazw ulic. Błędy wynikają albo z niedokładnych zdjęć, albo ze zbyt skomplikowanego układu arterii miejskich, które wykraczają (na razie) poza możliwości maszyny. Program korzysta z czegoś na wzór OCR – techniki odczytywania tekstu z obrazów na wzór tego, co możemy znaleźć w programach do skanowania książek i eksportowania edytowalnego tekstu. Co ciekawe, maszyna Google jest odporna na zmianę czcionki, czy też rozmiaru.

Google

Ale to przecież nie wszystko – maszyny oparte na sieciach neuronowych, machine learningu są w stanie również nazywać obiekty na ekranie. Filtr w Grafice Google opiera się na działaniu właśnie takiego mechanizmu – spośród wszystkich zindeksowanych stron wykrywane są takie grafiki, które mogą zawierać niewłaściwe dla młodszego odbiorcy treści. I tego nie robi człowiek, lecz maszyna – nie opierając się na tagach, nie zbaczając na tematykę strony. Tylko na to, co dzieje się na danym obrazku.

Źródło: Blog Google