Nie uwierzysz jak głęboko sięga sztuczna inteligencja Google

A sięga naprawdę bardzo głęboko. Doskonale nam wiadomo, że Google żyje z pozyskiwania i oferowania następnie informacji, ale rzadko się zastanawiamy, w jaki sposób do nich dociera. W przypadku Map Google, czy też Street View, są to specjalne samochody, które robią zdjęcia w 360 stopniach, a następnie maszyna analizuje to, co zostało uchwycone. Dopiero teraz zaczyna się zabawa.

Wśród zdjęć zrobionych za pomocą samochodów uczestniczących w zbieraniu informacji dla Street View można znaleźć sporo ciekawych rzeczy - szyldy sklepowe, nazwy ulic, znaki drogowe - wszystko to powoduje, że Google dostarcza nam coraz lepsze dane na temat miejsc, w które chcemy się udać. Jest z tym jeden problem - o ile zwykły tekst jest dla nas oczywisty i zrozumiały, dla maszyny już nie musi taki być. Ta musi się nauczyć, co oznaczają symbole, za pomocą których się porozumiewamy i przetworzyć to następnie na przydatne dla nas dane w usłudze.

To cię zainteresuje Google zamienia Raspberry Pi 3 w wirtualnego asystenta Ten atak phishingowy na konta Google może mieć daleko idące konsekwencje

Reklama

Wykorzystanie sieci neuronowych oraz machine learningu jest tutaj kluczowe. Wyobraźcie sobie armię pracowników Google, którzy jeżdżą od ulicy do ulicy, robią zdjęcia, a następnie sami, na własną rękę analizują to, co zostało uchwycone na zdjęciach. Każdy znak drogowy, każdy szyld, każdą tabliczkę z nazwą ulicy. Należy również przeanalizować każdy układ dróg na skrzyżowaniu, obowiązujące zasady podstawowych manewrów. Ludzie potrzebowaliby na to mnóstwo czasu - dobrze wyuczona w tym kierunku maszyna zrobi to o wiele szybciej i... taniej. Wystarczy, że damy programowi wolną rękę, a ten będzie nam co jakiś czas zgłaszał efekty swoich działań. Możemy go poprawić, a na podstawie poprawnych predykcji i nieznacznych modyfikacji udoskonali się na tyle, że będzie w stanie ów proces przeprowadzać sam - bez udziału kogokolwiek innego.

Efekty działania maszyny Google można znaleźć we Francji

Gigant korzysta ze zdjęć zgromadzonych w Street View i poddaje je obróbce maszynie, która analizuje wszystko, co zostało dostrzeżone okiem kamery. Już teraz Google może się pochwalić 85 - procentową skutecznością w odczytywaniu nazw ulic. Błędy wynikają albo z niedokładnych zdjęć, albo ze zbyt skomplikowanego układu arterii miejskich, które wykraczają (na razie) poza możliwości maszyny. Program korzysta z czegoś na wzór OCR - techniki odczytywania tekstu z obrazów na wzór tego, co możemy znaleźć w programach do skanowania książek i eksportowania edytowalnego tekstu. Co ciekawe, maszyna Google jest odporna na zmianę czcionki, czy też rozmiaru.

Ale to przecież nie wszystko - maszyny oparte na sieciach neuronowych, machine learningu są w stanie również nazywać obiekty na ekranie. Filtr w Grafice Google opiera się na działaniu właśnie takiego mechanizmu - spośród wszystkich zindeksowanych stron wykrywane są takie grafiki, które mogą zawierać niewłaściwe dla młodszego odbiorcy treści. I tego nie robi człowiek, lecz maszyna - nie opierając się na tagach, nie zbaczając na tematykę strony. Tylko na to, co dzieje się na danym obrazku.

Czytaj dalej poniżej

Google i Facebook ofiarami phishingu. Przez 2 lata firmy przelały oszustowi 100 mln USD Marcin Hołowacz

Google rzuca rękawicę konkurencji: firma poprawia zyski o kilkadziesiąt procent Maciej Sikorski

Źródło: Blog Google

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Reklama