14

RankBrain, czyli sztuczna inteligencja w wyszukiwarce. Pod maską Google’a dzieją się czary

Każdego dnia wyszukiwarka Google przetwarza trzy miliardy zapytań. Ok. 15 proc. z tej puli to frazy, które nigdy wcześniej się nie pojawiły. Daje to jakieś 450 mln haseł. Jak Google sobie z tym radzi? Z początkiem bieżącego roku uruchomiono specjalny algorytm RankBrain, który przebija wszystko, co dotąd napędzało największą na świecie wyszukiwarkę. RankBrain to sztuczna […]

Każdego dnia wyszukiwarka Google przetwarza trzy miliardy zapytań. Ok. 15 proc. z tej puli to frazy, które nigdy wcześniej się nie pojawiły. Daje to jakieś 450 mln haseł. Jak Google sobie z tym radzi? Z początkiem bieżącego roku uruchomiono specjalny algorytm RankBrain, który przebija wszystko, co dotąd napędzało największą na świecie wyszukiwarkę.

RankBrain to sztuczna inteligencja działająca w służbie wyszukiwarki. Ten specjalny, opracowany na początku bieżącego roku i działający globalnie od kilku miesięcy algorytm jest jedną ze składowych części silnika Hummingbird napędzającego Google od 2013 roku. Co najciekawsze, RankBrain stanowi obecnie trzeci najważniejszy spośród setek sygnałów branych pod uwagę przez wyszukiwarkę podczas ustalania pozycji danej strony w wynikach. Oczywiście Google nie ujawnia, jakie elementy zajmują dwa pierwsze miejsca – to jedna z wielu tajemnic, jakimi osnute jest działanie Hummingbirda. Specjaliści od SEO znają obecnie 200 głównych, ale szacuje się, że może być nawet 10 tys. ich wariantów oraz pomniejszych subsygnałów.

Do czego Google’owi potrzebna sztuczna inteligencja w wyszukiwarce? Jak wspomniałem, ok. 450 mln zapytań każdego dnia jest zupełną nowością dla silnika wyszukiwania. Dotąd za wszelkimi działaniami mającymi na celu dostosowanie Google do tych zmian stał człowiek. Inżynierowie Google’a przygotowywali listę synonimów oraz bazę powiązań między słowami i frazami. Była w tym pewna automatyzacja, ale jednak bez udziału pracowników firmy żadne zmiany w wyszukiwarce nie miały miejsca.

Google Updates Its Logo

RankBrain działa inaczej i w pewnym stopniu opiera się na semantyce. Jego rolą jest ciągła analiza wpisywanych fraz pod kątem związków z wynikami wyszukiwania nie zawierającymi wpisanych słów kluczowych. Przykład? Google podaje jeden „Ile łyżeczek mieści jedna filiżanka? RankBrain jest w stanie dostarczyć inny wynik w Australii oraz USA, bo przyjęte pojemności łyżeczek i filiżanek w tych krajach są diametralnie różne mimo tych samych nazw przedmiotów. Takich przykładów mogą być dziesiątki. RankBrain potrafi powiązać długie zapytania (w branży SEO określane jako long-tail) z krótszymi frazami, jeżeli uzna, że są one do siebie podobne. W rezultacie zupełnie nowe dla wyszukiwarki zapytanie, które dotyczy znanego już zjawiska skutkuje bardziej dopasowanymi wynikami. RankBrain nieustannie się uczy i gromadzi dane, dzięki czemu każda kolejna analiza wpisywanych przez użytkowników danych jest skuteczniejsza.

2015-10-28_150652

Przy czym nie należy tego mieszać z Knowledge Graph uruchomionym w 2012 roku. Za Grafem Wiedzy Google’a również stoi zaawansowana technologia (której przyświeca sprytne hasło „things not strings”, a więc „rzeczy, a nie frazy”). Jej fundamentem jest jednak baza faktów o świecie agregowanych z jednego źródła (najczęściej Wikipedii). Google po prostu je przeszukuje i zna powiązania istnieją między poszczególnymi elementami (Sylwester Stallone i film Rambo, Da Vinci i Mona Lisa itd.). Tutaj nie ma nawet grama AI.

Warto dodać, że obecnie RankBrain nie wpływa bezpośrednio na wyniki wyszukiwania. Jego działanie podlega kontroli. Dane i powiązania są zbierane w zewnętrznej bazie i dopiero, gdy pracownicy Google’a uznają je za odpowiednio zinterpretowane, trafiają do wyszukiwarki. Zapewne upłynie nieco czasu zanim RankBrain otrzyma pełną swobodę.

Za działaniem Google stoi coraz bardziej zaawansowana technologia. Wyszukiwarka musi dynamicznie dostosowywać się do rzeczywistości, która przecież również nie stoi w miejscu. Pytanie, za ile lat wyszukiwarka stanie się na tyle autonomicznym tworem, że nie będzie potrzebowała żadnej ingerencji człowieka.

Źródła: Search Engine Land, Bloomberg, Google, własne