DeepMind to brytyjska firma zajmująca się rozwojem sztucznej inteligencji, która została wykupiona przez Google. Pojawił się ciekawy wpis na ich oficjalnym blogu, z którego możemy wyczytać o AI wyposażonej w wyobraźnię.
Ta nowa technologia Google potrafi robić rzeczy, które dotąd mogli wyłącznie ludzie
Najpierw dostajemy tego typu wstęp:
Wyobrażanie sobie konsekwencji swoich czynności zanim się ich podejmiemy, to bardzo potężne narzędzie ludzkiego poznania. Przykładowo, kiedy podejmiemy się postawienia szklanki na rogu stołu, najprawdopodobniej na chwilę się wstrzymamy, żeby rozważyć jak stabilny będzie efekt tego postępowania i czy nie spowoduje to upadku szklanki. Na podstawie tych wyobrażonych przez siebie konsekwencji, możemy skorygować nasze zamiary i postawić szklankę w taki sposób, aby uniknąć jej upadku i destrukcji. Ta forma ostrożnego wnioskowania, w gruncie rzeczy jest „wyobraźnią”, co stanowi ludzkie narzędzie o niezwykle istotnym znaczeniu dla codziennego życia.
Wyrafinowany algorytm to taki z wyobraźnią?
Ludzie z DeepMind napisali na swoim blogu, że jeśli ich algorytmy mają cechować się równie wyrafinowanym zachowaniem, to również muszą posiadać umiejętność „wyobrażania” oraz rozważania na temat przyszłości. Do tego niezbędna jest możliwość tworzenia planu na podstawie tej wiedzy. Świetnym przykładem postępu w takich pracach ma być AlphaGo, które analizuje jak określone akcje wpłyną na przyszłe wydarzenia, po to żeby coś lepiej zaplanować. Te modele działają świetnie, ponieważ ich środowisko jest „doskonałe”, są w nim wyraźnie określone zasady, co pozwala na niezwykle dokładne przewidywanie konsekwencji mających miejsce w przyszłości, niemal w każdej sytuacji jaka może mieć miejsce w trakcie gry.
Niestety prawdziwy świat tak nie działa… jest znacznie bardziej złożony, ma zasady, które wcale nie są tak oczywiste, a problemy które mogą mieć miejsce są… losowe, nieprzewidywalne. Posługiwanie się wyobrażeniami o przyszłości w takim środowisku może być niezwykle żmudnym i kosztownym procesem.
Imagination-augmented agents
Dlatego ludzie z DeepMind pracują w pocie czoła nad lepszymi rozwiązaniami dla środowisk, które nie są tak idealnie zdefiniowane jak w przypadku gry. Ich nowi agenci mają czerpać korzyści z „imagination encoder”, czyli sieci neuronowej, uczącej się wydobywać jakiekolwiek informacje, które będą przydatne dla agenta w podejmowaniu decyzji, ale ignorujące informacje, które nie są przydatne. Następnie wymieniono informacje o ich podstawowych cechach.
- Uczą się interpretować swoje wewnętrzne symulacje.
- Posługują się swoją wyobraźnią w sposób wydajny.
- Uczą się różnych strategii, po to żeby tworzyć plany działania. Albo kontynuują wyobrażoną trajektorię, albo ją restartują i zaczynają od nowa.
Żeby przetestować tę architekturę, posłużono się grą Sokoban oraz grą o nawigowaniu statku kosmicznego. W Sokoban trzeba popychać pudełka. Można tylko pchać, nie można ich ciągnąć i zacząć się cofać, więc trzeba brać pod uwagę sytuacje, w których tracimy kontrolę nad pudełkiem np. po zabrnięciu z nim w narożnik nic już nie zrobimy. W grze o kierowaniu statkiem, trzeba włączać silniki ograniczoną ilość razy, w taki sposób, żeby nawigować pomiędzy planetami i ich przyciąganiem grawitacyjnym. Mapy są generowane proceduralnie i każda z nich może być przetestowana przez agenta tylko raz. Ma to ograniczyć zdawanie się na metodę prób i błędów. Zaraz… nie można sobie potestować levelu? To jak agent ma się nauczyć jego pokonywania? Metodą ma być wyobrażanie sobie tego, w jaki sposób nasze czynności wpłyną na przebieg wydarzeń w grze – tak jak robią to ludzie, którzy do wszystkiego mają jedno podejście i nie mogą sobie resetować życia i zaczynać od nowa, bo coś nie wyszło.
Sztuczna inteligencja z wyobraźnią, prawie jak człowiek!
Właśnie dlatego w internecie mamy teraz sporo nagłówków na ten temat, tzn. AI, które planuje jak człowiek i posługuje się wyobraźnią. Brzmi bardzo ciekawie. Szczegółowy wpis na blogu DeepMind znajduje się poniżej jako źródło.
Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu