Test Turinga - czy to ciągle bat na sztuczną inteligencję?

Sztuczna inteligencja to w dzisiejszych czasach niezwykle popularne, ale jednocześnie mylące pojęcie. Wszechobecny dyktat marketingu zrobił z niego typowego „buzzworda”, hasło-wytrych mające nam wszystko sprzedać. Tymczasem sztuczną inteligencję od lat na ziemię sprowadza prosty test wymyślony przez pewnego genialnego przedstawiciela gatunku Homo Sapiens. Jednak odpowiedź na pytanie „co to oznacza” jest bardziej skomplikowana niż może się wydawać.

Alan Turing - podstawowe informacje

Zacznijmy od wspomnianego geniusza. Jednym z najważniejszych naukowców, którzy popchnęli nas w dzisiejszą, cyfrową erę i od którego zaczęła się także historia poważnych rozmów o sztucznej inteligencji, był genialny angielski matematyk, Alan Turing. Ta nietuzinkowa postać budzi w Polsce czasem kontrowersje, będąc oskarżaną o zabieranie „nam” lauru zwyciezców nad niemiecką maszyną szyfrującą, słynną Enigmą.

To cię zainteresuje Chiński łazik spróbuje dziś wylądować na Marsie Ten wszczepialny chip jest tak mały, że można go zobaczyć tylko pod mikroskopem

Jest to oczywiście dla Turinga wybitnie niesprawiedliwe, o ile osiągnięcia Mariana Rejewskiego niewątpliwie przyczyniły się do przyśpieszenia prac ekipy z Bletchley Park, bez geniuszu Turinga i jego przełomowej elektro-mechanicznej maszyny, działającej dodajmy na innej zasadzie niż polskie „bomby”, czytanie niemieckich depesz po 1940 r. nie byłoby możliwe.

Turing nie zatrzymał się oczywiście na Enigmie. W toku dalszych prac stworzył fundamenty nowoczesnej informatyki i opracował założenia dla możliwości zaistnienia sztucznej inteligencji. Do tego wszystkiego analizował cały problem również z pozycji moralnych oraz filozoficznych, co doprowadziło do stworzenia dla maszyn słynnego testu, który ostatecznie otrzymał jego nazwisko.

Główne założenia testu Turinga

Efekty swoich przemyśleń Turing zawarł w pracy „Computing Machinery and Intelligence” napisanej w 1950 r. Opisał w niej prostą grę, którą nazwał „Imitation Game”, co najlepiej przetłumaczyć jako „grę w naśladowanie”. Mieli w niej brać udział sędzia oraz niewidoczni dla niego zawodnicy, kobieta (zawodnik A) i mężczyzna (zawodnik B).

Czytaj dalej poniżej

Ta toaleta ma 20 lat, lata 400 km na Ziemią i właśnie świętuje 40 000... Krzysztof Kurdyła

Fuzja jądrowa, czy nowy magnes zmieni reguły gry i pokona ITER? Krzysztof Kurdyła

Zadaniem sędziego jest ustalić płeć rozmówców, przy założeniu, że mężczyzna będzie chciał go wprowadzić w błąd, a kobieta ma pomóc w zdemaskowaniu kłamcy. Pytania i odpowiedzi musiałyby trafiać do rozjemcy w formie niewerbalnej, zapisane ręcznie lub na maszynie kartkach. Zadanie wymaga od mężczyzny kreatywnego wcielenia się rolę kobiety oraz ciągłe pilnowanie się, przed popełnieniem jakiegoś błędu.

Turing zastanawiał się, czy podmieniając mężczyznę na maszynę, ta również byłaby w stanie oszukać sędziego co do swojej tożsamości. Innymi słowy, czy pojawią się na tyle potężne maszyny, żeby były w stanie samodzielnie omijać pułapki, kłamać i stosować przemyślaną taktykę, mylić tropy. Całość rozpatrywał oczywiście czysto teoretycznie, ówcześnie istniejące maszyny nie miały żadnej możliwości w takiej grze wystartować.

Turing pokazał jak taki dialog mógłby wyglądać. Wskazał możliwe do zastosowania przez maszynę uniki, w przypadku otrzymania przez nią zbyt abstrakcyjnych zadań, np. jak uciec od konieczności napisania sonetu. Pokazał jak mylić tropy w przypadku zadań zbyt łatwych, np. możliwość symulowania dłuższego czasu rozwiązywania zadań matematycznych i okraszenia końcowego wyniku prostym błędem. W swoich rozważaniach genialny matematyk ocenił, że 50 lat od napisania jego artykułu komputery powinny być na tyle mocne, żeby przy 5 minutach takiego testu sędziowie mieli mniej niż 70% szans na prawidłową identyfikację charakteru rozmówcy.

Jak się okazało, w tym przypadku się pomylił, do dziś test pozostał (wbrew prasowym doniesieniom) niepokonany. Gorzej, że z powodu medialnej atrakcyjności zaczął żyć własnym życiem i wypaczył w pewnym sensie to, co Turing próbował przy jego pomocy zobrazować. W pewnym momencie testy Turinga stały się grą pomiędzy algorytmami ukierunkowanymi na jego wygranie, a sędziami skupiającymi mi się na wręcz „maszynowym” wpędzaniu ich w błędy pytaniami nieskładającymi się w normalną rozmowę.

Nie test był najciekawszy

W swojej pracy Turing zawarł jednocześnie szereg zastrzeżeń, które mogły dotyczyć głównego pytania tekstu: „Czy maszyny mogą myśleć?”. Przewidział, że między innymi, że ta koncepcja zostanie zaatakowania z pozycji teologicznych, w których myślenie zarezerwowano jako dar od chrześcijańskiego boga, przeznaczony dla ludzi. Z argumentami tego typu nie zgodził się w całej rozciągłości, obalając je przykładami innych antynaukowych tez Biblii, którym prawie żaden wierzący dziś się już nie przyznaje prymatu nad odkryciami naukowymi.

Przewidział też strach ludzkości przed buntem maszyn i utratą swojej dominującej pozycji. Odniósł się też do zastrzeżeń stricte naukowych, przewidujących, że mogą nie przeskoczyć pewnego poziomu mocy, co nawet w odległej przyszłości nie pozwoli im osiągnąć statusu sztucznej inteligencji. Zauważał również problemy z kwestią świadomości, umiejętności popełniania i wyciągania wniosków z błędów, a także problemami poznawczymi, który dotykały i dotykają w dużym stopniu maszyny do dziś.

Zaznaczył również obecność szeregu różnic w logice i sposobie działaniu komputerów, w stosunku do tego jak pracuje ludzki mózg. Dotknął wreszcie problemu możliwej niekompatybilności sztucznej inteligencji z prawdziwą sztuką, co zresztą znalazło swoje odbicie w przykładowym pytaniu o sonet. Zabawnym punktem było odwołanie się do zjawisk paranormalnych takich jak m. in. telepatia czy telekineza. Cóż, każdy kto oglądał „Teorię wielkiego podrywu” wie, że większość geniuszy to nieźli dziwacy. Tak czy inaczej, patrząc na datę publikacji ilość spostrzeżeń aktualnych po dziś dzień, imponuje.

Zawiłe losy testu Turinga

Po tragicznej śmierci Turinga w 1954 r. jego test zaczął żyć własnym życiem, szybko zresztą ewoluując. Próby jego „przejścia” miały jednak niewiele wspólnego z prawdziwą sztuczną inteligencją, a więcej z nazwijmy to cwaniactwem mającym wykorzystywać niedoskonałość... ludzkich sędziów. Twórcy programów próbowali tworzyć systemy mające go obejść, opierając swoje projekty o rozrastające się bazy danych wariantowych odpowiedzi i coraz większą ilość algorytmów rozpoznawania i wykorzystania słów kluczowych.

Jednym z pierwszych programów tego typu był stworzony jako... naukowa prowokacja chatbot Eliza, autorstwa Josepha Weizenbauma z MIT. Eliza wraz z skryptami DOCTOR była chatbotem parodiującym pracę psychoterapeutów, który miał pokazać, jak przy pomocy prostych skryptów można inteligencję lepiej lub gorzej symulować, czy wręcz udawać. Tymczasem cały projekt wymknął się twórcy spod kontroli i choć nie przeszedł testu Turinga, wielu ludzie zaczęło z nim rozmawiać, traktując go wręcz jako żywego rozmówcę. Co więcej, wbrew temu co chciał udowodnić twórca Elizy, dla części lekarzy i naukowców stał się dowodem na to, że algorytmy tego typu w przyszłości faktycznie będą mogły pomagać pacjentom.

Tego typu proste chatboty stały się szybko kluczem do popularyzacji testu Turinga. Ustanowiono coroczną nagrodę Loebnera dla najlepszych programów tego typu, z wielką nagrodą dla ostatecznego zwycięzcy. Testy tam stosowane bazowały na założeniach Turinga, choć z czasem przybrały coraz bardziej wypaczoną formę, a cały pojedynek stawał się coraz bardziej wspomnianą sztuką dla sztuki.

Programy w większości przypadków tworzone specjalnie pod sędziów, zaczęły wcielać się nawet w rolę schizofreników czy dzieci, aby tylko zamaskować w taki sposób niedoskonałości swoich odpowiedzi. Sędziowie ze swojej strony zaczęli przygotowywać coraz bardziej absurdalne zastawy pytań, żeby tylko zmusić maszynę do jakiegoś „mechanicznego” błędu. Z prawdziwą rozmową przestało to mieć wiele wspólnego.

Doszło wtedy do trwającego do dziś rozjazdu w ocenie tych narzędzi, test Turinga pozostał niezdobyty (choć twórcy bota udającego nastolatka twierdzą inaczej), natomiast kilka sensownych chatbotów, zaczęło się bardzo szybko rozwijać i zdobywać duże grupy wiernych i zadowolonych rozmówców. Co ciekawe, większość z tych algorytmów nie ukrywa swojego charakteru w rozmowie, co nie przeszkadza ludziom, aby autentycznie angażować się w takie konwersacje.

Czy SI przeszła już test Turinga?

Mam nadzieję, że po lekturze tego artykułu widzicie, że na to pytanie nie ma prostej odpowiedzi. Po pierwsze, oryginalny test Turing był pewnym teoretycznym konstruktem, a nie konkretną procedurą. Ta, która powstała (i zmieniała się wielokrotnie) później, ugrzęzła w czymś, co nazwano pułapką chińskiego pokoju. Algorytmy rozwiązują problemy według ścisłych instrukcji, ale nie da się powiedzieć, że którykolwiek z nich rozumie co robi. Dzięki z góry zaprogramowanym przepisom i rozbudowanym bazom są w stanie podać kilka wariantowych odpowiedzi, ale żadna nie jest świadomym działaniem urządzenia.

Po drugie, testy wzorowane na propozycji matematyka nie mają już dziś nic wspólnego z normalną konwersacją. Tymczasem, jak już wyżej wspomniałem w przypadku zwykłych internetowych rozmów wspomniane programy radzą sobie coraz lepiej, choć w ograniczonym zakresie tematów. Nadzieję na przejście poziom wyżej wiązano z włączeniem do procesu techniki uczenia maszynowego, ale próba Microsoftu z botem Tay zakończyła się spektakularną katastrofą. Algorytm puszczony samopas błyskawicznie stał się rasistą, skrajnym szowinistą itp. ponieważ takie treści pozwalały mu osiągnąć cel, dłużej prowadzić rozmowy. To świadczy, że na dziś ciągle groźniejszy jest dla nas Homo Sapiens, a nie sztuczna inteligencja, a dwa, że warto jeszcze raz poczytać zastrzeżenia z oryginalnego artykułu Turinga o poznawczych problemach maszyn.

Najlepiej na dziś prezentują się boty specjalizowane, działające w wąskim zakresie np. obsługi klienta. Rozmawiając z takim programem można mieć przez chwilę prawdziwe wątpliwości kto, lub co jest po drugiej stronie kabla. Asystenci inteligentni od Google, Amazona czy Apple, pomimo ogromnych nakładów środków i ogromnej ilości analizowanych danych ciągle są bardzo, bardzo prymitywni, nawet przy obsłudze w prostym, angielskim języku (czy AI poradzi sobie kiedykolwiek z językiem polskim jest dla mnie prawdziwą zagadką ;)). Jednocześnie najnowocześniejsze z klasycznych botów, znane ze wspomnianych konkursów o nagrodę Loebnera, jak Alice, Rose czy Kuki (Mitsuku) w luźnej rozmowie rozgryza się niemal od razu, ale jednocześnie dzięki psychologicznym trikom są sympatycznymi rozmówczyniami.

Jak więc to wszystko podsumować? Moim zdaniem, zgodnie z duchem tego, co chciał nam przekazać Turing, żadna maszyna do rozwiązaniu jego testu nawet się nie zbliżyła. Dopiero rozwój chatbotów korzystających z nauczania maszynowego być może przełamie za jakiś czas ten impas, ale jednocześnie przynajmniej kilka z zastrzeżeń wymienionych przez Turinga (te o wspomnieniach, obserwacji, zdobywaniu doświadczenia itp.) ciągle jest aktualne i każe nam się zastanowić, co właściwie dla oceny SI będzie to pokonanie testu oznaczać. Znów, w mojej prywatnej ocenie, przejście testu wykaże bardziej, że mimo iż jest tak trudny dla dzisiejszych maszyn, jest zbyt prymitywny aby ocenić tak złożone zjawisko jak sztuczna inteligencja.

Jak zrobić test Turinga?

Jeśli chcielibyście sprawdzić samemu, jak dziś zachowują się najlepsze chatboty, nazwijmy to ogólnego zastosowania, śpieszę donieść, że są dostępne w sieci, tak przez strony www, jak i jako aplikacje mobilne. Najlepiej zacząć chyba od Kuki, która jest wielokrotnym zdobywcą brązowego medalu dla najlepszego botchata w czasie konkursów o nagrody Loebnera. Jeśli skorzystacie z jej usług, to na przykładzie prymusa będziecie mieli szanse zobaczyć, jak daleko jesteśmy na drodze do stworzenia prawdziwej sztucznej inteligencji.

To doświadczenie powinno uspokoić większość osób, które obserwując spektakularne, ale jednocześnie bardzo ograniczone jeśli chodzi o zakres, wyniki działania AI w smartfonach i innych urządzeniach, czy rozmawiając z botami wyspecjalizowanymi w rozwiązywaniu konkretnych spraw, popadają w AI-fobię. A jednocześnie będzie to rozmowa bardziej kulturalna niż większość z prowadzonych w miejscach opanowanych przez Homo Sapiens...

Link do pracy Turinga:
Computing Machinery and Intelligence

Chatboty do przetestowania:
Kuki
Rose
ALICE
Eliza

Diagramy i rysunki: wikipedia

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu