4

Posłuchaj jak komputer uczy się mówić

komputer-mowi
Pewien YouTuber nagrał swój głos, a następnie wykorzystał go jako materiał do nauki dla sieci neuronowych. Proces jest powolny, a to co słyszymy może być lekko niepokojące. Program po prostu generuje jakieś dźwięki i porównuje je z nagraniami ludzkiego głosu. Za każdym razem stara się bardziej upodobnić do materiału źródłowego, co pozwala nam słuchać jego stopniowych postępów.

Nagrania z 3 różnych sesji głosowych posłużyły za materiał do nauki. Film wstawiony na YouTube jest wynikiem 300 godzin treningu, które program przeznaczył na polepszanie swoich umiejętności w mówieniu. Autor zaznacza, że jak na tak złożone zadanie są to dość małe sieci. Oprogramowanie jakim się posłużył, to „torch-rnn” i jest ono zaprojektowane do nauki bazującej na tekście, a nie nagraniach audio. Nie stanowiło to jednak przeszkody, ponieważ napisał drugi program, służący do zamiany surowych bajtów np. z plików audio do plików tekstowych w UTF-8.

Najpierw materiałem do nauki był przeczytany fragment literatury, później ciąg liczb. Za trzecim razem autor w kółko powtarzał to samo zdanie, lecz nie zrealizował swojego pierwotnego zamysłu, ponieważ chciał powtórzyć je 1000 razy, ale poddał się po 300 razie. Wytłumaczył, że był coraz bardziej zmęczony, znużony, a jego głos i sposób, w jaki mówił ulegał coraz większym zmianom. Nie jest to dobre dla eksperymentu, ponieważ komputer niepotrzebnie skupiałby się na tych subtelnych różnicach w głosie i traciłby na nie czas. Zrobienie sobie przerwy też nie wchodziło w grę, bo wystarczy lekko zmienić położenie mikrofonu lub swoje, aby ponownie doszło do niepożądanych różnic w nagrywanym dźwięku.

Nieograniczony potencjał sieci neuronowych

Najlepsze w sieciach neuronowych jest to, że ich zastosowania mają niemal nieograniczony potencjał. Można je wykorzystywać do przewidywania trendów na Giełdzie Papierów Wartościowych, rozpoznawania ludzkiej twarzy i wyrażanych przez nią emocji, nauki prowadzenia samochodu i wielu innych zadań. W przyszłości osiągane rezultaty będą coraz bardziej imponujące, a wraz z nimi nadejdą coraz większe przełomy. Przykładowo, projekt Google Brain pokazał, że sieci neuronowe mogą prowadzić do niezwykle skutecznego szyfrowania danych, trudnego do złamania nawet przez inne sieci.

Trzy różne sieci neuronowe: Alicja, Bob i Ewa zostały przydzielone do pewnego zadania. Alicja i Bob prowadzili między sobą zaszyfrowaną rozmowę, natomiast Ewa miała ich szpiegować. Początkowo metoda szyfrowania była dość standardowa, lecz z czasem Alicja udoskonaliła ją w wyjątkowy dla siebie sposób (ludzie niczego jej nie narzucali), a Bob podążał za jej pomysłami i uczył się tych samych metod. Niestety Ewa zdana tylko na siebie miała ogromne trudności ze złamaniem ich szyfru i jej szanse na odczytanie tajnej korespondencji były cały czas znikome. Ta zabawa w przyszłości może przerodzić się w najbardziej złożone i skuteczne metody kryptograficzne na świecie.

Źródło