Microsoft

Cortana. Czy asystentki głosowe śnią o elektrycznych owcach?

Jarosław Tomanik
Cortana. Czy asystentki głosowe śnią o elektrycznych owcach?
13

Przyznaję, nie mogłem się powstrzymać, żeby wpis o najbardziej "ludzkich" z osaczających nas zewsząd AI (sztuczna inteligencja) zatytułować parafrazą kultowego dzieła Phillipe’a K. Dicka. Być może dzisiejszej rzeczywistości daleko jeszcze do wizji snutych w latach 70-tych przez klasyka SF, ale rozwój technologiczny bezsprzecznie pcha nas w takim kierunku.

Zaczęło się dość niewinnie. Najmłodsza z asystentek, Siri początkowo wydawała się tylko ciekawostką do głosowego ustawiania budzika. W krótkim jednak czasie głosowe asystentki stały się oczkiem w głowie, niemal wszystkich tuzów branży IT. Google Now, Cortana, Alexa, S Voice, Siri - niezależnie od platformy każdy dzisiaj może mieć własną, osobistą sekretarkę. Alarm ustawi, spotkanie przełoży, smsa odczyta - wirtualne asystentki z każdą kolejną iteracją stają się inteligentniejsze, a ich możliwości rosną nieustannie. Krawata nadal jeszcze zawiązać nie potrafią ani kawy nie zrobią (choć tutaj jest już blisko), więc ładnej blondynki na etacie raczej nie zastąpią. Są jednak szybsze, darmowe, dostępne całodobowo, a dłuższe pogawędki, nawet te prowadzone w środku nocy, raczej domowemu stadłu nie zagrożą (choć tutaj też jest już blisko).

Ponieważ powołanie takiego wirtualnego bytu do życia wymaga tylko połączenia dostępnych od lat i dojrzałych technologii (rozpoznawanie mowy, jej synteza, rozumienie języka naturalnego itp.), wystarczyło zebrać to wszystko do kupy, odziać w sympatyczną, najczęściej kobiecą osobowość i zaoferować konsumentom gotowe rozwiązanie. Rozwiązanie zadziwiająco użyteczne i oferujące rzeczywistą wartość dla potrafiących z niej skorzystać klientów.

Jak to jednak ze wszystkimi, silnie zlokalizowanymi technologiami bywa, w kraju nad Wisłą użyteczność tych cudów technologii jest często znikoma lub wręcz żadna. Nawet jeśli dany asystent/asystentka działa w naszym języku (lub Wy potraficie dogadać się z nią/nim w którymś z obsługiwanych) to ich możliwości są tylko namiastką tego co potrafią zaoferować np. w USA.

Siri, Cortana, and Google Now Yell at Each Other and Go Insane from Gizmodo on Vimeo.

Cortana dla każdego

Jedną z bardziej inteligentnych i obdarzonych całkiem sympatyczną osobowością asystentek jest, dostępna domyślnie w systemie Windows 10 Cortana. W naszym kraju mocno upośledzona, rozumiejąca zaledwie kilka języków, asystentka Microsoftu jest w tej chwili chyba najpowszechniej dostępną na świecie. Każdy, kto dysponuje komputerem z nowym Windowsem, telefonem z W10M, Androidem lub nawet iOS może Cortanę aktywować lub zainstalować. Choćby z tego powodu warto przyjrzeć się możliwościom jakie oferuje.

Jak włączyć?

Żeby móc uciąć sobie pogawędkę z naszym komputerem musimy niestety znać język Shakespeare'a w stopniu podstawowym. Bez obaw jednak. Mało prawdopodobne jest, że z Cortaną będziemy omawiać sens życia lub dyskutować na tematy wymagające jakiegoś specjalistycznego słownictwa. W naszej służbie, Cortana zmagać się będzie najczęściej z wykonywaniem prostych komend. Przyzwyczajona do setek przeróżnych akcentów mieszkańców USA także z naszym, nawet jeśli trochę kalekim angielskim z pewnością sobie poradzi.

To nie wszystko. Uczłowieczenie naszego blaszaka wymaga przestawienia języka i regionu na USA (lub inny obsługiwany). Jeśli tylko ręcznie przestawicie datę, czas i format liczb na PL, jedyną z tym związaną niedogodnością zostanie konieczność obsługi systemu po angielsku i przestawienia klawiatury na PL po każdym restarcie (kombinacja klawiszy windows+spacja).

O tym, że nasz komputer musi dysponować głośnikami i mikrofonem nawet nie wspominam.

Hej, Cortana!

Jeśli uda nam się już tchnąć namiastkę życia w bezduszną maszynę, łatwo zagonić ją do roboty. Najprościej jest, co prawda, kliknąć w ikonkę kółeczka na dole ekranu, znacznie jednak zabawniej robi się po aktywacji funkcji "Hej Cortana". Zwolenników zaklejania kamerek w laptopach żółtymi karteczkami od razu ostrzegam. Nasza asystentka będzie stale, 24h na dobę nasłuchiwać co się wokół niej dzieje i czyhać tylko aż wypowiemy magiczny aktywator, jakim jest zwrot "hey, cortana". Osobiście wątpię, żeby NSA czy inne tajne służby szczególnie interesowało to, co się dzieje w moim otoczeniu, ale rozumiejąc obawy miłośników spiskowych teorii, lojalnie uprzedzam o takiej ewentualności.

Podobnie jak jest to z "ok, google", dopiero kiedy komputer automagicznie wybudzi się z uśpienia i bez żadnej, manualnej ingerencji odpowie na nasze pytanie, dopiero wtedy interakcja z zamieszkującą go sztuczną inteligencją staje się kompletna. Możliwość zapytania o pogodę lub czas potrzebny na dojazd do pracy w czasie naciągania na grzbiet palta w przedpokoju, jest prawdziwym ziszczeniem wizji snutych w klasycznych filmach SF poprzedniej dekady.

Pogaduchy

Teoretycznie z Cortaną możemy pogadać o wielu sprawach. Nasza, nawet jeśli lekko upośledzona, sekretarka potrafi odpowiadać na pytania, opowiedzieć kawał, czy nawet zaśpiewać piosenkę. Skupmy się jednak na bardziej konkretnych i użytecznych funkcjach.

Wyłączenie lub restart komputera. Dostępna dla Insiderów od raptem paru dni, funkcja ta była bezpośrednim przyczynkiem do napisania tego artykułu. Krzykniecie z sypialni "Hej, Cortana, turn off my computer" wydaje się fajną opcją dla podobnych do mnie leniwców. To nie wszystko. W ramach obsługi głosowej będziemy mogli komputer uśpić, zablokować oraz kontrolować muzykę (głośność, pauza, play, następny utwór itp.).

Wysłanie maila lub SMSa. Po komendzie "send email to Adam Nowak" Cortana uraczy nas oknem dialogowym, dzięki któremu, po uzupełnieniu brakujących informacji szybko wyślemy naszego maila. Użyteczność tego rozwiązania nie powala na kolana, a wspominam o niej tylko dlatego, że podobnie działa wysyłanie SMSów. Wysyłanie SMSów z komputera, odpowiadanie na nie za pomocą pełnowymiarowej klawiatury i bez wyciągania telefonu z kieszeni jest cholernie przydatne i szybko uzależnia. Taka integracja PC z telefonem nie tylko zwalnia nas z konieczności ruszenia tyłka do wiszącego przy ładowarce telefonu. Nawet jeśli telefonu zapomnimy w domu, dostęp do PC w pracy pozwoli nam na bezbolesne przetrwanie tych ośmiu godzin, bez obawy, że umknie nam coś ważnego. Cortana poinformuje nas o tym, że ktoś dzwonił i pozwoli na odpisanie na SMSa od razu z poziomu Centrum Powiadomień komputera.

Taka funkcjonalność dostępna jest od ręki dla użytkowników telefonów z Windowsem. Jeśli macie Androida musicie zainstalować i skonfigurować Cortanę z Google Play. Osobiście nie testowałem, ale podobno działa to identycznie jak na Windows Phone. Bonusem takiej integracji jest pojawienie się w Centrum Powiadomień naszego PC, wszystkich notyfikacji z telefonu.

Przypomnienia/remainders i alarmy. Znacznie użyteczniejsze na telefonie, przydaje się jednak także na większym sprzęcie. Wyróżnikiem przypomnień w wydaniu Microsoftu są przypomnienia kontekstowe. Co prawda w Polsce powiedzenie po angielsku frazy "przypomnij mi o jajkach jak będę w Biedronce" nie zadziała (takie rzeczy to tylko w Stanach), można jednak skonfigurować powiadomienia (także ze zdjęciem), które wyskoczą nam o danej godzinie, kiedy dotrzemy do danej lokalizacji (działają wcześniej skonfigurowane ulubione oraz konkretne adresy) oraz w czasie telefonu do/od konkretnej osoby (tylko na telefonie).

Analogicznie działa komenda "set alarm for" lub "wake me up at".

Wyszukiwanie plików. Ciekawa tutaj jest możliwość wyszukiwania za pomocą tzw. języka naturalnego. Cortana zrozumie polecenie "find photos from August", a także "find documents from Friday". Jak widać na przykładach, nasza AI jest w stanie pomóc nawet przy bardzo szczegółowych poszukiwaniach.

Identyfikacja piosenek. Wystarczy kliknąć w ikonkę nutek, żeby podobnie jak Soundhound czy Shazam, nasza asystentka zidentyfikowała muzykę jaką właśnie słyszymy. Działa to całkiem sprawnie, z listą starszych rozpoznań włącznie. W najnowszej wersji systemu (dla Insiderów), Cortana na pytanie "What's Playing" zidentyfikuje aktualnie grany utwór także w dowolnej, kompatybilnej aplikacji uruchomionej na naszym komputerze.

Przeszukiwanie sieci. Jeśli nasza, trochę nierozgarnięta sekretarka, czegoś nie zrozumie, automatycznie przerzuca nas do internetowej wyszukiwarki. Oczywiście domyślnie jest to Bing ale dość łatwo zmusić ją do współpracy z Chrome. Wystarczy zainstalować dodatek o nazwie

Chrometana

Nasze wyszukiwanie możemy zatem poprzedzić frazą “search web”, lub po prostu użyć szukanego słowa bądź ich sekwencji.

Obliczenia matematyczne i konwersja jednostek. Niewiele osób wie, że systemowy kalkulator w Windowsie dysponuje kolosalną liczbą wszelkiego rodzaju przeliczników jednostek miary, dat czy nawet kątów. Zamiast jednak go uruchamiać, często szybciej jest zapytać Cortany. Nasza asystentka przelicza praktycznie wszystko, a dodatkowo podaje aktualne kursy walut i akcji (z NYSE). Nie wiecie ile kosztuje karnet na stoku w Ramzowej? Wpiszcie "550CZK PL".

Sprawdzanie pogody. Proste, ale szalenie użyteczne. Jeśli ubierając buty w przedpokoju odpowiednio głośno zapytacie "what's the weather today" dowiecie się czy powinniście ubrać szalik lub wziąć parasol. Cortana także prawidłowo odpowie na pytanie "will it snow tomorrow?" lub "should I take an umbrella for Friday?". Jeśli wpisujecie zapytanie z klawiatury nie zapomnijcie wcisnąć enter na końcu - pogoda będzie szczegółowa i nie w Fahrenheitach. Warto dodać też na końcu nazwę miejscowości. Komputery PC mają często problemy z określeniem własnej lokalizacji.

Powyższa lista absolutnie nie wyczerpuje tematu. Cortana potrafi śledzić paczki i loty, uruchamiać programy, czytać nasz rozkład dnia, dodawać wpisy w terminarzu, a dzięki otwartemu API współpracować z naprawdę sporą liczbą zewnętrznych programów. Warto zapytać "what can I say" i zapoznać się z całą listą możliwych tematów. Po przewinięciu listy na koniec, łatwo sprawdzicie jakie z zainstalowanych programów integrują się z naszą asystentką oraz poznacie listę dostępnych dla nich komend głosowych.

Czy warto włączyć?

Czy rzeczywista użyteczność okaleczonej w naszym kraju sztucznej inteligencji warta jest przełączenia języka oraz oddawania kolejnej części naszej prywatności? Jeśli jakoś radzicie sobie z angielskim to pewnie tak. Cyfrowe asystentki powoli stają się częścią naszej rzeczywistości a wszystko wskazuje na to, że wkrótce staną się wszechobecne. Urządzenia mobilne, telewizory, komputery pokładowe samochodów (CarPlay, Android Auto), samodzielne urządzenia (Google Hello, Amazon Alexa, zapowiadany głośnik z Cortaną od Harman Kardon), a wkrótce pewnie pralki czy lodówki (IoT) - głosowa interakcja z naszymi urządzeniami w języku naturalnym staje się coraz powszechniejsza. Nie chcę czarno wróżyć, ale za jakiś czas nie uda nam się nawet kichnąć na ulicy, żeby nie usłyszeć "na zdrowie" od parkomatu albo latarni…

Nie liczcie jednak na cuda. Funkcjonalność Cortany w Polsce jest ograniczona, a nasze latami wpajane nawyki i sposoby interakcji z komputerami zdecydowanie nie pomagają. Jeśli sami nie będziemy pamiętać o istnieniu asystentki, Windows rzadko nam o tym przypomni. Edge co prawda potrafi czasem mignąć znaczkiem Cortany, informując o fajnych, kontekstowych możliwościach związanych z przeglądaną właśnie zawartością, skorzystają z tego jedynie nieliczni jego użytkownicy.

PS. Poprzez nieustannie zbierane dane telemetryczne, koncerny analizują w jakim kraju i w jaki sposób używa się ich produktów. Nie jest to potwierdzona informacja, ale słyszałem o sugestii pracownika Microsoft Polska, mówiącej o tym, że im więcej osób używa u nas Cortany, tym większa jest szansa, że firma zdecyduje się na oficjalne uruchomienie asystentki w Polsce.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu