18

Google proponuje, żebyśmy porzucili klawiatury i zaczęli dyktować maile w Chrome. Czy to się przyjmie?

Oczywiście maile to luźny przykład, bo nowe Web Speech API daje o wiele więcej możliwości i zastosowań. Jedno jest zaś pewne – nowe funkcje w Chrome mogą okazać się bardzo praktyczne i wzmocnić cały ekosystem usług Google’a. Dla nas będzie to natomiast kolejna okazja, żeby poczuć się jak w popularnych filmach z akcją rozgrywającą się […]

Oczywiście maile to luźny przykład, bo nowe Web Speech API daje o wiele więcej możliwości i zastosowań. Jedno jest zaś pewne – nowe funkcje w Chrome mogą okazać się bardzo praktyczne i wzmocnić cały ekosystem usług Google’a. Dla nas będzie to natomiast kolejna okazja, żeby poczuć się jak w popularnych filmach z akcją rozgrywającą się w przyszłości. W jaki sposób?

Web Speech API zawitało właśnie do wersji beta przeglądarki Google’a. Najprościej można je opisać, jako JavaScript API, które pozwala developerom na integrację systemu rozpoznawania mowy do swoich web-aplikacji i stron www. Teoretycznie sama funkcja nie jest niczym nowym, bo Chrome już od jakiegoś czasu umożliwia rozpoznawanie mowy. Jednak dopiero teraz wprowadzono do przeglądarki otwarte API, z którego będą mogli skorzystać wszyscy programiści.

Nie trzeba chyba dodawać, z jakimi korzyściami się to dla nas będzie wiązało. Najpopularniejszym przykładem, który się tutaj podaje, jest możliwość dyktowania wiadomości e-mail. Ale to nie wszystko. Web Speech API pozwoli nam też na tworzenie dokumentów (czy też artykułów – takich jak ten), ułatwi autoryzację w wybranych miejscach, a dzięki synchronizacji Chrome z urządzeniami z Androidem pozwoli na automatyczną transkrypcję wywiadów. Wyobraźcie sobie tylko używanie smartfona jako dyktafon, a nagrywane w ten sposób wypowiedzi od razu trafiają do Google Docs w formie tekstu. Nie wspomnę już tutaj o możliwości wydawania poleceń Chrome, czy też skonstruowania asystenta w przeglądarce na miarę Siri. Bajka, prawda?

2013-01-16_112610

W celu zaprezentowania możliwości nowej funkcji, Google przygotował specjalną stronę, gdzie możemy przetestować działanie API. Nagrany w ten sposób tekst można następnie skopiować i wkleić w inne miejsce lub przekształcić w nową wiadomość e-mail w naszym domyślnej aplikacji pocztowej. Funkcja ma działać nawet na bardzo wolnych połączeniach, co czyni ją niezwykle uniwersalną. Samo rozpoznawanie słów spisuje się dobrze, choć to też zależy w dużej mierze od naszego mikrofonu. Sprawdziłem Web Speech na swoim notebooku, nie wyłączając telewizora w pokoju, efekt był widocznie gorszy i niektóre słowa w ogóle nie docierały. Co więcej, konieczne było głośne i czyste wymawianie fraz. W przeciwnym wypadku aplikacja je pomijała.

Google, wprowadzając nową funkcję do swojej przeglądarki, idzie najwidoczniej śladami Apple’a. Otóż w OS X Mountain Lion wprowadzono podobne rozwiązanie, w ramach którego możliwe jest głosowe wprowadzanie tekstu w każdej aplikacji. W przypadku Chrome będzie to wymagało dodatkowego wysiłku od developerów, czy się opłaci? Na to pytanie już muszą odpowiedzieć sami użytkownicy. No właśnie, jak Wam się podoba taka perspektywa? Czy są tutaj posiadacze OS X, którzy namiętnie wydają swoim komputerom polecenia? Odnoszę bowiem wrażenie, że bardzo dużo się mówi o tego typu rozwiązaniach wykorzystujących mikrofon, a w gruncie rzeczy trafiają one do pewnej niszy użytkowników.