Microsoft

Komu najlepiej wychodzi rozpoznawanie mowy? Wychodzi na to, że Microsoftowi

JS
Jakub Szczęsny
22

Ostatnie badania w tym kierunku wykazują, że to Microsoft może pochwalić się najlepszymi wynikami, jeżeli chodzi o rozpoznawanie mowy. Technologia giganta wykazuje najmniejszy współczynnik błędów w tego typu usługach - ale warto dodać, że to kompletnie nic nie znaczy, kiedy Microsoft ze swojego potencjału niekoniecznie chce korzystać. Zresztą średnio może, bo na głowie sporo innych zmartwień, które mogą hamować nieco rozwój tego typu rozwiązań.

Mijający powoli rok upłynął nam pod znakiem kolejnych postępów firm technologicznych w kierunku rozpoznawania mowy, uczenia maszynowego oraz sztucznej inteligencji. Do niedawna jeszcze wydawało się, że Microsoft w tej dziedzinie wiedzie prym, ale doskoczył do niego niespodziewanie Google, a i Apple na tym polu naprawdę nie ma się czego wstydzić. Nie zapominajmy o Aleksie. To, co różni wszystkie te usługi to sposób dostępu do danych, metoda ich przetwarzania i własna wizja interfejsu przystosowanego do rozpoznawania mowy - tej naturalnej. Mnie ten temat naprawdę odpowiada - wierzę w to, że nie tylko w ciągu najbliższych lat będziemy mogli cieszyć się w pełni z nastawionych na mowę interfejsów, ale i wreszcie, usługi Apple i Microsoftu trafią do Polski, która jest w tej dziedzinie cały czas pomijana.

Badanie wykazało, że technologia rozpoznawania mowy właśnie tej firmy wykazuje średni błąd w rozpoznawaniu wyrazów na poziomie 6,3 procent. To bardzo niewiele. Jak dotąd, ten wynik jest najniższy (czyli najlepszy) w branży i to Microsoftowi jak na razie przypada laurka pod tym względem. Microsoft od dawna rozwija swoje technologie rozpoznawania mowy - nie tylko, jeżeli chodzi o typowe zastosowania konsumenckie, ale także w kontekście osób niepełnosprawnych, które mogą mieć problem ze standardowym korzystaniem z komputera. Dodajmy do tego zainteresowanie sieciami neuronowymi, a także cały czas rozwijaną technologię uczenia maszynowego - Microsoft posiadał i w dalszym ciągu posiada ogromne zaplecze, które teraz owocuje naprawdę obiecującymi wynikami.

Wciąż czegoś brakuje. Kto ustanowi nowe zasady gry?

Microsoft był swego czasu bardzo blisko, by objąć prymat w dziedzinie rozpoznawania mowy. Mnie brakowało do tej pory czegoś, co mogłoby zmienić "zasady gry". O ile asystenci głosowi to bardzo przydatna funkcja w smartfonach, tak nikt poza power-userami niekoniecznie widzi w tej metodzie interakcji z urządzeniem ogromnego potencjału. A tymczasem - jest to świetna odpowiedź na cały czas zmieniające się realia w technologiach. Apple nie wydaje się być świetnym katalizatorem takich zmian, mimo parcia ku rozwiązaniom bezprzewodowym. Dodatkowo - ostatnio zwolniła ekspansja tego typu technologii na nowe rynki, każdy skupia się na rozwoju "inteligencji" tych platform, niekoniecznie zawracając sobie głowę tym, by przystosować asystentów do innych języków. Dobrze wiemy o tym, że Cortana była o krok od tego, by pogadać z nami po polsku, ale... sprawa rozmyła się wraz z tym, jak marka Lumia zaczęła mieć bardzo poważne kłopoty.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu