Microsoft

Skype Translator ma zrewolucjonizować rozmowy głosowe przez internet

Tomasz Popielarczyk
Skype Translator ma zrewolucjonizować rozmowy głosowe przez internet
Reklama

Microsoft wczoraj zaprezentował niesamowity projekt aplikacji, która ma w czasie rzeczywistym tłumaczyć komunikaty głosowe. Skype Translator, bo tak s...

Microsoft wczoraj zaprezentował niesamowity projekt aplikacji, która ma w czasie rzeczywistym tłumaczyć komunikaty głosowe. Skype Translator, bo tak się nazywa, ma być nie tylko ciekawostką. Satya Nadella spodziewa się, że w ciągu najbliższych lat tego typu mechanizm może pośredniczyć w rozmowach głosowych za pomocą komunikatora Microsoftu.

Reklama

Pierwsze wrażenie jest bardzo pozytywne. Skype Translator rozpoznaje komunikaty wypowiedziane przez użytkownika, tłumaczy je, a następnie za pomocą syntezatora mowy odczytuje osobie znajdującej się po drugiej stronie. Rozwiązanie to wczoraj zaprezentowano podczas konferencji Microsoftu poświęconej produktowi.

Póki co mamy do czynienia z bardzo wczesną wersją testową, która radzi sobie jedynie z językiem angielskim i niemieckim. Podczas testowej rozmowy, zarządzający działem usług Skype Gurdeep Pall komunikował się z mówiącą po niemiecku Dianą Heinrichs. Działanie programu nie było co prawda idealne, bo wypowiedzi były lekko kaleczone. Pojawiały się one (w formie głosowej oraz tekstowej) u rozmówców z dość dużym opóźnieniem, co stanowi kolejny problem.

Przed inżynierami Microsoftu jeszcze sporo pracy. Pod koniec roku wersja beta ma trafić w formie aplikacji na Windows 8.1. Prawdopodobnie będzie ona miała formę funkcji wbudowanej w komunikator Skype. Zapoczątkuje to długie testy tej technologii, która w ciągu najbliższych 2-3 lat miałaby zadebiutować w formie komercyjnej. Trudno się dziwić Microsoftowi, że chce podążać w tym kierunku. Skype Translator to rozwiązanie typowo biznesowe, więc prawdopodobnie nie pozostanie darmowe.


Sęk w tym, że przed tego typu technologią stoi masa wyzwań. Zacznijmy chociażby od samego rozpoznawania mowy, które musiałoby uwzględniać różne dialekty, lokalne gwary i akcenty. Potem potrzeba jeszcze sprawnego algorytmu, który będzie możliwie najbardziej naturalnie przekładał komunikaty. Aktualnie nie potrafią tego ani Google Translate, ani Bing Translator. Koniec końców sam syntezator powinien generować wypowiedzi w sposób płynny i uwzględniający ewentualne pauzy oraz akcentowane zwroty. Czy to w ogóle wykonalne?

Do zrewolucjonizowania rozmów głosowych przez internet długa droga. Działania podjęte przez Microsoft są zaledwie pierwszym krokiem. Ale amerykańska firma ma ambitne plany (oraz odpowiednio duże środki), kto wie zatem czy za te wspomniane 2-3 lata nie zobaczymy mechanizmu, który bez większych trudności przełoży hasło "w szczebrzeszynie chrząszcz brzmi w trzcinie" na język angielski.

Reklama

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Reklama