Felietony

Czekam na serwis, który ułatwi konsumpcję treści na wielu urządzeniach, również jako Text To Speech

Jan Rybczyński
Czekam na serwis, który ułatwi konsumpcję treści na wielu urządzeniach, również jako Text To Speech
10

Urządzenia mobilne wraz z usługami pozwalającymi zapisywać treści do przeczytania na później na swój sposób zrewolucjonizowały konsumpcję treści, przynajmniej u mnie. Mając telefon w kieszeni wykorzystuję czas stojąc w kolejce czy jadąc tramwajem, czytając artykuły, które wybrałem sobie wcześniej. P...

Urządzenia mobilne wraz z usługami pozwalającymi zapisywać treści do przeczytania na później na swój sposób zrewolucjonizowały konsumpcję treści, przynajmniej u mnie. Mając telefon w kieszeni wykorzystuję czas stojąc w kolejce czy jadąc tramwajem, czytając artykuły, które wybrałem sobie wcześniej. Problem w tym, że urządzenia i sposoby konsumpcji zaczęły się specjalizować, pojawiły się czytniki z e-papierem, tablety, smartfony. Wszystko rozbite jest na wiele różnych usług, które nie synchronizują się ze sobą. Tak sobie myślę o ile wygodniej byłoby mieć to wszystko w jednym miejscu, a przeczytanie lub wysłuchanie czegoś na dowolnym urządzeniu byłoby automatycznie synchronizowane.

Tryb życia jaki prowadzę nie sprzyja spokojnej konsumpcji treści w zaciszu wygodnego fotela z kubkiem herbaty. Nawet teraz, gdy mam już w rękach od dawna oczekiwany czwarty tom Pana Lodowego Ogrodu, czas na jego czytanie znajduje dopiero po uśpieniu syna i ogarnięciu wszystkich obowiązków. Zwykle oznacza to godzinkę czasu, kiedy dawno powinienem już spać. Głodny większej ilości treści szukałem rozmaitych sposobów, żeby zagospodarować czas, który pozornie się do tego nie nadawał. Tym sposobem przekonałem się np. do aduiobooków i chociaż początkowo byłem im przeciwny, z czasem zacząłem ich słuchać nałogowo podczas usypiania latorośli, czy w korkach, jadąc samochodem. Ale zbaczam trochę z głównego tematu. Audiobookom trudno coś zarzucić, nie można tego natomiast powiedzieć o serwisach pozwalających zapisywać treść do przeczytania "na potem".

Pierwszy problem to rozdzielnie rozmaitych funkcji pomiędzy różne serwisy. Częściowo problem obrazuje porównanie tych serwisów jakie próbowałem zrobić jakiś czas temu. Pocket świetnie spisuje się w przypadku tabletów i smartfonów, świetnie radzi sobie z łączeniem wielostronicowych artykułów w całość, ale nie wysyła do Kindle. Instaper świetnie radzi sobie z Kindle, ale z łączeniem artykułów i zapisywaniem grafik w tekście już takiej rewelacji nie ma. Dodatkowo całkowicie nie nadaje się do zapisywania innych rzeczy niż sam tekst. Pewnym rozwiązaniem jest zainstalowanie aplikacji Kindle na wszystkich urządzeniach i wysyłanie wszystkiego tak jak na czytnik, problem w tym, że jeśli przesyłam pojedyncze artykuły, często na czytniku robi się trudny do ogarnięcia bałagan. Do krótkich, dynamicznie przeglądanych i kasowanych tekstów tablet i telefon sprawdzają się znacznie lepiej.

Wracając do nagrań dźwiękowych, z audiobookami jest tylko jeden problem - ich katalog jest mocno ograniczony, a o nagraniu przez lektora newsów, których data ważności ma najwyżej kilka dni, nie ma co marzyć. Ostatnio, zachęcony nową jakością jaką dały mi audiobooki, zacząłem eksperymentować z automatyczną konwersją z tekstu do nagrania głosowego za pomocą mechanizmu Text To Speech (TTS). Trzeba przyznać, że technika poszła na tyle do przodu, że jakość czytanego dźwięku jest naprawdę na wysokim poziomie, w zadzie po odczytywanych słowach nie da się łatwo rozpoznać, że tekstu nie czyta człowiek. Jedynym problemem pozostało interpretowanie treści i znaków interpunkcyjnych. W tekstach brakuje emocji, ale jeżeli słuchamy suchych informacji i newsów, a nie literatury pięknej, to nie przeszkadza i nie męczy aż tak bardzo. Teksty można słuchać zarówno w języku polskim, jak i angielskim.

TTS w dwóch formach

Jak do tej pory odkryłem dwa sposoby na odsłuchiwanie tekstów na telefonie. Pierwszy, pod warunkiem, że korzystamy z Androida, to instalacja odpowiedniego silnika i głosów, który czyta tekst bezpośrednio z telefonu. Można korzystać z domyślnego silnika TTS,

ale jest on raczej słaby i ciężko go słuchać dłużej niż minutę. Są znacznie lepsze, zarówno darmowe jak i płatne rozwiązania. Ich zestawienie z rankingiem jakości można znaleźć np. tutaj. Zaletą takiego rozwiązania jest możliwość odczytania tekstów nie przygotowanych wcześniej, lecz znalezionych w sieci na bieżąco. Same nagrania nie zajmują też miejsca na telefonie. Z drugiej strony potrzebne są dodatkowe aplikacje, które zostały stworzone z myślą o TTS. Jedną z nich jest iHear Network, który umożliwia odczyt z Facebooka, Twittera czy Pocket właśnie. Problem w tym, że przeglądanie artykułów w ten sposób jest kłopotliwe i nieintuicyjne. Nie da się wybrać co ma być odczytane z poziomu natywnej aplikacji Pocket. Poza tym konfiguracja środowiska TTS na telefonie wymaga trochę wysiłku i czasu.

Drugą opcją jest przekonwertowanie tekstu na nagranie jeszcze na komputerze i wgranie go do telefonu. Da się odtworzyć w każdym odtwarzaczu audio, najlepiej w takim który zapamiętuje miejsce gdzie skończyliśmy słuchać. Taką konwersję plików tekstowych do gotowych nagrań zapewnia chociażby świetny program TTS polskiej produkcji IVONA, ale tylko w wersji płatnej. Można też wypróbować funkcję w 30 dniowej wersji demo. Tym sposobem dosłuchałem kilkanaście dłuższych i zaległych artykułów, chociaż od dawna nie mogłem znaleźć czasu, żeby je przeczytać, bo miały niższy priorytet niż gorące newsy i wspomniana na początku książką Grzędowicza.

Jak to wszystko połączyć w całość?

Sposobów na konsumpcję treści jest jak widać wiele, problem w tym, że każdy funkcjonuje osobno, a synchronizacja zapisanych i przeczytanych treści leży po stronie użytkownika. Najpierw umieszczam artykuł w wielu serwisach jednocześnie np. Pocket i Instapaper, a dodatkowo konwertuję go na nagranie. Potem jak przeczytam go w Pocket, muszę pamiętać, żeby usunąć go z Instapaper, zanim wyślę zaległe artykuły do Kindle, nagranie też przestaje być potrzebne. Wreszcie jak odsłucham artykuł w formie audio, też muszę pamiętać aby go oznaczyć jako przeczytany w innych serwisach. Robi się z tego spory bałagan, a czas zaoszczędzony na odsłuchaniu newsów muszę później poświęcić na organizację wszystkich pozapisywanych treści.

Dlatego marzy mi się jeden serwis, który łączyłby te wszystkie funkcje w jedną całość. Byłby pomyślany zarówno do przeglądu artykułów bogatych w grafiki na tabletach i telefonach, jak i potrafiłby wysyłać artykuły na czytnik. Potrafiłby również na żądanie przygotować gotowy plik audio, który mógłbym pobrać w postaci pliku, wysłuchać w postaci streamingu lub skorzystać z wbudowanego w telefon silnika TTS. Najważniejsze jednak byłoby to, że niezależnie w jakiej formie przyswoiłbym treść, oznaczona byłaby jako przeczytana, bez względu na to, czy przeczytałem ją na czytniku, tablecie, czy odsłuchałem jadąc samochodem.

Za taką usługę oferującą wszystko w jednym pakiecie byłbym w stanie zapłacić miesięczną, stałą opłatę wielkości kilku dolarów. Warunkiem byłby brak konieczności korzystania z wielu serwisów do zapisywania i zarządzania treścią do przeczytania na później. Tym czasem ilekroć próbuję ograniczyć się tylko do jednego serwisu: Pocket lub Instapaper, z czasem nie wytrzymuję i muszę przeprosić się z tym drugim, bo jeden z nich zwyczajnie nie spełnia moich oczekiwań, nie wspominając nawet o nagraniach.

Na koniec ciekaw jestem ilu czytelników chciałoby słuchać wybranych artykułów z sieci w formie audio? Domyślam się, że jest to raczej niewielki procent, ale sam jestem zaskoczony, że po pokonaniu pierwszych wątpliwości i oporów zacząłem korzystać z tej formy przyswajania informacji, gdy sytuacja nie sprzyja czytaniu z ekranu monitora lub telefonu.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Więcej na tematy:

KindleivonaPocket