Biznes

“Ford partii Kukiz to są cudze ciasteczka”. Zaraz, że co?!

Grzegorz Marczak
3

To jeden z przykładów automatycznej transkrypcji mowy na tekst. Wystarczy, że nagranie na ułamek sekundy będzie urwane, mówiący “potknie” się w trakcie lub transmisja zawiesi się i… sztuczna inteligencja robi babola. Czy z takimi błędami udostępniłbyś swoje wideo?

Autor: Paulina Nowakowska. Tekst powstał w ramach naszej inicjatywy Opowiedz Nam o Swoim Biznesie

“Najpierw niech zrobią porządek ze służbą zdrowia, a nie napisy!”

Cześć! Jesteśmy Autoscribe i robimy transkrypcje, czyli innymi słowy - napisy do wideo. Powstaliśmy we wrześniu 2020 r. jako startup działający w ramach Truso Media - spółki zajmującej się produkcją filmową.

Od początku współpracowaliśmy z samorządami, które musiały dostosować się do rządowej ustawy o dostępności cyfrowej stron internetowych i aplikacji mobilnych podmiotów publicznych z 2019 r.

W skrócie (dla kontekstu): z ustawy wynika m.in., że jednostki samorządu terytorialnego muszą udostępniać zapis transmisji obrad sesji rady w sposób dostępny dla osób z niepełnosprawnościami, a więc w tym przypadku - z dobrej jakości audio, wideo i z napisami.

Na własne potrzeby mieliśmy opracowany sposób szybkiego tworzenia napisów dialogowych i transkrypcji w oparciu o sztuczną inteligencję i ręczną korektę - tak, aby nie polegać wyłącznie na AI i generować napisy do filmów w 100% poprawne językowo.

Gdy tylko klienci zmuszeni zostali do zastosowania ustawowych rozwiązań, my już mieliśmy gotowy produkt.

Samorządy za brak udostępnionej na stronie internetowej sesji w postaci wideo z napisami w świetle ww. ustawy są narażone na karę finansową w wysokości do 10 000 zł.

Ponadto w małych gminach i urzędach w praktyce to na informatyków spadał obowiązek rozwiązania problemów z napisami. Ich reakcja? “Najpierw niech zrobią porządek ze służbą zdrowia, a nie napisy!”.

Chcieliśmy więc im pomóc.

Tu się nagrywa, a za oknem koszą trawę

Kiedy pozyskaliśmy pierwsze zlecenia, okazało się, że często nagrania miały kiepską jakość dźwięku - były za cicho, miały zakłócenia z zewnątrz itd.

Dla nas oznaczało to więcej godzin pracy i wyższe koszty.

Dla klientów - większe koszty, dłuższy czas realizacji i luki w napisach oznaczane jako [niezrozumiałe].

Musieliśmy coś z tym zrobić.

Napisaliśmy poradnik, jak poprawić jakość dźwięku podczas sesji. Udostępniliśmy go klientom.

Rozmawialiśmy z klientami i wspólnie analizowaliśmy ich przypadki podsuwając jak najwięcej bezkosztowych rozwiązań np. tak ustalać godziny trwania sesji, żeby w trakcie nie było koszenia trawy za oknem.

Podpowiadaliśmy, jakie mikrofony kupić, a nawet jak i kiedy powinien interweniować przewodniczący sesjom rady.

Podaliśmy przykłady samorządów, które z powodu złej jakości dźwięku transmisji sesji rady zostały ukarane finansowo (przypadek Ścinawy).

Po kilku miesiącach zauważyliśmy znaczący wzrost jakości dostarczanych nagrań do transkrypcji.

Urzędy zainwestowały w sprzęt, zwiększyła się świadomość radnych, którzy m.in. pamiętali o tym, że trzeba wypowiadać się do mikrofonów.

Zamiast odrzucać zlecenia złej jakości postawiliśmy na edukację klientów, co przyniosło efekty obu stronom.

Przyszedł więc dobry moment na zwiększenie skali.

Robię jutuby, nie mam czasu na napisy!

Po niespełna 2 latach działalności mamy na koncie ponad 5 000 godzin zrealizowanych transkrypcji do materiałów audio i wideo.

To ponad 4500 materiałów w języku polskim, angielskim, hiszpańskim, a nawet i… gwarą śląską.

Zatrudniamy blisko 50 korektorów - specjalistów i hobbystów z różnych dziedzin, tłumaczy i osoby, które kiedy słyszą “włanczać”... mają ochotę kogoś zabić ;)

Obsługujemy nie tylko samorządy i instytucje publiczne, ale również firmy, adwokatów, radców prawnych i od niedawna twórców na YouTube.

Dlaczego twórców na YouTube?

Czy dlatego, że są świadomi, że wideo z napisami to lepsze SEO? YouTube “czyta” napisy dodane do filmu w .srt i nawet kiedy w tytule i opisie nie występuje dana fraza, to jest w stanie wyświetlić użytkownikowi korzystającemu z wyszukiwarki film, który zawiera tę frazę w napisach (potwierdził to Mark Robertson z ReelSEO).

Czy dlatego, że wideo z napisami to więcej wyświetleń? Discovery Digital Networks - przeprowadzili badania, z których zauważyli, że wideo z napisami na ich kanałach generują 7% większą oglądalność niż wideo bez napisów.

Po części tak.

Ale powód jest o wiele bardziej prozaiczny - po prostu nie mają na to czasu.

Z naszych rozmów z twórcami wynika, że z jednej strony zostawiają wszystko w rękach automatycznie wygenerowanych napisów (które często robią błędy m.in. w nazwach własnych, słownictwie specjalistycznym), z drugiej - wolą ten czas poświęcić na pisanie kolejnych skryptów, nagrywanie odcinków czy montaż materiałów.

Właśnie dlatego twórcy wideo wybierają m.in. nas - firmę, która zrobi transkrypcję z pliku audio i wideo bez błędów i z korektą językową.

“Żywy” korektor poprawi nie tylko literówki i nazwy własne, ale zsynchronizuje czasówkę i przypilnuje m.in. 42 znaków w 1 linii.

W napisach nie będziesz więc już miał “Ford partii Kukiz to cudze ciasteczka”, bo korektor poprawi na “3rd party cookies to cudze ciasteczka”.

Autoscribe.online. Zrobimy transkrypcję za Ciebie - dla Ciebie.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu