19

3D na każdych słuchawkach? Za darmo i dla każdego!

Jeden z najfajniejszych dodatków do Windowsa 10, jakie dostaliśmy w ramach Creators Update, przeszedł jakoś bez większego echa. Tym czasem, w sklepie pojawiła się 30-sto dniowa wersja Dolby Atmos for Headphones, która do kompletu z darmową technologią Windows Sonic, daje całkiem niezły wybór. W końcu pełna, dostępna na zwykłych słuchawkach technologia wirtualizacji dźwięku przestrzennego dotarła pod strzechy. To, pod wieloma względami prawdziwie przełomowy moment.

Rozwój dźwięku przestrzennego w komputerach tylko pozornie związany jest z dźwiękiem 3D w systemach kina domowego. Popularne do dzisiaj systemy 2.1 (dwie satelity i głośnik nisko tonowy) faktycznie zagościły równolegle na komputerowych biurkach i pod telewizorami. Historia samego dźwięku przestrzennego nie była już jednak taka prosta.

Zaczęło się w latach 90-tych, kiedy karta dźwiękowa była samodzielnym, bynajmniej nie obowiązkowym, akcesorium komputerowym. Nie było kart zintegrowanych, a porządny Sound Blaster potrafił kosztować tyle co karta graficzna. W czasach tych walczyły o prymat dwie odmienne koncepcje dźwięku 3D. Promowany przez Creative Labs i THX system 5.1 oraz alternatywa opracowana przez firmę Sensaura (także jej pochodna od Aureal czyli A3D).

Wywodząca się bezpośrednio z naukowych laboratoriów, firma ta bazowała na genialnej w założeniach, a szalenie skomplikowanej w realizacji teorii, zgodnie z którą człowiek ma dwoje uszu i za pomocą ledwie pary receptorów jest w stanie bezbłędnie lokalizować dźwięki w przestrzeni. A jeśli tak, to do pełnego dźwięku 3D powinny wystarczyć dwa źródła dźwięku, np. w postaci słuchawek.

Skoro do triangulacji w 2D (na płaszczyźnie) potrzebne są pomiary z 3 różnych miejsc, jak to możliwe, że naszemu mózgów do pełnego 3D wystarczą tylko dwa?

Sekret tkwi w budowie naszego organu słuchu, oraz potężnej mocy obliczeniowej mózgu. Na to jakie informacje o dźwięku docierają do mózgu, wpływa ogromna liczba czynników, z gęstością głowy i ilością wapna w naszych kościach (przewodzenie kostne) włącznie. Kluczowa jednak jest tutaj budowa małżowiny usznej. Jeśli kiedykolwiek zastanawialiście się, dlaczego nasze ucho wygląda jak nieudany eksperyment kulinarny 5-latka to teraz już znacie odpowiedź. To dzięki pokręconej formie naszego ucha, dźwięk z konkretnego miejsca dociera do błony bębenkowej zniekształcony i zmodyfikowany w charakterystyczny, różny dla obu uszu, sposób.

wykres fal

A ponieważ mózg dysponuje informacjami z obu uszu, to analizując i porównując te zniekształcenia, jest w stanie ekstrapolować jego dokładną lokalizację. Oczywiście mózg potrafi także zniekształcenia te usunąć i zaserwować nam  czysty, ale uzupełniony o dane lokalizacyjne, dźwięk jaki ostatecznie „słyszymy”. Warto dodać, że z powodu falowej natury dźwięku, tony wysokie lokalizuje się najprecyzyjniej. Dlatego „gwizdki”, czyli głośniki wysoko tonowe znajdują się w miejscach kluczowych, podczas gdy subwoofery (głośniki basowe) umieszcza się gdziekolwiek bądź.

 Jak to się ma do Sensaury?

Naukowcy zbudowali cyfrowy model ucha. Jest to zespół algorytmów, który na wzór zniekształcania dźwięku przez małżowinę uszną dodaje do dźwięków zniekształcenia odpowiednie do ich lokalizacji. Wystarczy taki dźwięk dostarczyć do ucha z pominięciem małżowiny (np. przez słuchawki) i już samodzielnie nasz mózg dodaje do dźwięku odpowiednie, zasugerowane w ten sposób współrzędne trójwymiarowe.

Działa to naprawdę rewelacyjnie. W szczytowym momencie rozwiązania bazujące na licencjach Sensaury opanowały 70% rynku audio. Ich najważniejszą zaletą było to, że uzyskany dźwięk był rzeczywiście trójwymiarowy. Dochodził nie tylko z boku, czy z tyłu, ale także z dołu lub góry! A to wszystko na zwykłych, obecnych w każdym domu, słuchawkach stereo.

Świetny przykład potęgi technologii – zakład fryzjerski (ścieżka dźwiękowa została już przepuszczona przez odpowiednie algorytmy, odpowiedni efekt uzyskamy na każdym sprzęcie).

The Binaural Barber [ASMR]

Co  poszło nie tak i dlaczego musieliśmy czekać aż 15 lat?

Dźwięk 3D na PC to głównie gry komputerowe. Filmy ogląda się z zasady na większych ekranach.  Podczas gdy każdy dźwięk (może poza muzyką) w grze 3D ma swoją konkretną lokalizację o tyle w filmach wszystko jest w rękach montażystów. To fachowcy siedzący przy konsoletach ręcznie ustawiają, które z niezliczonych ścieżek dźwiękowych brzmią z pierwszego planu, a które z drugiego albo z tyłu. Co ciekawe, dźwięk 5.1 jest technicznie dźwiękiem 2D, czyli na płaszczyźnie – informacji o trzeciej osi – wysokości – tam po prostu nie ma.

Ale wracając do komputerów osobistych. W latach 90 karty na rynku audio PC, karty (nie tylko dźwiękowe :P) rozdawała firma Creative Technology Ltd. Nie chcę snuć tutaj teorii spiskowych, ale kiedy na rynku pojawiła się solidna karta dźwiękowa oferująca wirtualizację 3D na technologii Sensaury (mowa o Vortexach firmy Aureal) zaczęła się bezpardonowa walka, w której nie brano jeńców. Procesy związane z patentami, nieuczciwymi praktykami rynkowymi, nieczyste zagrania, w tamtych czasach mało która firma z branży przestrzegała zasad Fair Play.  Co z tego, że finalnie producent Vortexów w sądzie wygrał.  Koszty przeciągających się procesów wykończyły dużo mniejszą firmę. Ostatecznie Creative Labs wykupił resztki konkurenta, a jego rozwiązania skończyły na zakurzonej półce magazynu.

mikroprocesory

Powodów, dla których prosty, żeby nie powiedzieć prostacki system 5.1 wygrał tą rynkową batalię, było sporo. O w zasadzie monopolistycznej i finansowej przewadze Creative Labs, już pisałem. Nie mniej istotne było jednak wsparcie ze strony przemysłu filmowego. Z założenia udźwiękawiane dla kin filmy, od początku dostosowane były do wielu głośników (w kinach może być ich nawet kilkadziesiąt). Także w domowych pieleszach filmy lepiej ogląda się na telewizorze i dużych głośnikach, niż na słuchawkach. Jak łatwo się domyślić techonogia Sensaury na głośnikach radziła sobie znacznie gorzej niż na słuchawkach.

Swój gwóźdź do trumny dołożyli także producenci głośników. System 5.1 wydawał się konsumentom naturalną konsekwencją popularnego 2.1, a sprzedawcy detaliczni też nie mogli pogardzić dodatkowym obrotem jaki generowały kosztowne zestawy wielogłośnikowe. Sami zresztą wyobraźcie sobie doradcę klienta w sklepie nie dla idiotów, lub innym Saturnie, tłumaczącego cierpliwie rodzinie z dzieckiem, koncepcję cyfrowego modelu ucha i przekonującego, że najlepszy efekt jest na najzwyklejszych słuchawkach lub stareńkich głośnikach stereo 2.0…

Całą tą sytuację śledziłem wtedy z dużym rozgoryczeniem. Doskonałe, tanie i nie wymagające żadnych nakładów rozwiązanie przegrało z prymitywnym i drogim. Rynek zalały absurdalne systemy wielogłośnikowe (już widzę te 8 głośników w z systemu 7.1 przy laptopie) i monstrualne słuchawki 3D z 6 przetwornikami w środku, dające namiastkę tego, co dekadę wcześniej oferowała Sensaura. Technologia oparta na „cyfrowym uchu”w końcu pojawiła się w SoundBlasterach (EAX), za późno jednak, żeby miało to jakieś dla rynku znaczenie…

Rozejrzycie się dookoła, przejdźcie po domach rodziny czy znajomych. Widać wyraźnie, że koncepcja mnożenia głośników to ślepa uliczka. Mało kto ma warunki i tyle zaparcia, żeby obwiesić sobie całe pomieszczenie głośnikami. Jeszcze przy telewizorach można czasem spotkać dobrze ustawiony i skalibrowany system 5.1, w komputerach PC jest to już jednak rzadkość. Rewolucja mobilna, telefony, laptopy i tablety to kolejne pole, na którym żadne 5.1 nigdy się nie pojawi. W naszej dzisiejszej, cyfrowej rzeczywistości nadal króluje stareńkie i leciwe, zwykłe stereo. A mamy przecież 21 wiek. Smutne.

Pseudo 3D. Wszędzie tego pełno.

Pisząc o dźwięku przestrzennym, nie można nie wspomnieć o tysiącach rozwiązań dostępnych w niemal każdym sprzęcie audio, często przez marketingowców zwanych dźwiękiem przestrzennym. Problem w tym, że jest to tzw. dźwięk dookolny, który z dźwiękiem 3D ma bardzo niewiele wspólnego. Algorytmy używane w tych rozwiązaniach tylko modyfikują i zmieniają dźwięk, nie dodając jednak żadnej konkretnej informacji o jego lokalizacji w przestrzeni. Co dostajemy? W tanich rozwiązaniach niewiele. W droższych większą immersyjność, efekt zanurzania się w dźwięku – cała scena dźwiękowa nie staje się bogatsza, jednak bardziej otacza słuchacza zacierając różnicę między lewym, a prawym kanałem stereo. Zupełnie nie nadaje się to do muzyki (kto by chciał, żeby jakieś sztuczne algorytmy ingerowały w wizję artysty), ale przy filmach czy grach daje to całkiem fajny efekt.

Jak odróżnić taki pseudo trójwymiar od rozwiązań, o których rozmawiamy? Wystarczy przepuścić przez to muzykę stereo. Jeśli zwykły kawałek stereo, po naciśnięciu magicznego przycisku 3D lub 7.1 wyraźnie się zmieni, możemy mieć pewność, że włączyły się algorytmy nijak nie bazujące na rzeczywistej informacji o umiejscowieniu dźwięków (której tam nie ma), a tylko mieszające w stereo.

Dźwięk 3D w drogich słuchawkach gamingowych. Producent napisał sobie 7.1 – szkoda, że nie 30.1 :)

pilot do słuchawek

3D w Windowsie – za darmo i dla każdego?

Czas na podsumowanie implementacji dźwięku przestrzennego, jaka pojawiła się w Windowsie. Ostrzegam jednak lojalnie, że wkraczamy tutaj na bardzo grząski grunt, jakim jest subiektywne odbieranie dźwięków i moja (wątpliwa) wrażliwość muzyczna. Sporo przy testach posiedziałem, sprawdziłem dema, filmy i gry. Porównałem rozwiązania programowe z tymi kilkoma sprzętowymi, do jakich miałem dostęp i skonfrontowałem to z Internetami. Mimo to, nadal trudno mi o jednoznaczną ocenę. Pozwólcie zatem, że odpuszczę sobie szczegółowe dywagacje na rzecz tych paru punktów, których jestem pewien.

 

  • Wirtualizacja jaką dostajemy w Windowsie działa. Wszystko wskazuje na to, że mamy tutaj prawdziwe, oparte na technologii HRTF, „binaural” 3D, pozwalające na cieszenie się trójwymiarowym dźwiękiem na każdych słuchawkach.
  • Dużym problemem są źródła. Nie wszystkie gry działają. Niektóre mają zaszyte podobne rozwiązania (trzeba w nich ustawić słuchawki), niektóre nie pozwalają na ustawienie 5.1 lub 7.1 (jeśli nie mamy fizycznie podpiętego takiego zestawu), niektóre nie działają wcale. Z filmami też nie jest lekko – te z dźwiękiem 5.1 informacji o dźwięku z góry lub z dołu nie mają wcale, a 7.1 nie poprawia specjalnie sytuacji. Inna sprawa, że całość robiona jest ewidentnie pod aplikacje UWP. Tylko odtwarzacze ze Sklepu Windows dają gwarancję, że całość na pewno zadziała. To z pewnością się zmieni, na razie jednak pozostaje czekać, aż Dolby Atmos się upowszechni (ma się wkrótce pojawić w Xboxie), a programiści nauczą się go implementować.
  • Dostępne mamy dwa silniki odpowiedzialne za dźwięk przestrzenny. Jeden płatny i jeden darmowy. Być może pojawią się kolejne.
  • Nie warto płacić za Dolby. To moja prywatna opinia, ale Windows Sonic działa równie dobrze. Na tyle dobrze, że płacenie 15$ za licencję na Dolby Atmos for Headphones wydaje mi się mało sensowne. Z pewnością warto jednak skorzystać z miesięcznego triala – w komplecie dostajemy fajną aplikację testową z przygotowanymi demówkami, które pozwolą ocenić całą technologię.
  • Windows Sonic – włączamy bezwarunkowo. Włączenie dźwięku przestrzennego jest bardzo zalecane. Algorytmy nie zakłócą muzyki, nie zadziałają jeśli dźwięk trafia na telewizor, głośniki czy kino domowe. Ustawienie dotyczy konkretnego urządzenia i po aktywowaniu go dla słuchawek, odpali się tylko kiedy na nasz sprzęt rzeczywiście dotrze dźwięk 3D.

ustawienia dźwięku

Zachęcam do testów i uwag w komentarzach. Gra z pewnością jest warta świeczki.

źródła: własne oraz http://old-stuff.ru/products/20597811

  • AdiDotJagi

    Wow

    • Szymon L

      Rzeczywiście wow, dawno już nie widziałem screena w rozdzielczości 300×191…

  • MutedVideo

    Co w sytuacji gdy podpinam słuchawki pod kontroler od głośników? Dźwięk przestrzenny nadal będzie dobrze wykrywany?

    • Jakub Wiśniewski

      Jeżeli w systemie wykryje że dźwięk idzie na słuchawki (w większości przypadków u mnie poprawnie wykrywało) to tak

  • zakius

    idealna symulacja przy użyciu dwóch źródeł może i jest możliwa, jednak wymaga uwzględnienia różnic osobniczych

  • Carl Johnson

    Dlaczego zdjęcia w tym artykule są tak słabej jakości?

  • maciej

    jo! quality content! super tekst, potwierdzam, ze na wysokim poziomie merytorycznym. oby wiecej.

  • bin

    ani 5.1 ani 7.1 to nie jest dźwięk z panningiem binarualnym. Ba, nawet 44.4.2 tego w pełni nie zapewnia. To tylko pseudo-3D bazujące na zmianie poziomów głośności…

  • Adam

    Wiele kart dźwiękowych ma taka funkcje od dawna, ale mało kto o tym wie. Mam sennheiser w wersji 3D i w grach które to wspierają faktycznie świetnie się to sprawdza. Dokładnie słychać gdzie jest przeciwnik

  • Batman

    30 dni trial

  • Szymon L

    Myślałem że mi się okulary upaćkały bo ostatni screen taki jakiś niewyraźny, ale rozdzielczość 300×191 wszystko wyjaśnia. To w trosce o mobilnych?

  • fakt

    „ścieżka dźwiękowa została już przepuszczona przez odpowiednie algorytmy,”

    Raczej nagranie pochodzi ze sztucznej głowy.

    https://pl.wikipedia.org/wiki/Nagrywanie_binauralne

  • SRP 11

    30-sto dniowa

    ?

    • kofeina

      = -70

  • Kacper

    dobry tekst, dzieki

    btw, po tym jak creative wykonczylo aureala, nigdy nie kupilem juz niczego z metka creative labs. ostatnio mam przyzwoita integre, ale wczesniej siedzialem na kartach turtle beach i asus xonar. Mam cicha nadzieje, ze karma do creative wroci i pojda wreszcie z torbami ;)

  • amonlb

    Dobry tekst dzięki. Chętnie poczytam więcej na ten temat może jakiś tutorial jak skonfigurować i co dalej z tym rozwiązaniem począć.
    Zastanawiam się czy efekt jest różny zależnie od zastosowanych słuchawek wokół usznych, nausznych i dousznych?

    • Nie ma tu za bardzo konfiguracji. Więcej możliwości daje np komercyjny Razer Surround. Z drugiej strony, w przeciwieństwie do systemów wielogłosnikowych tutaj nie ma co konfigurować. W zasadzie trzeba tylko włączyć. Na zdrowy, chłopski rozum najlepiej powinny działać słuchawki dokanałowe, w których dźwięk omija zewnętrzną część ucha. Moje testy (oraz te z Internetów) nie potwierdzają tej tezy. Możliwe, że moje możliwości słuchowe są za słabe żeby wyłapać różnicę

  • zenek73

    Mam jeszcze Vertexa w piwnicy. Fajnie to grało. Nigdy już nie kupiłem nic Creative….
    Co do nagrań to wydaje mi się że słynny filmik z fryzjerem nagrywany był binauralnie czyli ze sztuczna głową i mikrofonami w miejscach uszu.
    Fajnie gdyby dopracowali technologie i algorytmy nieco uczyły się na danym użytkowniku bo każdy jest inny i z innymi uszami się urodził…
    http://hifiphilosophy.com/plyty-binaural/