Audio

CMSS-3DHeadphone i CMSS-3DVirtual

przeczytasz w 3 min.

Technologie CMSS-3DHeadphone i CMSS-3DVirtual firmy Creative mają za zadanie odtwarzać doznanie naturalnie brzmiącego odsłuchu wielokanałowego w słuchawkach lub dwóch głośnikach zarówno w przypadku formatów źródłowych wielokanałowych, jak i dwukanałowych. Te nowe technologie wirtualizacji trójwymiarowej dźwięku stanowią przełożenie rozległej wiedzy specjalistycznej firmy Creative w dziedzinie wirtualizacji dwuusznej i wirtualnego dźwięku dookólnego, co jest odzwierciedleniem wielu lat badań i rozwoju w laboratoriach IRCAM, UC Davis, Aureal, Sensaura oraz w Centrum Technologii Zaawansowanej firmy Creative.

Zasady i wyzwania technologii wirtualizacji trójwymiarowej dźwięku

Ogromna większość stereofonicznych nagrań dwukanałowych przeznaczonych jest do odtwarzania przez dwa głośniki umiejscowione przed słuchaczem. Natomiast przez słuchawki wydaje się, że dźwięki te umieszczone są wewnątrz głowy użytkownika na łuku łączącym uszy. Dźwięki spanoramowane centralnie wydają się być umiejscowione blisko czubka czaszki słuchacza, zamiast bezpośrednio przed nim, w pewnej odległości od głowy. Dźwięki spanoramizowane mocno w jedną ze stron "łechcą" ucho zamiast emanować z kierunku przedniego prawego lub przedniego lewego. W przypadku muzyki i ścieżek dźwiękowych wielokanałowych (jak np. DVD czy DVD-Audio), pogorszenie jest jeszcze bardziej drastyczne jeżeli pary kanałów przednich i tylnych są po prostu "stopione" ze sobą w jedną parę stereofoniczną, pozbawiając słuchacza możliwości słuchacza możliwości rozróżnienia przednich i tylnych zdarzeń dźwiękowych. Skutkiem tych zniekształceń przestrzennych jest nienaturalne i męczące doznanie odsłuchowe z poczuciem "zamknięcia". Zmianie ulega również równowaga barwy dźwięku, wykazując brak tonów niskich i uwypuklenie tonów wysokich.

Bardziej zaawansowane rozwiązania przetwarzania sygnału, które mogłyby rozwiązać ów problem, wykorzystują technikę zwaną wirtualizacją dwuuszną. Proces ten stara się wytworzyć wrażenie, że nagranie jest faktycznie odsłuchiwane przez głośniki umiejscowione w spodziewanych pozycjach na płaszczyźnie poziomej przed i za lub z boku słuchacza, pomimo że odtwarzanie przebiega przez słuchawki.

Odbywa się to poprzez rekonstrukcję sygnałów dźwiękowych, które powinny być odbierane przez uszy słuchacza: każdy kanał źródłowy przepuszczany jest przez parę filtrów odpowiadających prawym i lewym przepustowościom związanymi z głową (HRTF), symulując "głośnik wirtualny". Owe filtry HRTF muszą być starannie skonstruowane i zwykle wyprowadza się je z pomiarów za pomocą mikrofonów wetkniętych w kanaliki uszne ludzi lub makiet głów.

Technika ta może przynieść zauważalną poprawę odsłuchu przez zwykłe słuchawki. Jednak wrażenie odsłuchu przez prawdziwe głośniki było trudne do uzyskania. Przednie źródła dźwięku (kanały lewy, prawy lub centralny) nie są przekonywająco "uzewnętrznione" i "sfrontalizowane". Za to wydaje się, że są one umiejscowione wewnątrz lub bardzo blisko głowy i podniesione (blisko czoła, niekiedy w stronę tyłu głowy). Boczne lub tylne źródła dźwięku wydają się być bliżej niż się spodziewamy, a źródła tylne może być trudno odróżnić od źródeł przednich. Niektóre algorytmy wirtualizacji mają również szkodliwy wpływ na ogólną barwę dźwięku nagrania.

Przy odtwarzaniu nagrań wielokanałowych przez parę głośników wyzwanie stanowi stworzenie wrażenia, że kanały dookólne są odtwarzane przez głośniki umiejscowione po bokach i z tyłu głowy słuchacza. Proces ten, określany często jako wirtualny dźwięk dookólny, zazwyczaj wykorzystuje dwuuszną scenę wirtualizacyjną podobną to tej, którą wykorzystuje się przy wzbogacaniu odtwarzania na słuchawkach (opisanym powyżej), a następnie proces redukcji przeników. Zadaniem redukcji przeników jest kompensowanie propagacji akustycznej pomiędzy głośnikiem a uchem (co wymaga redukowania sygnału "przenikającego", który każde z uszu będzie odbierało z przeciwnego głośnika). Projektowanie skutecznego reduktora przeników wymaga starannej konstrukcji, umożliwiającej uzyskanie przekonywającego wrażenia wirtualnego dźwięku dookólnego przy uniknięciu niepożądanego zabarwienia barwy dźwięku źródła. Ponadto - z natury - ta technika odtwarzania jest skuteczna tylko w przypadku jednego słuchacza, znajdującego się dokładnie w "sweet spocie" z głową skierowaną w określonym kierunku (zwykle w połowie odległości pomiędzy dwoma głośnikami).

Proces CMSS-3DHeadphone

Technologia CMSS-3DHeadphone firmy Creative pomaga słuchaczowi zapomnieć, że ma na głowie słuchawki, zapewniając frapujące doznanie odsłuchu wielokanałowego przy każdej dwu- lub wielokanałowej treści dźwiękowej. Wynika to z połączenia trzech niepowtarzalnych składników:

 • filtrów HRTF: Podstawę CMSS-3DHeadphone stanowi starannie dobrany zbiór danych HRTF wybranych z obszernej bazy danych pomiarów HRTF, przeprowadzonych w laboratoriach UC Davis, Aureal i Sensaura. w szeregu testów odsłuchowych, osoby badane wybierały zbiór danych zapewniający najlepszą jakość pod względem uzewnętrznienia, frontalizacji, rozróżniania na osi przód-tył oraz zachowania barwy dźwięku. zastosowano zaawansowane narzędzia obróbki końcowej, aby wyrównać i znormalizować surowe pomiary HRTF, a następnie przekształcić je w filtry HRTF bez naruszania dokładności modelu filtra.
 • wczesnych odbić środowiskowych: algorytm CMSS-3DHeadphone eliminuje odczucie "zamknięcia", kojarzone zwykle z odsłuchem na słuchawkach poprzez odtwarzanie naturalnych sygnałów przestrzennych przenoszonych poprzez odbicia środowiskowe wirtualnego pomieszczenia odsłuchowego, o starannie dostrojonych właściwościach akustycznych, zachowujących barwę materiału dźwiękowego. Proces ten ograniczony jest do symulacji "wczesnych" odbić w wirtualnym środowisku odsłuchowym, co zapewnia naturalne uczucie uzewnętrznienia i przestronności, nie zakłócając właściwości środowiskowych nagrania.
 • wydzielania otoczenia: w przypadku dwukanałowych źródeł dźwięku, CMSS-3Dheadphone stosuje algorytm wydzielania otoczenia częstotliwościowego (wykorzystywany również w CMSS-3DSurround), aby zanurzyć słuchacza w przestrzeni pierwotnego nagrania. To niepowtarzalne udoskonalenie przydaje naturalnego odczucia głębi na osi przód-tył oraz odczucia opływania na słuchawkach, nie dodając żadnego sztucznego efektu pogłosowego do materiału pierwotnego.

Zalety CMSS-3DHeadphone można podsumować w następujący sposób:

 • zachowanie barwy dźwięku,
 • poprawa uzewnętrznienia, frontalizacji i rozróżniania na osi przód-tył,
 • naturalne odczucie zanurzenia, zarówno w przypadku wielo- jak i dwukanałowych źródeł dźwięku,
 • zmniejszenie zmęczenia przy słuchaniu.

Proces CMSS-3DVirtual

Technologia CMSS-3DVirtual daje słuchaczowi znajdującemu się w "sweet spocie" przekonywające złudzenie odsłuchu wielokanałowego przy dwóch tylko głośnikach, przy dowolnej dwu- lub wielokanałowej treści dźwiękowej. Łączy ona następujące składniki:

 • filtry HRTF: w celu symulacji wirtualnych głośników bocznych i tylnych systemu 5.1, 6.1 lub 7.1, CMSS-3Dvirtual wykorzystuje te same starannie skonstruowane i precyzyjnie wymodelowane filtry HRTF, co CMSS-3DHeadphone, symulacja odbić środowiskowych pomieszczenia wirtualnego nie jest konieczna podczas odsłuchu z głośników, ponieważ odtwarzanie jest naturalnie uzewnętrzniane,
 • reduktor przeniku: reduktor przeniku obecny w CMSS-3DVirtual został specjalnie przekonstruowany, aby zapewniać najbardziej przekonywające wrażenie głośnika wirtualnego bez naruszania barwy brzmieniowej nagrania, 1 użytkownik może skalibrować dookólny proces wirtualny dla uzyskania optymalnego efektu nawet przy niestandardowym usytuowaniu głośników, wprowadzając odległość i pozycję kątową każdego z głośników do panelu sterowania ustawień THX,
 • wydzielanie otoczenia, w przypadku dwukanałowych źródeł dźwięku głośniki wirtualnego dźwięku dookólnego wykorzystywane są do odtwarzania naturalnego opływającego otoczenia na podstawie informacji przestrzennych obecnych już w nagraniu, jest to kolejne zastosowanie wyjątkowego algorytmu wydzielania otoczenia częstotliwościowego, stosowanego również w przypadku CMSS-3DSurround i CMSS-3DHeadphone.

Zalety CMSS-3DVirtual można podsumować w następujący sposób:

 • zachowanie barwy dźwięku,
 • przekonywające umiejscowienie bocznych i tylnych głośników wirtualnych,
 • naturalne odczucie zanurzenia, zarówno w przypadku wielo- jak i dwukanałowych źródeł dźwięku,
 • kalibracja zgodna z usytuowaniem głośników w stosunku do słuchacza.