Sonos speech enhancement - Кришталево чисті діалоги для кожного слухача

10 октября 2025

Якщо вам коли-небудь було важко розібрати, що щойно сказав персонаж по телевізору - ви не самотні. Діалоги у фільмах і шоу важко розчути з багатьох причин: помилки на дубляжі, погане зведення, глобальні акценти і навіть акустика приміщення. Все ще гірше для людей з втратою слуху. Збільшення гучності не завжди допомагає, а субтитри можуть відволікати, коли ви намагаєтеся насолодитися всіма візуальними елементами кінематографічного виробництва.

Саме тому ми представляємо нашу оновлену функцію покращення голосу (Speech Enhancement), яка має чотири рівні, що дозволяють вам налаштувати чіткість діалогів відповідно до ваших потреб, включаючи спеціально розроблений для людей із вадами слуху. Вона доступна в саундбарі Arc Ultra від 13 травня 2025 року.

Сучасний спосіб почути кожне слово

У Sonos нашою метою завжди було допомогти людям насолоджуватися чудовим звуком. Ми знали, що можемо зробити більше для людей з втратою слуху, тому ми розпочали першу у своєму роді співпрацю з RNID (Королівським національним інститутом глухих людей), щоб розробити рішення для покращення мовлення, яке дійсно вирішить унікальні проблеми, з якими стикається ця спільнота під час перегляду телевізора.

Метт Бенатан, головний науковий співробітник Sonos, каже: «Це не просто практично, це емоційно. Один з найважливіших аспектів перегляду телебачення та фільмів — це можливість зблизитися завдяки культурним та розважальним подіям, які транслюються в режимі реального часу. Якщо один глядач не може повністю чути діалоги, він може втратити здатність насолоджуватися моментом та брати участь у ньому».

Це була гірка правда, але вона глибоко мотивувала нашу команду. Хоча саундбари для телевізорів роками пропонували базове покращення мовлення, їм часто бракувало ефективності та якості звуку, необхідних для справжнього вирішення проблеми. Ми розпочали довгу подорож, щоб створити змістовне рішення, і штучний інтелект забезпечив прорив.

«Впровадивши машинне навчання в нашу технологію видобування мовлення, ми з'ясували, як відокремити діалоги від інших звуків у центральному каналі та уточнити мовлення в режимі реального часу», – сказав Гаррі Джонс, інженер звукозапису в Sonos. «Це дозволяє нам витягувати діалоги лише в найнеобхідніші моменти, не впливаючи надмірно на гучність і не погіршуючи цілісність кінематографічного враження».

Результатом є динамічний інструмент покращення мовлення з чотирма різними рівнями на вибір, найвищий з яких спеціально розроблений для людей з втратою слуху, через головний екран застосунку Sonos:

Low - Тонкий, художній акцент, який підкреслює діалоги, зберігаючи при цьому оригінальний досвід та задум автора.
Medium - Середнє покращення, яке забезпечує кращу чіткість діалогів та вишуканий баланс елементів навколишнього міксу.
High - Вищий параметр, який робить діалоги помітними, водночас зменшуючи інші елементи міксу.
Max - Найбільш виражений режим, де чіткість діалогів має повний пріоритет, розроблений для людей з вадами слуху. На відміну від більш збалансованого підходу низького, середнього та високого рівнів, максимальний рівень додатково контролює динамічний діапазон немовних елементів, ставить діалог на перше місце.

Розроблено з реальними людьми, для реального життя

Працюючи з RNID, ми співпрацювали з 37 учасниками різного віку та рівня слуху, щоб зібрати їхній детальний щоденний досвід прослуховування та протестувати цю функцію для різних типів контенту протягом майже року.

«Ми хотіли переконатися, що покращення мовлення працюватиме для всіх, навіть для тих, хто може навіть не усвідомлювати, що має втрату слуху», - сказала Лорен Ворд, провідний дослідник RNID. «Кожен третій дорослий у Великій Британії має втрату слуху, і, за повідомленнями, майже кожен четвертий дорослий у США також має таку ж проблему. Цей інструмент має потенціал вплинути на велику кількість людей».

Ми також співпрацювали з нагородженим звукорежисером Крісом Дженкінсом, щоб впровадити методи вилучення мовлення, що використовуються в студії, безпосередньо в домівки людей, зберігаючи при цьому інші елементи мікшування, такі як звукові ефекти та музика, художньо недоторканими.

«Нова функція покращення мовлення від Sonos - це величезний крок уперед у вирішенні проблем діалогів, які виникають через широкий спектр контенту, доступного людям сьогодні», - сказав Дженкінс. «Це також свідчить про важливість збереження людського впливу під час створення контенту за допомогою штучного інтелекту - ми провели незліченну кількість годин сеансів прослуховування, під час яких ми разом опрацьовували деталі, коригуючи кожен параметр, щоб переконатися, що він делікатно покращує діалоги, залишаючись вірним задуму творця».

«Створюючи Speech Enhancement, ми знали, що хочемо поставити перспективу людей з втратою слуху на перше місце з найперших етапів розвитку», – сказав Бенатан. «Те, що ми дізналися від дослідників та учасників RNID, чудово доповнило внесок Кріса Дженкінса, дозволивши нам врахувати ширший спектр точок зору слухачів. Це була неймовірна співпраця, і ми вдячні за їхній досвід та час, витрачений на спільну розробку цього досвіду».