реклама
Теги → голосовое управление

Технология EarCommand позволит беззвучно отдавать команды гаджетам, проговаривая их про себя

Хотя управлять устройствами с помощью голосовых команд довольно удобно, громкие отчётливые фразы могут беспокоить окружающих. Система EarCommand, разработанная учёными из университета штата Нью-Йорк, позволяет «считывать» команды, проговариваемые пользователем про себя, причём для этого не потребуется считывать мозговую активность.

 Источник изображения: Caley Vanular/unsplash.com

Источник изображения: Caley Vanular/unsplash.com

В норме голосовые команды могут быть услышаны другими, их распознаванию гаджетами может помешать окружающий шум, кроме того, устройствам может быть сложно отличать один голос от другого, что приведёт к ошибкам в работе.

Технология EarCommand, разрабатываемая командой исследователей из Университета штата Нью-Йорк в Буффало, основана на том, что даже проговаривание каких-либо слов про себя сопровождается активностью мышц и некоторым смещением костей, в результате чего по-разному деформируется ушной канал. Другими словами, разные «шаблоны» деформаций характерны для определённых слов.

Аппаратная составляющая EarCommand включает похожее на наушник устройство, транслирующее близкие к ультразвуку сигналы в ушной канал. Отражающиеся от внутренней поверхности канала сигналы принимаются внутренним микрофоном наушника, а связанный с устройством компьютер анализирует эти эхо, используя специальный алгоритм для того, чтобы оценить деформацию канала и определить, какое слово произнесено.

В проводимых экспериментах пользователи проговаривали 32 команды длиной в одно слово и 25 команд, состоящих из целых предложений. На уровне слов доля ошибок составила 10,2 %, а на уровне предложений — 12,3 %. Ожидается, что по мере развития технологии уровень ошибок будет снижаться. Кроме того, аппаратура работает даже тогда, когда пользователь носит маску или находится в шумном окружении и, в отличие от некоторых систем, считывающих произносимые про себя слова, для использования технологии не требуется камера.

Примечательно, что похожая технология EarHealth тестируется коллегами из того же университета в медицинских целях — аналогичные сигналы и считывание эха от них используются для выявления проблем со слухом, например — диагностики повреждённых барабанных перепонок или отита, который является весьма распространённым заболеванием.

window-new
Soft
Hard
Тренды 🔥
Гендиректор Take-Two: Rockstar постарается выпустить GTA VI без багов, но это не главное 14 мин.
«Обязателен для всех фанатов»: для ремастера культового квеста Grim Fandango вышел мод с улучшениями графики 2 ч.
С конца мая ЦБ начнет проверять, как в банках идёт импортозамещение ПО 2 ч.
Инсайдер раскрыл следующую тайную игру, которую раздадут во время мегараспродажи Epic Games Store 2 ч.
Apple и OpenAI объявят о сотрудничестве на конференции WWDC в июне 4 ч.
Дождались: Ghost of Tsushima стала самой популярной одиночной игрой Sony в Steam, обогнав God of War и Marvel's Spider-Man 5 ч.
Газпромбанк переведет ИТ-инфраструктуру на решения виртуализации «Базис» 5 ч.
Apple, Microsoft, Meta и Google сосредоточились на создании небольших ИИ-моделей с мощными возможностями из-за высокой стоимости LLM 7 ч.
Veeam обзаведётся поддержкой Proxmox VE 18 ч.
Китайские компании выбирают локальный «ИИ в коробке», оставляя облачные сервисы не у дел 18 ч.