«Яндекс» раскрыл технологию распознавания голосовых команд в шумной среде

Все новости — Наука и технологии

2025-07-30T08:59:00Z

Эко-бизнесмен Коновалов заявил о способности ИИ снижать стресс у пожилых

2025-07-30T08:41:00Z

Огромный, тихий и экономичный четырехдверный холодильник всего за $335 — Xiaomi Mijia Refrigerator Pro Dual System French 513L поступил в продажу в Китае

2025-07-30T08:23:00Z

Жители Чувашии подружились с ИИ-компаньонами

2025-07-30T08:02:00Z

Подмосковных ученых пригласили на национальный конкурс «Лидеры ИИ»

2025-07-30T08:00:00Z

Как вайб-кодинг сделал шведский стартап самым быстрорастущим в сфере ПО

2025-07-30T07:56:49Z

В Москве начинают готовить магистров цифровой медицины

2025-07-30T07:47:00Z

MacRumors: новый складной iPhone будет стоить $1999, он выйдет в 2026 году

2025-07-30T07:34:25Z

Экономист Бадалов: в России не приживется тенденция на замену сотрудников ИИ

2025-07-30T07:27:40Z

Сделать красиво. Гайнетдинов рассказал, как ИИ помогает редактировать фото

2025-07-30T07:08:33Z

Готовятся несколько экранизаций книг братьев Стругацких

2025-07-30T07:00:47Z

Исследование: россияне стали чаще обращаться к ИИ для борьбы со стрессом

2025-07-30T06:39:09Z

Москвичи смогут пройти финансовый ДНК-тест

2025-07-30T06:37:00Z

На форуме «РОСТКИ», посвященному сотрудничеству России и Китая, обсудят курс на будущее

2025-07-30T06:06:30Z

Более 90% опрошенных пользователей "Литрес" хотят иметь магические способности

2025-07-30T05:54:47Z

Губернатор Андрей Травников обозначил задачи по проведению форума "Технопром"

«Яндекс» раскрыл технологию распознавания голосовых команд в шумной среде

2025-07-30T05:00:30Z — «Яндекс» представил нейросетевую технологию, позволяющую распознавать голосовые команды даже в условиях сильного фонового шума, сообщили в компании.


«Яндекс» представил нейросетевую технологию, позволяющую распознавать голосовые команды даже в условиях сильного фонового шума, сообщили в компании. Решение уже используется в умных колонках и ТВ-станциях компании с голосовым помощником Алисой.

«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях», — заявил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха.

Ключевым элементом технологии является специально разработанный attention-механизм, который одновременно анализирует два звуковых сигнала — один после прохождения через алгоритм эхоподавления, второй — через алгоритм шумоподавления. В каждый момент времени нейросеть выбирает из них тот, где речь распознана наиболее четко. Такой подход позволяет избежать искажений, характерных для традиционного шумоподавления, и обеспечивает устойчивую работу даже в шумной обстановке — например, при включенной музыке, работающем пылесосе или уличных звуках.

«Обычно в умных устройствах и ассистентах используют алгоритмы эхоподавления, которые помогают распознать голос на фоне музыки. Уменьшить другие фоновые звуки помогают алгоритмы шумоподавления, но они ухудшают и человеческую речь», — отметили в «Яндексе». Компания также анонсировала научную статья с описанием технологии. Ее авторы выразили надежду, что публикация, в частности, может ускорить прогресс в области голосовых интерфейсов.

Агент будет встроен в BI-сервис Yandex DataLens в виде чата и сможет перестраивать графики или менять формулы по пользовательским запросам. В компании ожидают, что инструмент снизит нагрузку на аналитиков и ускорит проверку гипотез и подготовку отчетов примерно на 30%. Первая версия продукта выйдет в сентябре, уже открыт лист ожидания.

Читайте также:

2025-06-26T08:25:00Z

Новая технология скрывает голос от автоматического трекинга и взлома

Инновационная защита голосов от биометрического профилирования представлена в России

2025-07-22T11:28:43Z

В России стала доступна модель распознавания речи на русском языке

2025-07-27T05:35:00Z

Технология скроет ваш голос от цифрового шпионажа

Ученые из AIRI, МТУСИ, Сбера и VeinCV разработали инновационную технологию, которая скрывает биометрические особенности голоса, защищая его от автоматического анализа и подделки, сохраняя при этом его понимание человеком.

2025-07-11T08:00:58Z

"Яндекс" запустил сервис для быстрого синтеза уникального голоса

Подразделение "Яндекса" Yandex B2B Tech запустило первый в России сервис для быстрого синтеза речи Brand Voice Lite.

2025-07-02T12:49:28Z

Разработчик усомнился, что нейросеть сможет выявлять драки на концертах

Искусственный интеллект придется серьезно обучить, чтобы он мог правильно реагировать на ситуации на массовых мероприятиях, заявил НСН Владимир Белый.