В Google научили нейросеть выделять отдельные голоса в толпе

16 апреля 2018

Анна Бондарь

911

Теперь компания сможет улучшить качество видеосвязи в своих сервисах

В Google создали систему машинного обучения, которая способна выделять отдельные голоса, анализируя лица людей в то время, когда они говорят.

Исследователи компании обучили нейросеть распознавать отдельных говорящих людей, а затем создали виртуальных «собеседников» (в комплекте с фоновым шумом), чтобы научить искусственный интеллект выделять несколько голосов в отдельные звуковые дорожки. В итоге ИИ создаёт видео, в котором голоса отдельных людей усиливаются, а все другие звуки подавляются.

Полученные результаты впечатляют: даже когда люди пытаются конкурировать друг с другом, устраивая словесный поединок, ИИ способен сгенерировать чистую аудиодорожку для каждого из них, концентрируясь на их лицах. Причём это возможно даже в том случае, когда человек частично закрывает своё лицо микрофоном или руками.

https://youtu.be/NzZDnRni-8A

В настоящее время Google изучает возможности использования этой функциональности в своих продуктах. Например, в таких сервисах, как Hangouts и Duo, чтобы пользователи могли более комфортно общаться со своими собеседниками в людных местах.

Источник: Google Research Blog

Сайт Роскомнадзора работает с перебоями из-за возможной DDoS-атаки

В Google научили нейросеть выделять отдельные голоса в толпе

Сайт Роскомнадзора работает с перебоями из-за возможной DDoS-атаки

Роскомнадзор требует удаления приложения Telegram из App Store и Google Play

Роскомнадзор блокирует IP-адреса Amazon из-за Telegram

Роскомнадзор направил в Facebook запрос о локализации персональных данных россиян

Минкомсвязи РФ: «Блокировка Telegram не будет иметь негативных последствий для пользователей»

Дуров прокомментировал решение суда о блокировке Telegram в России