Обновлено: На Яндекс.Толоке можно скачать голосовые запросы к Яндексу

25 мая 2017 на платформе Толока появилось задание по транскрибированию коротких аудиофайлов, из содержания которых становится ясно, что это записи голосовых запросов пользователей Яндекса. Интерфейс позволяет не только прослушивать записи, но и загружать их на компьютеры исполнителей, что фактически, является «сливом» пользовательской информации.

Как сообщает издание RobotReview, в распоряжении которого оказался целый архив запросов к Яндексу, последний сформирован из навигационных и информационных запросов. Имена владельцев отсутствуют, однако встречаются повторяющиеся голоса, из чего можно предположить, что выборка составлена не по принципу 1 человек — 1 запрос, а по принципу 1 человек — несколько запросов.

Неизвестно количество пользователей, чьи голосовые запросы стали доступны на платформе. Учитывая тот факт, что получить доступ к заданиям на сервисе Толока может любой человек буквально в несколько кликов, возникает вопрос о правомерности предоставления возможности загрузки запросов на сторонние компьютеры.

Обновлено: Пресс-служба Яндекса на запрос редакции Searchengines.ru ответила следующее:

«Прежде всего - пользователям не о чем волноваться, их личные данные защищены. Распределение заданий в Толоке гарантирует полную анонимность запросов. В этом смысле нет особенной разницы, работает ли толокер с текстовым запросом или голосовым - у него все равно нет возможности идентифицировать пользователя, который этот запрос задал. Кажется, как будто голосовые запросы содержат больше информации, и как будто бы по ним можно как-то опознать пользователя, - но по факту из десятков миллионов запросов, случайным образом распределяемым по толокерам, нет никакого способа извлечь информацию о конкретном пользователе. То, что называют "сливом", не угрожает безопасности, потому что использовать эту информацию против пользователей все равно нет никакой технической возможности.

Мы, как и все поисковые сервисы, постоянно работаем над улучшением качества поиска, в том числе для нас важно, чтобы наши сервисы умели хорошо понимать человеческую речь. На современном этапе развития технологий все еще требуется участие человека для контроля и улучшения качества голосовых интерфейсов, поэтому и мы, и любая другая компания, развивающая такие интерфейсы, привлекает людей для развития технологий распознавания речи. И мы гарантируем анонимность пользовательских данных в процессе такой работы.

Тем не менее, мы благодарны за обнаружение этой ситуации и сейчас проводим дополнительный аудит всех наших процессов в Толоке на предмет общей безопасности персональных данных - в частности на предмет соблюдения толокерами пользовательского соглашения, в котором запрещено распространение данных, полученных ими в процессе работы в Толоке, и предусмотрена ответственность за такое распространение».

Напомним, платформа Яндекс.Толока была открыта в ноябре 2014 года, и используется Яндексом для совершенствования поисковых алгоритмов и технологий машинного обучения на основе пользовательских оценок. Задания предоставляются командами различных сервисов Яндекса и партнерами компании.

22 мая 2017 года Яндекс в своем приложении для Android начал тестирование голосового помощника «Алиса», возможно появление задания по расшифровке голосовых запросов связанно именно с доработкой этого алгоритма.

preview В Госдуму внесен законопроект о запрете использования VPN для обхода блокировки ресурсов

В Госдуму внесен законопроект о запрете использования VPN для обхода блокировки ресурсов

Законопроект о запрете использования в РФ технологий для просмотра заблокированных сайтов внесен на рассмотрение Госдумы
preview Google: порядок кодов языков в атрибуте hreflang не имеет значения

Google: порядок кодов языков в атрибуте hreflang не имеет значения

Коды языков в атрибуте hreflang можно размещать в любом порядке. Для Google их последовательность не имеет значения...
preview Яндекс исследовал интерес пользователей к футбольным матчам

Яндекс исследовал интерес пользователей к футбольным матчам

Каждый день люди задают Яндексу около трех миллионов запросов про спорт. Ищут трансляции и результаты состязаний, новости, статьи про интересных спортсменов и любимые команды
preview Google: дефисы в запросах могут менять результаты поиска

Google: дефисы в запросах могут менять результаты поиска

Если пользователь совершает поиск по слову или фразе с дефисом и без него, то Google может возвращать разные результаты поиска...
preview Google наказывает только за грубые манипуляции со ссылками

Google наказывает только за грубые манипуляции со ссылками

Google обрабатывает разные типы неестественных ссылок неодинаково. Об этом рассказал представитель поиска Гэри Илш в Twitter
preview Яндекс потерял 1,9 млн украинских пользователей, Mail.ru – 2,5 млн

Яндекс потерял 1,9 млн украинских пользователей, Mail.ru – 2,5 млн

После введения санкций против российских интернет-ресурсов на территории Украины, аудитория Yandex.ua снизилась на 1,9 млн пользователей