О способах перевода аудио и видео в текст

Автор: Николай Шмичков, агентство SEOQUICK

Знаете ли вы, что переписывая видео или аудио, можно значительно улучшить SEO-показатели? Для этого нужно транскрибировать материалы, которые вы регулярно публикуете на своем сайте или в блоге: различные семинары, обзоры и т.д. Если снабдить их соответствующими комментариями, можно получить некоторые преимущества перед конкурентами.

Аналитик Джон Мюллер подтвердил, что предоставление расшифровки улучшит индексирование аудиовизуального контента и сделает его более понятным.

Преимущества транскрибирования мультимедийного контента

Расшифровка записей увеличивает доступность восприятия контента. Это происходит от того, что у значительной части интернет-пользователей довольно плохая скорость воспроизведения аудио и видео, либо они лучше воспринимают информацию в виде текста. Кроме того, не нужно забывать о значимости текстовых факторов для поисковых систем. Несмотря на очевидную пользу транскрибирования, многие отказываются от него, ссылаясь на отсутствие средств и возможностей.

Прежде чем приступить к расшифровке записей, посмотрите полезную статью о том, как правильно подавать видео на ресурсе.

Как транскрибирование влияет на трафик?

Во-первых, трафик увеличивается. Многие радио- и телеканалы давно заметили, как интерес к их контенту возрос именно после создания текста ко всем материалам. Очень большая часть посетителей, нашедших сайт посредством поисковика, посещают именно страницы со стенограммами. Это способствует увеличению входящего трафика  и увеличению входных ссылок.

Во-вторых, страницы с затранскрибированным текстом приносят в среднем  на 16% больше просмотров, чем остальные. Транскрибирование не просто удобно для пользователя, оно является действенной тактикой в SEO-оптимизации.

Способы транскрибирования материала

Для этого можно воспользоваться тремя способами:

  • ручным;
  • автоматическим;
  • DIY

Автоматическая расшифровка

Автоматические средства по расшифровке записей включают в себя технологии по распознаванию речи или аудио в тексте, текстовое программное обеспечение и интерфейсы прикладных программ (API для транскрипции). С их помощью можно получить текст из звукового файла без усилий со стороны пользователя. Однако они не могут обеспечить абсолютную точность и будут требовать вмешательства и проверки. Чтобы понять, о чем речь, включите субтитры в видео из Youtube.

Оплошности при создании текстового материала возникают по ряду причин:

  • специфический акцент;
  • дефекты речи;
  • помехи при записи;
  • диалект;
  • сленг.

При наличии подобных факторов, тому, кто транскрибирует текст, нужно будет снова его проработать на предмет несоответствий и ошибок.

К счастью, технологии совершенствуются, и с каждым днем инструменты становятся все лучше. С их помощью можно добиться точности в 80% или даже 90%, что, несомненно, экономит время на корректировку.

Ручная расшифровка

С одной стороны, ручная расшифровка предполагает выполнение работы самостоятельно без использования каких-либо вспомогательных программ. Единственное используемое программное обеспечение при этом способе транскрибирования – текстовый редактор.

Точность такого способа максимально высокая. Тем не менее, современные инструменты, которые используют машинное обучение, искусственный интеллект и методы сегментации, теперь могут производить тексты с примерно такой же точностью, что и люди.

DIY расшифровка

DIY (Do-It-Yourself – «сделай сам») метод используется, в основном, для быстрого выполнения поставленной задачи. Работу делят между несколькими людьми. Например, часовой подкаст можно разделить между четырьмя людьми. Уже в течение дня будет готов текст. Но важный нюанс такого метода состоит в индивидуальности каждого исполнителя. Это связано с особенностями подхода к выполнению работы, которые невозможно игнорировать.

Выбор любого из представленных методов зависит от ваших возможностей, ресурсов и особенностей текста.

Теперь рассмотрим собственно сами способы транскрибирования аудио и видеоконтента.

1. Бесплатные сервисы и инструменты для транскрибирования онлайн

Одним из способов расшифровки аудио- или видеозаписей является использование бесплатных онлайн-инструментов. Их легко найти, просто вбив запрос «бесплатные онлайн-инструменты транскрипции» в Google. Вы увидите огромное количество вариантов, среди которых и oTranscribe, Trint, Speechlogger.

GoogleDocs также предлагает воспользоваться своей бесплатной онлайн-системой транскрибирования под названием GoogleVoiceTyping. Чтобы получить к ней доступ, нужно зайти в GoogleDocs> Инструменты> Голосовой ввод или нажать Ctrl + Shift + S.

Такой полезный инструмент может дать почти 100% результат, если говорящий будет произносить текст максимально четко и медленно, чтобы система успевала уловить все особенности речи. Но если нет возможности контролировать говорящего или динамику произношения, эти бесплатные ресурсы будут во многом ограничены. Отметим еще раз – запись одного голоса будет качественнее.

Не забудьте проверить и отредактировать получившийся текст!

Поисковая система Google установила строгие правила касаемо «автоматически сгенерированного текста». Неотредактированный текст может быть отнесен к спаму, что обязательно приведет к плохому месту в выдаче.

Еще одно замечание: инструменты онлайн-расшифровки требуют постоянного подключения к интернету. Поэтому если вы работаете в дороге без постоянного соединения, они вам не подойдут.

2. Бесплатное программное обеспечение

Принцип работы подобных инструментов в основном такой же, как и в первом способе. Основное различие заключается в том, что вы можете загрузить и установить их на свой компьютер, чтобы позволяет работать без подключения к сети. Примеры таких программ: Transcriber, ExpressScribe, MacSpeechScribe.

3. Автоматический ввод субтитров в Youtube

Субтитры на Youtube не всегда оправдывают ожидания, но такой способ имеет право на существование:

Ошибки, как в примере, возникают нечасто, но могут смутить и привести к неправильному пониманию. Если видеоролики будут с чистым и четким звуком, речь в них - медленной и без акцента, то можно получить вполне удовлетворительное качество.

Не исключайте того факта, что всегда контролировать звук и динамику не получится. Особенно это касается расшифровки переговоров, конференций или мероприятий, где много фоновых шумов и разговоры перекрывают друг друга. В остальных записях, если учитывать приведенные рекомендации и придерживаться правила строгой очередности, будет минимальное количество ошибок.

5. Мобильные приложения для расшифровки записей

В Android и AppleStore есть много приложений, которые помогут расшифровать записи при помощи телефона. Просто откройте свой магазин приложений и введите запрос «перевести голос в текст».

Приложения для мобильной транскрибации лучше всего подходят для журналистов и корреспондентов, которые всегда в движении и часто делают личные интервью или отчеты с места действия.

Кроме того, большинство современных смартфонов и компьютеров также оснащены собственной технологией распознавания речи. В самом обычном смартфоне можно открыть встроенное приложение блокнота и нажать значок микрофона или другую специальную кнопку, которая приведет в действие алгоритм для распознавания речи. После того, как вы начнете диктовать, система начнет переводить речь в текст и отображать ее в блокноте.

У Microsoft и Mac есть собственные программы для распознавания речи, известные как Windows Speech Recognition и Dictation.

Чтобы получить доступ к инструменту Microsoft, просто зайдите в панель поиска Windows и введите «Распознавание речи Windows». Когда он включен, вы можете открыть текстовый редактор и поместить курсор туда, где должен появиться продиктованный текст.

Недавно компания Microsoft объявила, что их система распознавания речи выдает только 5,1% ошибок. Такой процент есть и при ручной расшифровке.

Как видим, результаты не безупречные, но и не такие уж плохие.

Что касается надиктовки на Mac, то пользователи могут настроить его, перейдя к: Меню Apple> Системные настройки> Клавиатура> Диктовка.

Отсюда можно включить диктовку и заполнить всю необходимую информацию, такую как языковые настройки и сочетание клавиш.

Уникальность технологичного решения заключается в продуманном и удобном интерфейсе. Пользователь может настроить систему под особенности своей речи, чтобы восприятие звука было максимально четким и адекватным. Также к безусловным удобствам можно отнести расстановку знаков препинания. Для этого нужно просто произнести следующие слова, например:

  • апостроф '
  • открывающая скобка [
  • закрывающая скобка ]
  • открывающая фигурная скобка {
  • и т. д.

Отметим, что инструмент от Windows может функционировать без подключения к интернету. В Mac, напротив, нужно будет выбирать опцию Enhanced Dictation, потому что программа распознавания речи по умолчанию нуждается в запуске сети.

6. Google Cloud Speech API

Это сервис для распознавания речи более чем  с 110 языков, благодаря чему он стал одним из самых популярных. Считается, что инструмент значительно превосходит по качеству оцифровки звуковых записей другие софты и совершает наименьшее количество ошибок. Но как известно за качество нужно платить, поэтому после часа бесплатного транскрибирования аудио потребуется платная подписка.

7. Наемные работники или DIY

Как вы уже поняли, хорошие средства для транскрибирования обойдутся недешево. Цена на них варьируется от 50 до 150$. Специализированные компании без проблем могут позволить себе такие траты на профессиональное программное обеспечение. Но если нет цели оцифровывать аудио в огромных количествах, то ручной метод прекрасно подойдет. Расшифровка учебных материалов или интервью без специальных инструментов будет также недорогой.

Нанять исполнителя задания можно на многих ресурсах, где фрилансеры предлагают свои услуги. Цену укажите фиксированную за знаки или минуты или устройте что-то вроде тендера, и посмотрите, кто предложит лучшие условия сотрудничества. Только помните известную поговорку: «Цена соответствует качеству».

Не стоит забывать, что могут попасться и недобросовестные исполнители. Проверка профиля, истории заказов, резюме и отзывов спасет от ряда неприятностей.

Конфиденциальную информацию для расшифровки лучше отдавать для выполнения специализированным компаниям. Они смогут гарантировать клиентам безопасность и защиту данных. Стоимость определяется непосредственно исполнителем в зависимости от ряда факторов.

Заключение

Расшифровка аудио- и видеозаписей приносит увеличение трафика и повышает привлекательность страницы. Выбор способа транскрибирования зависит от ваших возможностей, платежеспособности и качества звука.

Качественное и профессиональное исполнение расшифровки стоит достаточно дорого, хотя можно прибегнуть к помощи наемного работника, который готов будет выполнить работу дешевле. Однако помните, что за хорошее качество лучше заплатить реальную цену.

preview Особенности трафика из Яндекс.Дзена и рекомендаций в Google Chrome

Особенности трафика из Яндекс.Дзена и рекомендаций в Google Chrome

Наверняка все знают о таком сервисе рекомендаций, как Яндекс.Дзен, а вот о том, что свои рекомендации есть и у Google в браузере Chrome, знают немногие
preview Что нужно для ранжирования в Google в 2018 году: краткий чек-лист

Что нужно для ранжирования в Google в 2018 году: краткий чек-лист

В очередном выпуске Whiteboard Friday основатель Moz Рэнд Фишкин рассказал, над чем SEO-специалистам стоит работать в 2018 году
preview SEO-итоги 2017 года: Яндекс методично закручивает гайки, повернувшись к сеошникам лицом

SEO-итоги 2017 года: Яндекс методично закручивает гайки, повернувшись к сеошникам лицом

Уже стало традицией, что в последнем выпуске рассылки уходящего года я подвожу итоги основных событий, повлиявших на отечественную SEO-индустрию
preview Как машинное обучение меняет SEO

Как машинное обучение меняет SEO

В последние пару лет мы постоянно слышим о машинном обучении. Но действительно ли мы знаем, что это такое, и как оно изменит результаты органического поиска
preview 4 ловушки анализа данных и как их избежать

4 ловушки анализа данных и как их избежать

Digital-маркетинг – это область, управляемая данными...
preview Как Google реагирует на изменения страницы с помощью Диспетчера тегов (GTM)

Как Google реагирует на изменения страницы с помощью Диспетчера тегов (GTM)

Небольшой эксперимент, демонстрирующий, как Google работает со страницами, содержимое которых зависит от JS