Пользователям ВКонтакте станет доступна текстовая расшифровка видеосообщений

ВКонтакте представила расшифровку видеосообщений, анимированные реакции и другие новые функции в VK Мессенджере. «Технология расшифровки полностью автоматизирована и работает на основе методов машинного обучения, разработанных командой ВКонтакте. Для высокой точности расшифровки видеозаписи обрабатываются тремя нейросетями: они распознают звуки, отделяя их от видеоряда, формируют из звуков слова и определяют границы предложений», — сказано в сообщении. В процессе распознавания участвуют три нейросети: акустическая распознаёт звуки, языковая формирует из звуков слова, а пунктуационная определяет границы предложений и расставляет знаки препинания. Технология обучается на субтитрах фильмов и способна понимать неразборчивую речь и неформальную лексику, убирать паузы из записи, разбивать текст на предложения и смысловые блоки. Распознавание речи полностью автоматизировано и происходит без участия человека.

Расшифровывать можно как полученные, так и отправленные видеосообщения. Достаточно нажать на значок «Аа», после чего искусственный интеллект распознает речь собеседника и преобразует её в текст. Функция уже доступна в веб-версии web.vk.me и части пользователей приложений ВКонтакте и VK Мессенджер на Android, в том числе в учебном профиле Сферум. Скоро она появится на iOS. В новой версии разработчики также расширили возможности для тех, кому хочется рассказать больше: максимальную продолжительность видеосообщений увеличили до трёх минут.

[email protected]
наверх