Meta* разрушает языковые барьеры, объединяя 1600 языков

Исследовательская группа Meta* FAIR (Basic Artificial Intelligence Research) совершила значительный рывок в области технологий распознавания речи, запустив систему под названием Omnilingual ASR. Эта система способна транскрибировать речь более чем на 1 600 языках, что существенно расширяет охват по сравнению с существующими технологиями.

По заявлению Meta*, по достижении уровня полного обучения этой модели впервые появляется практическое решение для множества языковых сообществ, которые ранее были полностью лишены возможностей автоматического распознавания речи. Это прокладывает путь к более инклюзивному интернету и технологиям.
​Следуя своей политике открытости, Meta* выпускает всё семейство моделей Omnilingual ASR под лицензией Apache 2.0 с открытым исходным кодом, что позволяет исследователям и разработчикам по всему миру свободно использовать, модифицировать и даже применять технологию в коммерческих целях. Сопутствующий набор данных также выпущен под открытой лицензией CC-BY.

Семейство моделей включает как облегчённые версии (с 300 миллионами параметров), предназначенные для эффективной работы на маломощных устройствах, так и модели с 7 миллиардами параметров, обеспечивающие «высочайшую точность» для более требовательных сценариев. Все модели построены на собственной платформе Meta* FAIR PyTorch — fairseq2. Этот шаг Meta* позволит значительно ускорить глобальное развитие речевых технологий.

*Компания Meta признана экстремистской и запрещена в РФ.

v_romashov@list.ru
наверх