Meta представила семейство языковых ИИ-моделей Massively Multilingual Speech (MMS). Исходный код проекта доступен на GitHub.
MMS могут идентифицировать более 4000 разговорных языков, что в 40 раз превышает возможности существующих аналогов. Также алгоритмы научили синтезировать речь и преобразовывать ее в текст на около 1100 диалектах.
Для обучения моделей разработчики использовали Новый Завет, на основе которого создали два датасета. Первый содержит аудио и текст на 1107 языках. Второй включает немаркированные записи речи на 3809 диалектах.
☝️ В компании предупредили, что иногда MMS способны неправильно расшифровать определенные слова и фразы. Также в Библии много предвзятости и искажений, добавили в Meta.