Александр Пономарёв

Текст

Команда разработчиков SberDevices представила многоязычную версию нейросети GPT-3 под названием mGPT, которая знает языки народов России и стран СНГ

Как сообщает «Сбер», mGPT является первой в мире генеративной моделью, которая поддерживает такое количество языков. Модель mGPT доступна в двух версиях: базовой — с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище сервиса «СберДиск», а также расширенной — с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.

Модель mGPT может использоваться как для генерации текста, так и для решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путем дообучения или в составе ансамблей моделей. Она может также использоваться как компонент различных речевых технологий — для улучшения качества распознавания речи, генерации сценариев диалоговых систем и других задач.

«Сбер» утверждает, что mGPT показывает выдающиеся результаты на многих задачах few-shot и zero-shot learning: в этой области машинного обучения не требуется отдельно доучивать модель, достаточно сформулировать задачу текстом и привести несколько примеров, после чего mGPT научится выполнять новую задачу.

Это можно использовать для того, чтобы научить автоматизированную систему отвечать на вопросы, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и тому подобную информацию.

Google недавно выпустил новую языковую модель Palm:

Читать на ЦО.РФ

Google выпустил языковую модель с 540 миллиардами параметров Она называется Pathways Language Model

Подразделение Google AI Research представило новую языковую модель PaLM, которая способна понимать даже сложные понятия и взаимосвязи, которые ранее были недоступны компьютерам

Использованные источники: