Павел Иевлев

Текст

«Сбер» представляет разработчикам передовые модели генерации текста: ruGPT-3.5 и mGPT 13B

Сбер предоставил доступ к двум своим передовым нейросетевым моделям генерации текста: ruGPT-3.5 и mGPT 13B. Модель ruGPT-3.5, построенная на основе революционного фреймворка OpenAI GPT-3, оптимизирована для русского языка. Разработкой занималась команда исследователей компании «Сбер». Эта модель, насчитывающая 13 млрд параметров, демонстрирует возможности по продолжению текстов не только на русском, но и на английском языке, а также на различных языках программирования.

Версия mGPT 13B содержит 13 млрд параметров и расширяет возможности продолжения текста на 61 языке. В их число входят языки, распространенные в странах СНГ и даже в небольших этнических группах России. Нейронная сеть ruGPT-3.5 13B нашла свое значительное применение в GigaChat, где она играет важную роль в составе ансамбля моделей, названного NeONKA (Neural Omnimodal Network with Knowledge-Awareness). Такая интеграция потребовала выбора базовой языковой модели, которая в дальнейшем должна была пройти обучение на учебных данных.

Обе модели размещены на популярном депозитарии HuggingFace. Разработчики со всего мира могут получить доступ к этим моделям и внедрить их в свои приложения, поскольку они распространяются под открытой лицензией MIT. Эта открытая и свободная лицензия, созданная Массачусетским технологическим институтом, поощряет разработчиков к свободному использованию, модификации и распространению программного обеспечения.

«Сбер» последовательно выступает за открытость технологической среды. Банк убежден, что инновации и исследования развиваются, когда их не ограничивают.

Как работают нейросети:

Читать на ЦО.РФ

Как работают нейросети Простое объяснение в картинках

Принцип работы нейронной сети пришел в программирование из биологии. Пионерами нейросетей были не столько программисты, сколько нейрофизиологи и психологи. «Цифровой океан» разобрался, как работают нейросети — и в каком-то смысле человеческий мозг.

Использованные источники: