Александр Пономарёв

Текст

«Сбер» усовершенствовал нейросеть Kandinsky, которая создает изображения по текстовому описанию на русском и английском языках

Как сообщает пресс-служба «Сбера», версия Kandinsky 3.1 дообучена на увеличенном датасете изображений, что позволило повысить качество генераций. Одной из ключевых особенностей модели стала более высокая скорость генерации картинок — время одной генерации сократилось почти на порядок, а разрешение генераций можно повысить до 4K.

Также появилась возможность улучшения текстового запроса с помощью языковой модели. Пользователям снова будут доступны функции создания различных вариаций изображений, смешивание картинок и текста, создание стикерпаков и возможность вносить локальные изменения на картинке, не меняя всей композицию сцены.

В ближайшее время также появится новая модель Kandinsky Video 1.1 для генерации видеороликов по текстовым описаниям. Качество генераций здесь удалось повысить за счет увеличения объема обучающего датасета пар «текст-видео» и архитектурных улучшений модели. Изменения также позволили повысить разрешение видео вдвое по сравнению с Kandinsky Video 1.0.

Здесь мы тестируем разные нейросети для генерации изображений:

Читать на ЦО.РФ

Большой тест-драйв ИИ-художников Иллюстрируем киберпанк-роман с помощью нейросетей

Нейросети давно помогают водить машины, распознавать лица и диагностировать рак. Отправят ли они на пенсию иллюстраторов? Художественный тест-драйв «Цифрового океана»

Использованные источники: «Сбер»