Александр Пономарёв

Текст

Kandinsky 2.2 способна создавать фотореалистичные изображения с высоким разрешением и изменять соотношение сторон при генерации картинок

Как сообщает пресс-служба Сбербанка, для дообучения нейросети использовался датасет из полутора миллиардов пар «текст — изображение», что на 300 миллионов больше, чем в версии 2.1. Наиболее заметного прироста качества удалось достигнуть при создании портретов. Новая версия научилась генерировать стикеры, из которых можно собирать стикерпаки для Telegram.

Kandinsky 2.2 теперь способен по текстовому описанию изменять отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet.

Версия 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting) и создавать картины в режиме бесконечного полотна (outpainting).

Здесь мы тестируем нейросети для генерации изображений:

Читать на ЦО.РФ

Большой тест-драйв ИИ-художников Иллюстрируем киберпанк-роман с помощью нейросетей

Нейросети давно помогают водить машины, распознавать лица и диагностировать рак. Отправят ли они на пенсию иллюстраторов? Художественный тест-драйв «Цифрового океана»

Использованные источники: «Сбер»