Александр Пономарёв

Текст

Компания Stability AI выпустила новую модель для генерации изображений по текстовому запросу Stable Diffusion 3 Medium

Stable Diffusion, которую многие считают лучшей среди всех существующих моделей генерации графических изображений по текстовому запросу, вышла в новой версии — 3 Medium. Модель с двумя миллиардами параметров не особо требовательна к ресурсам и работает даже на ноутбуках и настольных компьютерах с графическими процессорами обычного пользовательского уровня, отмечают в Stability AI.

Она обещает генерацию изображений с исключительной детализацией, цветопередачей и освещением, что позволяет создавать фотореалистичные картинки в разных стилях. Особо разработчики подчеркивают способность реалистично генерировать руки и лица. Кроме того, SD3 Medium понимает даже длинные и сложные подсказки.

Модель также умеет генерировать изображения с текстом — с минимальным количеством грамматических ошибок и недочетов в области шрифтов или интервалов. Stable Diffusion 3 Medium бесплатна для некоммерческого пользования. За коммерческое придется заплатить — модель обойдется в 20 долларов в месяц для индивидуальных пользователей и небольших компаний, а для крупных корпораций есть отдельная лицензия. Попробовать SD3 Medium можно здесь.

Здесь мы рассказываем, как нейросети генерируют изображения:

Читать на ЦО.РФ

Как улучшить фотографии нейросетью? Основные методы ИИ-обработки изображений

Улучшение качества фотографий с помощью нейронных сетей подразумевает обучение сети для изучения моделей и характеристик высококачественных изображений, а затем использование этой сети для создания или улучшения новых изображений.

Использованные источники: Stability AI