Александр Пономарёв

Текст

Американские ученые из Массачусетского технологического института сумели заметно ускорить создание изображений по текстовым описаниям

Новый метод позволяет при помощи искусственного интеллекта генерировать изображения высокой четкости в 30 раз быстрее существующих. Дело в том, что обычно в генеративных ИИ применяется технология диффузии — когда создается максимально размытая картинка, а затем постепенно детализируется до окончательного результата, соответствующего запросу пользователя.

Диффузия занимает довольно много времени, поэтому в MIT решили её ускорить. Исследователи свели генерацию изображений к единственному проходу — новый метод они назвали дистилляцией с согласованным распределением (Distribution Matching Distillation).

Он создает картинку в один проход по сравнению с 30-50 шагами для диффузионных моделей. Stable Diffusion 1.5, к примеру, создает изображение за 1,5 секунды, а новая модель на основе DMD справляется всего за 0,05 секунды. Компания Stability AI тоже пыталась ускорить диффузионные модели и выпустила Stable Diffusion Turbo, которая генерировала изображения с разрешением до мегапикселя за один шаг, однако созданные в несколько проходов изображения все равно получались заметно лучше.

Здесь мы рассказываем, как можно улучшить изображения нейросетью:

Читать на ЦО.РФ

Как улучшить фотографии нейросетью? Основные методы ИИ-обработки изображений

Улучшение качества фотографий с помощью нейронных сетей подразумевает обучение сети для изучения моделей и характеристик высококачественных изображений, а затем использование этой сети для создания или улучшения новых изображений.

Использованные источники: Freepik