Генерацию изображений с помощью ИИ ускорили в 30 раз. Благодаря новой технологии

Текст Александр Пономарёв

Американские ученые из Массачусетского технологического института сумели заметно ускорить создание изображений по текстовым описаниям

Новый метод позволяет при помощи искусственного интеллекта генерировать изображения высокой четкости в 30 раз быстрее существующих. Дело в том, что обычно в генеративных ИИ применяется технология диффузии — когда создается максимально размытая картинка, а затем постепенно детализируется до окончательного результата, соответствующего запросу пользователя.

Диффузия занимает довольно много времени, поэтому в MIT решили её ускорить. Исследователи свели генерацию изображений к единственному проходу — новый метод они назвали дистилляцией с согласованным распределением (Distribution Matching Distillation).

Он создает картинку в один проход по сравнению с 30-50 шагами для диффузионных моделей. Stable Diffusion 1.5, к примеру, создает изображение за 1,5 секунды, а новая модель на основе DMD справляется всего за 0,05 секунды. Компания Stability AI тоже пыталась ускорить диффузионные модели и выпустила Stable Diffusion Turbo, которая генерировала изображения с разрешением до мегапикселя за один шаг, однако созданные в несколько проходов изображения все равно получались заметно лучше.