Генерацию изображений с помощью ИИ ускорили в 30 раз Благодаря новой технологии
Новый метод позволяет при помощи искусственного интеллекта генерировать изображения высокой четкости в 30 раз быстрее существующих. Дело в том, что обычно в генеративных ИИ применяется технология диффузии — когда создается максимально размытая картинка, а затем постепенно детализируется до окончательного результата, соответствующего запросу пользователя.
Диффузия занимает довольно много времени, поэтому в MIT решили её ускорить. Исследователи свели генерацию изображений к единственному проходу — новый метод они назвали дистилляцией с согласованным распределением (Distribution Matching Distillation).
Он создает картинку в один проход по сравнению с 30-50 шагами для диффузионных моделей. Stable Diffusion 1.5, к примеру, создает изображение за 1,5 секунды, а новая модель на основе DMD справляется всего за 0,05 секунды. Компания Stability AI тоже пыталась ускорить диффузионные модели и выпустила Stable Diffusion Turbo, которая генерировала изображения с разрешением до мегапикселя за один шаг, однако созданные в несколько проходов изображения все равно получались заметно лучше.
Здесь мы рассказываем, как можно улучшить изображения нейросетью:
Использованные источники: Freepik