Александр Пономарёв

Текст

Корпорация Apple совместно с учеными из Калифорнийского университета в Санта-Барбаре выпустила мультимодальную модель искусственного интеллекта MGIE

Чтобы отредактировать снимок, пользователю достаточно обычным языком описать, что он желает получить. Нейросеть MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для решения задач различной сложности, связанных с редактированием изображений — можно добавлять на изображение объекты, убирать или изменять их.

При получении команды модель интерпретирует слова пользователя в команды. Среди примеров работы MGIE статье приводятся несколько примеров её работы. Когда модели поручили отредактировать фотографию пиццы и предложили «сделать ее более здоровой», нейросеть добавила овощей.

Слишком темный снимок гепарда в пустыне по запросу «добавить контраста, имитируя больше света» нейросеть сделала ярче. MGIE уже доступна для бесплатного скачивания на GitHub, а опробовать ИИ в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы дальнейшие планы корпорации на MGIE.

Здесь мы рассказываем про основные методы обработки изображений:

Читать на ЦО.РФ

Как улучшить фотографии нейросетью? Основные методы ИИ-обработки изображений

Улучшение качества фотографий с помощью нейронных сетей подразумевает обучение сети для изучения моделей и характеристик высококачественных изображений, а затем использование этой сети для создания или улучшения новых изображений.

Использованные источники: Apple