Apple разработала нейросеть для редактирования фотографий С помощью текстовых команд
Чтобы отредактировать снимок, пользователю достаточно обычным языком описать, что он желает получить. Нейросеть MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для решения задач различной сложности, связанных с редактированием изображений — можно добавлять на изображение объекты, убирать или изменять их.
При получении команды модель интерпретирует слова пользователя в команды. Среди примеров работы MGIE статье приводятся несколько примеров её работы. Когда модели поручили отредактировать фотографию пиццы и предложили «сделать ее более здоровой», нейросеть добавила овощей.
Слишком темный снимок гепарда в пустыне по запросу «добавить контраста, имитируя больше света» нейросеть сделала ярче. MGIE уже доступна для бесплатного скачивания на GitHub, а опробовать ИИ в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы дальнейшие планы корпорации на MGIE.
Здесь мы рассказываем про основные методы обработки изображений:
Использованные источники: Apple