Павел Иевлев

Текст

Специалисты Google Brain Team создали самообучающийся алгоритм, повышающий разрешение фотографий до 16 раз без падения детализации

Наконец-то смешные сцены из кино про шпионов, полицейских и хакеров, где лицо подозреваемого «вытягивают» из фрагмента картинки размером в четыре пикселя в отражении на булавочной головке, становятся реальностью. CDM — алгоритм условно-классовой диффузии от Google, который создает изображение с высоким разрешением из чистого шума, опираясь на исходную картинку с низким разрешением. Он обучен на 14 миллионах изображений, так что просто «догадывается», что должно быть на картинке. Звучит как волшебство, но это работает.

CDM - каскадный алгоритм, который сначала генерирует изображение с низким разрешением, по которому из чистого шума создается картинка высоким разрешением, которое в несколько проходов повышается до максимально возможного. Иконка в 32×32 пикселя может быть увеличена до 256×256 пикселей, то есть в 8 раз. А изображение 64×64 пикселя масштабируется до 1024×1024 пикселя (в 16 раз). На видео в блоге Google AI это выглядит фантастически.

Лучше всего технология работает на человеческих лицах, что дает отличную тему для обсуждения криптопараноикам. Если вы боитесь, что ваше лицо украдут и наделают фейков, ставьте на юзерпик в социалках котика. Котиков все любят.

Использованные источники: Фото ai.googleblog