ИИ от Apple научился преобразовывать 3D изображения из 2D за секунду

Компания Apple разработала модель ИИ для «оценки глубины с нулевого кадра». Благодаря этому, технология может генерировать 3D-изображения из одного 2D-кадра.

Человеческий мозг обрабатывает визуальную информацию из двух источников изображений — наших глаз. Каждый из них имеет немного разный взгляд на мир, а вместе они объединяются в единое стереоизображение. Различия в них также помогают нам оценить, насколько близко или далеко находятся объекты.

Многие камеры и смартфоны смотрят на жизнь через один объектив, но трехмерные карты глубины можно создавать с использованием информации, скрытой в данных 2D-фотографий (например, фокусных расстояний и информации о сенсоре). Система Depth Pro способна генерировать подробную 3D-карту глубины с разрешением 2,25 мегапикселей из одного изображения за 0,3 секунды с помощью стандартного графического процессора.

Архитектура модели ИИ включает в себя многомасштабный преобразователь зрения для одновременной обработки общего контекста изображения и более мелких деталей, например волос, меха и других тонкий структур. Она способна оценивать как относительную, так и абсолютную глубину, что означает, что модель может предоставлять реальные измерения, позволяющие приложениям дополненной реальности точно позиционировать виртуальные объекты в физическом пространстве.

Depth Pro может обеспечить гораздо более эффективное редактирование фотографий или даже привести к получению 3D-изображений в реальном времени с помощью однообъективной камеры. Проект все еще находится на стадии исследований, но код и сопроводительная документация доступны в открытом доступе на GitHub. Это позволит разработчикам, ученым и программистам вывести технологию на новый уровень.

Статья о проекте опубликована на сервере Arxiv, а для всех желающих самостоятельно протестировать текущую версию доступна демонстрационная версия. Об этом сообщает New Atlas.

изображение_2024-10-15_100649620.png Источник: Apple
Если ты увидел что-то интересное, выиграл грант или стал очевидцем события, расскажи нам об этом:
Portal072@gmail.com
8 (3452) 68-34-55 /
VK / Telegram

Оцените материал: