跃起网

仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

据9to5Mac报道,苹果机器学习团队与南京大学、香港科技大学的研究人员合作发布了一款非常有意思的3DAI模型,名为Matrix3D。据悉,这款大型摄影测量模型能够仅凭几张二维照片重建三维物体和...

仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

据9to5Mac报道,苹果机器学习团队与南京大学、香港科技大学的研究人员合作发布了一款非常有意思的 3D AI 模型,名为Matrix3D。据悉,这款大型摄影测量模型能够仅凭几张二维照片重建三维物体和场景,这与当前的流程有很大不同。

仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

首先要说的是摄影测量技术。它利用照片进行测量,从而创建 3D 模型或地图。目前,该过程涉及使用不同的模型进行姿态估计和深度预测等步骤,这可能导致效率低下和错误。

但 Matrix3D 通过一次性完成所有操作简化了这一过程。它接收图像、相机参数(例如角度和焦距)和深度数据,并使用统一的架构进行处理。这不仅简化了工作流程,还提高了准确性。

仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

更有意思的是该模型的训练方式。研究人员使用了一种掩蔽学习策略,与早期基于 Transformer 的 AI 系统非常相似,这些系统为 ChatGPT 的初始版本铺平了道路。

他们在训练过程中随机隐藏了部分输入数据,这迫使 Matrix3D 不得不学习如何填补这些空白。这项技术至关重要,因为它使 Matrix3D 即使在较小或不完整的数据集上也能有效地进行训练。

结果非常惊人 —— 只需三张输入图像,Matrix3D 就能生成物体、甚至整个环境的详细 3D 重建,这显然可以为 Apple Vision Pro 等沉浸式头显带来非常有趣的应用。

仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

研究人员在GitHub上公开了 Matrix3D 的源代码,并在arXiv上发表了他们的论文。他们还创建了一个网站,用户可以在其中观看更多示例视频,甚至可以与一些物体和环境的点云重建进行交互。

本网通过AI自动登载内容,本文转载自MSN,【提供者:站长之家,作者:Cherlee】仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除。

阅读前请先查看【免责声明】本文来自网络或用户投稿,本站仅供信息存储,若本文侵犯了原著者的合法权益,可联系我们进行处理。 转载请注明出处:https://www.ssrce.cn/article/3708.html

分享:
扫描分享到社交APP
上一篇
下一篇

联系我们

关注我们