前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于NeRF的三维实景重建技术探索

基于NeRF的三维实景重建技术探索

作者头像
一点人工一点智能
发布于 2024-04-29 03:46:00
发布于 2024-04-29 03:46:00
2.8K0
举报

转载自:​亚信科技新技术探索

编辑:东岸因为@一点人工一点智能公众号

NeRF作为一种新型的视场合成和三维重建方法,在多个领域中都有广泛的应用,如城市测绘、机器人技术、虚拟现实/增强现实、电影制作和游戏开发。本文重点介绍了NeRF的构建流程以及目前比较流行的NeRF三维实景建模库,旨在帮助读者更好地理解和应用NeRF三维实景重建技术,为NeRF三维实景重建技术落地提供参考。

01 引言

自然资源部于2022年8月发布了《实景三维中国建设总体实施方案(2022-2025年)》,该方案明确了建设任务、技术路线与方法、主要成果与汇集、组织实施等,并提出到2025年,50%以上的政府决策、生产调度和生活规划可通过线上实景三维空间完成,2035年这一目标提升至80%。这标志着实景三维将作为国家重要的新型基础设施,全面加速开展布局建设,未来的市场发展空间不可限量。

何谓实景三维?实景三维是对人类生产、生活和生态空间进行真实、立体、时序化反映和表达的数字虚拟空间,是新型基础测绘标准化产品,是国家新型基础设施建设的重要组成部分,为经济社会发展和各部门信息化提供统一的空间基底。

NeRF(神经辐射场)是一种神经网络模型,用于从2D图像中学习并生成连续的3D场景模型。利用NeRF技术,可以在二维数据的基础上自动化构建三维模型,并进行纹理映射、光照渲染等操作,生成具有真实感和视觉冲击力的实景三维模型,克服传统方法的限制,在实景三维领域具有广泛的应用前景。

02 NeRF概述

NeRF通过深度学习的方法,将三维空间表示为一组可学习且连续的辐射场。在已知视角下,对场景进行一系列的捕获(包括拍摄到的图像以及每张图像对应的内外参),不需要中间三维重建的过程,仅根据位姿内参和图像,合成新视角下的图像。不同于传统的三维重建方法把场景表示为点云、网格、体素等显式的表达,NeRF独辟蹊径,将场景建模成一个连续的5D辐射场隐式存储在神经网络中,只需输入稀疏的多角度的2D图像,就可以通过训练得到一个神经辐射场模型,根据这个模型可以渲染出任意视角下的清晰照片。

NeRF神经辐射场的优势主要包括:

高质量渲染:NeRF能够生成高度逼真的3D场景,使用神经网络模型以少量数据集为基础进行训练,从而生成高质量的渲染效果。

连续函数表示:NeRF使用连续函数表示3D场景,这种表示方法可以从任意角度进行渲染,产生令人惊叹的高质量渲染效果。

表达能力强:NeRF能够自然地表达物体的颜色和透明度,以任意精度和分辨率来表示3D模型,使得在3D重建和视图合成等任务上具有非常高的性能。

自监督学习:NeRF的训练过程不需要人工标注,仅通过一组2D图片(通常是同一个3D场景的不同视角的图片)作为输入,然后通过优化算法调整网络的参数,使得网络输出的3D辐射场能够最好地重现这组2D图片。

此外,因为NeRF生成的是连续的3D模型,而不是像传统的3D重建方法那样生成离散的3D体素或三角形网格,所以NeRF生成的模型可以具有更高的解析度和更细的细节。当然,NeRF也有一些局限性,例如训练和渲染过程需要大量的计算资源,而且对于有大量动态内容和复杂反射的场景,NeRF可能无法处理得很好。

03 NeRF构建过程

要构建NeRF,首先要从整个环境或物体周围的不同角度拍摄一系列照片。在某些情况下,录制视频更方便。这允许使用无人机捕获的视频或任何其他预先录制的内容制作NeRF,甚至可以使用这项技术重新捕获3D游戏内容作为NeRF。

通常来讲照片的生成质量比视频要好一些,前提是照片是进行特定拍摄,无明显模糊。视频操作则会更加简单一些,但是运动模糊会显著降低重建质量,为了达到最佳效果,慢慢移动手机,尽量避免快速移动,尤其是旋转。为了获得最佳效果,应该从尽可能多的独特视角捕捉物体或场景。此外,在拍摄时最好移动手机(在3D空间中),而不是从静止位置旋转它,站在同一个地方,在一个球体中向外捕捉通常不太好。

构建NeRF的流程如下:

1. 数据收集:收集一组2D图像,这些图像从不同的角度和位置捕获了同一场景。这些图片都是对同一3D场景的拍摄,所以在这个场景中,每个物体都会在多个图像中出现,只是视角和位置不同。

2. 预处理:对于每张图像,需要知道相机的参数,包括相机的位置和方向。这些参数可以用来确定从相机位置出发,经过图像上每个像素,向场景中射出的视线的方向。

3. 神经网络训练:使用这些数据训练一个深度神经网络。这个网络的目标是能够根据3D坐标和视线方向预测出那个位置的颜色和体密度。在训练过程中,使网络预测的颜色值和真实的2D图像尽可能一致,神经网络就能学习到场景的3D表示。而为了实现这个目标,通过比较网络预测的颜色和图像中的真实颜色来计算误差,然后通过反向传播算法来更新网络的参数。神经网络的输入是每个3D位置和相应的视线方向,输出是预测的颜色和密度值。

图1:NeRF过程
图1:NeRF过程

04 三维实景建模库介绍

目前比较流行的三维实景重建库有Luma AI、NVIDIA Instant NeRF、NeRFStudio三种。

· Luma AI

Luma AI是一家专注于3D媒体生成和应用的服务商,它的核心技术是NeRF。Luma AI网页版是可以免费使用的,网页版视频和图片(ZIP压缩包)体积最大限制5GB;视频转3D API单次收费1美元。

Luma AI支持导出GLTF、OBJ、点云,并且导出的GLTF、OBJ模型是带有纹理的;Luma AI提供了插件可以将NeRF与Unreal Engine相结合,使用该插件用户可以在Unreal Engine中加载Luma AI生成的三维模型。

图2是使用HUAWEI P40 Pro拍摄的实景视频,图3是通过Luma AI网页版训练的结果,图4是将Luma AI网页版训练结果导出,加载到Unreal Engine 5中的效果。

图2:手机拍摄视频
图2:手机拍摄视频
图3:Luma AI训练结果
图3:Luma AI训练结果
图4:Unreal Engine加载Luma AI训练结果
图4:Unreal Engine加载Luma AI训练结果

· NVIDIA Instant NeRF

NVIDIA Instant NeRF是一种将2D图像转换为3D场景的神经渲染技术,它基于NeRF模型。它极大地提高了3D捕获和共享的速度、易用性和范围,被认为是迄今为止最快的NeRF技术,它在2022年被美国《时代》周刊评为年度最佳发明。

NVIDIA Instant NeRF是开源项目,在GitHub上,目前提供了几种特定显卡型号的安装包,如果是其他型号的显卡,则需要下载源码进行编译。Instant NeRF可以导出自有格式.ingp,也可以导出Mesh,但是导出的Mesh没有纹理。

如果拍摄的是视频,需要使用colmap2nerf进行抽帧以及生成transform.json文件(记录每张图像的相机参数),处理后的数据才能被Instant NeRF训练。

图5是使用官方测试数据训练的结果,训练机器的显卡型号为:NVIDIA GeForce RTX3070。

图5:NVIDIA Instant NeRF训练结果
图5:NVIDIA Instant NeRF训练结果

· NeRFStudio

NeRFStudio是一个用于创建、训练和可视化神经辐射场(NeRF)的开源软件库。它提供了API,可以简化创建、训练和可视化NeRF的端到端过程。目前支持多种模型,其中Nerfacto是NeRFStudio提出的,是NeRFStudio的默认模型,也是最推荐使用的模型。

NeRFStudio没有提供安装包,如果想使用需要在GitHub上,下载源码进行编译。NeRFStudio支持导出Mesh、点云,下载扩展Volinga extension for NeRFStudio可以支持Unreal Engine,但是需要通过Volinga网站进行格式转换。

图6:NeRFStudio官方训练结果
图6:NeRFStudio官方训练结果

05 总结与展望

NeRF三维实景建模是一种利用神经网络技术对真实世界进行三维建模的方法,它通过分析大量的图像和视频数据,能够构建出高质量的三维模型,为各个领域的应用提供了广阔的可能性。

总的来说,NeRF三维实景建模是一种非常有前途的技术,未来可能会在更多的领域得到应用和发展。同时,随着技术的不断进步和应用场景的不断扩大,它也将会面临着更多的挑战和机遇。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nerf技术在三维重建中起到什么作用?
NeRF的核心思想是将三维场景建模成一个连续的函数,这个函数可以接收三维空间中的一点以及观察这个点的相机的方向,然后输出该点的颜色和不透明度。这样,通过学习这个函数,我们就可以得到整个三维场景的信息,从而可以渲染出从任何角度观察这个场景的结果。
一点人工一点智能
2024/04/02
5970
Nerf技术在三维重建中起到什么作用?
精华文稿|在非理想输入下NeRF的重建
神经辐射场(NeRF)作为一种通用的场景表达,已经得到越来越多研究者的注意。给定几张不同视角下的图片,我们就能重建出一个非常精细的NeRF。然而在实际应用中,我们经常会遇到不同种输入图像的退化,比如镜头畸变、噪声和模糊。如果在这些非理想状态下重建精细的NeRF是一个值得研究的问题。本次分享中,我们会梳理已有的一些在非理想输入状况下的NeRF重建的相关工作,然后介绍我们的工作:Deblur-NeRF,即如何在输入图像有运动模糊或者失焦时依然能够重建一个清晰的NeRF。
一点人工一点智能
2023/01/05
2K0
精华文稿|在非理想输入下NeRF的重建
100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)
转载自:DeepHub IMBA 原文:100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)
一点人工一点智能
2023/02/15
1.3K0
100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
最近,来自谷歌Research和谷歌Brain的一组研究人员开发了一个深度学习模型,仅使用非结构化的野外图片集合就能合成复杂的户外3D场景图。
新智元
2020/08/11
1.6K0
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
华为3D实景地图,30分钟构建超精细数字世界,达到厘米级
千百年来,人类都致力于记录和解释身处的物理世界。随着计算机科学的发展,将物理世界数字化重建,不仅是长远的理想,更是千行百业努力的当下工作。真实的数字化重建三维物理环境,进而从任意视角观察重建的环境,是图形学、计算机视觉领域每个人的终极梦想,也是虚拟增强现实、元宇宙等众多未来应用的基石。
机器之心
2022/12/16
7660
华为3D实景地图,30分钟构建超精细数字世界,达到厘米级
NeRF作者简述NeRF的历史与发展
文章:NeRFs: The Search for the Best 3D Representation
点云PCL博主
2023/12/28
9730
NeRF作者简述NeRF的历史与发展
Text-to-3D!建筑学小哥自称编程菜鸟,攒了个AI作画三维版,还是彩色的
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI画师,技术又精进了—— 直接一句话/一张图,生成3D模型、环绕视频、NeRF实例那种。 还是带颜色的。 输入“一幅美丽的花树画,作者Chiho Aoshima,长镜头,超现实主义”,就能瞬间得到一个长这样的花树视频,时长13秒。 这个文本/图片-3D生成AI,叫Dreamfields-3D,来自一个自称编程菜鸟的建筑学在读博士。 Demo刚被小哥放在微博、推特等平台,许多网友已经急着蹲内测了: 现在,小哥已经将它开源,colab上也能运行。 一起
量子位
2022/09/27
6740
Text-to-3D!建筑学小哥自称编程菜鸟,攒了个AI作画三维版,还是彩色的
清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体
在计算机视觉中,物体级别的三维表面重建技术面临诸多挑战。与场景级别的重建技术不同,物体级别的三维重建需要为场景中的每个物体给出独立的三维表示,以支持细粒度的场景建模和理解。这对 AR/VR/MR 以及机器人相关的应用具有重要意义。
机器之心
2024/01/04
6980
清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体
不可思议!英伟达新技术训练NeRF模型最快只需5秒,单张RTX 3090实时渲染,已开源
令人不可思议的是,就如谷歌科学家 Jon Barron 在推特上表示的:18 个月前,训练 NeRF 还需要 5 小时;2 个月前,训练 NeRF 最快也需要 5 分钟;就在近日,英伟达的最新技术——基于多分辨率哈希编码的即时神经图形基元,将这一过程缩减到只有 5 秒!!??
机器之心
2022/02/23
1.5K0
不可思议!英伟达新技术训练NeRF模型最快只需5秒,单张RTX 3090实时渲染,已开源
瞳孔反射重建3D,试验场景人人可构建!网友:我焯,黑科技我喜欢
当我们看着别人的眼睛,我们也会捕捉到从角膜反射的光。就比如使用相机来拍摄别人眼睛,实际上我们也可以将他们的眼睛视为一组镜子。
量子位
2023/08/05
3040
瞳孔反射重建3D,试验场景人人可构建!网友:我焯,黑科技我喜欢
100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)
来源:Deephub Imba本文约3300字,建议阅读9分钟本文通过100行的Pytorch代码实现最初的 NeRF 论文。 提起三维重建技术,NeRF是一个绝对绕不过去的名字。这项逆天的技术,一经提出就被众多研究者所重视,对该技术进行深入研究并提出改进已经成为一个热点。不到两年的时间,NeRF及其变种已经成为重建领域的主流。 NeRF全称为Neural Radiance Fields(神经辐射场),是一项利用多目图像重建三维场景的技术。该项目的作者来自于加州大学伯克利分校,Google研究院,以及加州大
数据派THU
2023/04/03
6670
100行Pytorch代码实现三维重建技术神经辐射场 (NeRF)
六问Nerf | 简单易懂的神经辐射场入门介绍
最近零散时间,翻了一批讲Nerf原理的CSDN/知乎/B站文章和视频,有些讲的还是不错的,但是有些实在是让人感觉,作者本身就没搞懂啥是神经辐射场。所以本文使用自问自答的方式,尝试直击要害的讲清楚Nerf是干什么的。
一点人工一点智能
2023/01/15
5.5K0
六问Nerf | 简单易懂的神经辐射场入门介绍
有望取代Deepfake?揭秘今年最火的NeRF技术有多牛
---- 新智元报道   编辑:Joey 如願 【新智元导读】当下呼声最高的NeRF有望取代Deepfake成为新一代视觉神器?一起来看看它到底有多牛。 什么,你还不知道NeRF? 作为今年计算机视觉领域最火的AI技术,NeRF可谓是应用广泛,前景一片大好。 B站上的小伙伴可算是把这项技术玩出了新花样。 抛砖引玉 那么,究竟NeRF是什么? NeRF(Neural Radiance Fields)是最早在2020年ECCV会议上的最佳论文中提出的概念,其将隐式表达推上了一个新的高度,仅用2D的po
新智元
2022/07/18
7290
有望取代Deepfake?揭秘今年最火的NeRF技术有多牛
NeRF基于线稿生成逼真三维人脸,细节风格随意改,论文已上SIGGRAPH
高真实感且精确可控的三维人脸建模是数字人构建中的重要问题之一。目前,使用现有的基于网格的人脸建模方法需要专业的人员使用复杂的软件并投入大量的时间和精力,且实现逼真的人脸渲染结果较为困难。
机器之心
2023/09/08
4970
NeRF基于线稿生成逼真三维人脸,细节风格随意改,论文已上SIGGRAPH
现实虚拟化:从三维重建到逆渲染(Inverse Rendering)
原文:https://zhuanlan.zhihu.com/p/568205134
一点人工一点智能
2023/02/02
1.8K0
现实虚拟化:从三维重建到逆渲染(Inverse Rendering)
经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场
计算机视觉中一个研究方向是在 MLP 的权重中编码对象和场景,使得该 MLP 直接从 3D 空间位置映射到形状的隐式表示。然而,之前的方法无法使用离散的方式(如三角形网格或体素网格)以相同的保真度再现具有复杂几何形状的真实场景,迄今为止也仅限于表示具有低几何复杂性的简单形状,从而导致渲染过度平滑。NeRF提出将一个静态场景表示为5D输入,即:空间中某个位置的3D坐标以及观察方向,通过MLP神经网络得到该位置的颜色以及体密度,使用体绘制技术可以得到输入相机位姿条件下的视角图片,然后和 ground truth 做损失即可完成可微优化,从而渲染出连续的真实场景。
用户1324186
2022/11/07
3.6K0
经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场
浅谈单图像三维重建算法
本文简单带大家看一下单图像三维重建相关的论文。写这篇文章算是对之前的一点总结。因为之前没有做过三维视觉,也没有钻研过生成对抗网络,中间实在是吃了不少苦,基本是边补基础知识边看论文,现在基本感觉看过一遍了,简单的把这些论文都拿出来说一说,算作有个收尾。如果说的不好,哪里理解错了,也请各位在评论区批评指教。
CV君
2022/03/23
7320
浅谈单图像三维重建算法
无需多视图!Google重磅升级NeRF:仅需一张平面图即可生成3D模型
---- 新智元报道   编辑:LRS 【新智元导读】NeRF最大的弊端被攻克! 人类视觉中,有一个很重要的能力就是可以从二维图像中理解图像的三维形状。 理解三维几何对于了解物体和场景的物理和语义结构至关重要,但当下计算机的视觉仍然很难从二维照片中抽取出三维几何信息。 2020年,神经辐射场(NeRF)模型发布,仅根据二维图像即可生成三维模型,不过缺陷也很明显:模型需要同一个场景(scene)的多个视图(views)作为监督学习的输入。 如果多视角数据不足,模型就无法估计体积表征,生成的场景很容易崩溃
新智元
2022/09/20
1.5K0
无需多视图!Google重磅升级NeRF:仅需一张平面图即可生成3D模型
脑补出新视角,一个统一的NeRF代码库框架已开源
机器之心原创 作者:思 从二维图片想象出未见过的视角,它可能会是什么样的?这就是近来特别流行的神经辐射场(NeRF)这一类模型。而现在,一个统一的 NeRF 代码库框架 XRNeRF 已经开源啦。 假设一个物体你看了几张照片后,能想象出其它角度看上去的感觉吗?人是可以做到的,我们能自行推测出没见过的部分,或者说没见过的角度是什么样的。模型其实也有办法做到,给定一些场景图片,它也能脑补出一些未见过角度的图像。 渲染新视角,近来最引人瞩目的就是 ECCV 2020 最佳论文荣誉提名的 NeRF (Neural
机器之心
2023/03/29
6490
脑补出新视角,一个统一的NeRF代码库框架已开源
上交&微软 | Make-it-3D:diffusion+NeRF从单张图像生成高保真的三维物体!
人类具有一种与生俱来的能力,可以轻松地想象3D几何和虚构出从不同角度看物体的外观,这基于他们对世界的先验知识。
公众号-arXiv每日学术速递
2023/08/26
1.2K0
上交&微软 | Make-it-3D:diffusion+NeRF从单张图像生成高保真的三维物体!
推荐阅读
相关推荐
Nerf技术在三维重建中起到什么作用?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档