前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >华为3D实景地图,30分钟构建超精细数字世界,达到厘米级

华为3D实景地图,30分钟构建超精细数字世界,达到厘米级

作者头像
机器之心
发布于 2022-12-16 08:31:51
发布于 2022-12-16 08:31:51
7400
举报
文章被收录于专栏:机器之心机器之心

机器之心专栏

作者:黄经纬

华为 HDC2022 发布了 3D 实景地图,可以实现任意视角下 3D 物理环境的实景渲染。

千百年来,人类都致力于记录和解释身处的物理世界。随着计算机科学的发展,将物理世界数字化重建,不仅是长远的理想,更是千行百业努力的当下工作。真实的数字化重建三维物理环境,进而从任意视角观察重建的环境,是图形学、计算机视觉领域每个人的终极梦想,也是虚拟增强现实、元宇宙等众多未来应用的基石。

华为 HDC2022 发布了令人震撼的 3D 实景地图,可以实现任意视角下 3D 物理环境的实景渲染。通过 2500 张照片,仅需 30 分钟就可以构建出 5 平方公里的超精细数字世界,拥有厘米级精细化建筑和真实光照还原能力。

华为 3D 实景地图技术由毕业于斯坦福大学、现华为 2012 实验室技术专家黄经纬博士及其团队研发完成。先来看看使用实景渲染技术的室内外效果。

http://mpvideo.qpic.cn/0bc35yangaaateadlqdrunrvb3wd2pxabuya.f10002.mp4?dis_k=43da14453c1404635640a7b346caf7f0&dis_t=1671179410&vid=wxv_2664501755619262465&format_id=10002&support_redirect=0&mmversion=false

1 问题背景

从任意视角观察一个三维场景被广泛应用于游戏领域。通过美术师绘制的三维场景加以标准的 CG 渲染管线,用户可以自由的探索场景的每个角落。为了用自动化的手段得到更加真实的场景,计算机视觉从业人员致力于采集真实的物理世界的数据,用以重建一个孪生的三维场景供人预览。然而经过数十年的发展,重建模型的渲染效果仍不足以替代人工生产的场景。为了进一步改善复杂光照场景下的渲染效果,光场重建和渲染技术被提出,并在小场景下得到了惊艳的效果。近些年,神经辐射场(NeRF)的概念,可用于同时重建复杂的几何和光照。然而对于复杂的大场景,这些方案都存在一定的局限性。华为 3D 实景地图整合了各方案的优势,从而可以在复杂大场景下进行高质量的真实重建和快速渲染。

2 相关工作的局限与机遇

除去很多昂贵的三维重建解决方案,最接近商用的解决方案仍然是基于多视角图片的三维重建。然而,重建技术往往假设表面在各视角下拥有一致的光照,因此无法处理高光、半透明物体的重建。光场重建模型可以根据不同视角采集的光线加权来处理复杂光照,但在表面重建错误的情况下,新视角下的渲染往往存在残影。虽然神经辐射场(NeRF)技术使用复杂的模型能正确的概括真实场景,但恢复模型参数往往需要稠密采集的图片,否则就成为一个欠约束问题,在稀疏采集的大场景下新视角的泛化性尤为欠缺。

然而,各个方案亦有他们的优势。基于多视角图片的各向同性光照假设,在大部分情况下都是实用的,基于搜索深度信息的本质使其拥有稀疏视角的高效重建并拥有很好的泛化性,能够很好的弥补光场渲染和神经辐射场渲染的不足。光场渲染可以直接从采集的光线中获取颜色,既保证真实,又无需像神经辐射场那样优化复杂的 MLP 或者球谐函数。神经辐射场作为一个全局模型,改善了传统重建融合局部重建结果无法全局优化的情况,同时引入不透明度下的体渲染增强了模型描述环境的能力。

3 解决方案

华为 3D 实景地图结合了各家所长,提出了显式辐射场模型,系统模块如下:

第一阶段,系统使用传统三维重建方法对环境进行粗略构建,形成三角形网格。针对 3D 数字溪村场景,初始的几何构建能力使系统能使用 500 米高空航拍的 2500 张图片快速构建,并拥有新视角下渲染的泛化性。这个模型是粗模,虽然可以被直接用于渲染,但几何和环境光照的恢复不够真实。

在第二阶段,粗模作为环境轮廓,被初始化为显示辐射场。其具体的表达形式是纯几何的,即在粗模表面附近显式的记录不透明度为 1,其他地方不透明度为 0。接下来,系统使用采集的图片和三维重建中获取的图片位姿进一步优化辐射场模型。具体而言,可以对于每个局部区域进行区域增长式优化不透明度,从而过滤重建粗模中的噪音,并补全模型的缺失几何。在此过程中,不同于神经辐射场对光照模型用 MLP 或球谐函数来表达,而是直接使用类似于光场渲染的采样技术,快速获得特定位置和方向上的最佳模型光照。采样中由于使用加权平均的限制,空间中没有表面的点与对应采集图片相应像素比,仍会引起较大的颜色误差。因此,可以使用 L2 损失函数调整不透明度,从而优化几何体。

在最终阶段,辐射场模型转化为可用于渲染管线支持的网格模型。使用纹理模型进行光栅化渲染对性能尤为关键。系统将显式的辐射场模型重构回网格,并根据光场渲染压缩技术将表面光照压缩成多个纹理,用于使用着色器进行快速渲染。对于大规模场景,系统对几何进行 LOD 层次化,使模型渲染可以由粗至细加载进行。

借此,显式辐射场技术综合百家所长,能够实现良好的视角泛化性、精细的几何和真实光照效果,并以高效的渲染效率处理大规模场景。

4 效果展示

显式辐射场技术,可以帮助重建的环境获取真实的渲染光照效果。

对比传统几何重建(左),辐射场能够更好的恢复精细的桥梁结构(右)。

同时,本技术可以恢复复杂的材质(如透明玻璃、高光桌面)效果和复杂的几何体(植物、吊灯)。

5 挑战与未来

虽然在技术上实现了显著突破,但其商业价值仍需时间去发掘和思考,其主要问题在于环境采集的方式。为了得到优质的环境重建,图像的采集往往需要专业人士或者专业设备来实现。例如,大规模的室外环境可以通过专业的大飞机倾斜摄影完成。航飞场景往往容易遮挡地面,对于地面应用,如高自由度的街景,仍需要地面采集的数据以避免航飞带来的遮挡问题。另外为了保证环境的高覆盖采集,地面的采集往往需要使用全景设备,也为采集带来了额外的成本而不适用于众包生产。

从应用来看,未来最广阔的市场仍属于是广大消费者,因此,对于大规模实景地图的云渲染技术至关重要。另外,如何让实景渲染的真实场景与有价值的应用结合带来全新的用户体验,仍然是元宇宙行业需要思考的首要命题。对于 2B 场景,确实有大量的客户需要实景渲染能力,然而其所带来的价值以及生产成本的平衡,需要进一步探索,从而找到技术的真正落地点。

6 致谢

本技术由华为 2012 实验室技术专家黄经纬,预研算法工程师郭晓阳、时北极,三维重建工程师张彦峰,空三与采集负责人张行航等成员共同完成。更多有关 3D 数字溪村的体验可在 Petal Map 地图应用中搜索松山湖溪村进行体验。

  • 欢迎访问技术负责人主页:https://cs.stanford.edu/~jingweih
  • 或者通过邮件方式联系作者:jingweih@cs.stanford.edu

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
最近,来自谷歌Research和谷歌Brain的一组研究人员开发了一个深度学习模型,仅使用非结构化的野外图片集合就能合成复杂的户外3D场景图。
新智元
2020/08/11
1.6K0
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
高真实感、全局一致、外观精细,面向模糊目标的NeRF方案出炉
模糊复杂目标的高真实感建模和渲染对于许多沉浸式 VR/AR 应用至关重要,其中物体的亮度与颜色和视图强相关。在本文中,来自上海科技大学的研究者提出了一种使用卷积神经渲染器为模糊目标生成不透明辐射场的新方案,这是首个将显式不透明监督和卷积机制结合到神经辐射场框架中以实现高质量外观的方案,并以任意新视角生成全局一致的 alpha 蒙版。
机器之心
2021/06/08
8780
基于NeRF的三维实景重建技术探索
NeRF作为一种新型的视场合成和三维重建方法,在多个领域中都有广泛的应用,如城市测绘、机器人技术、虚拟现实/增强现实、电影制作和游戏开发。本文重点介绍了NeRF的构建流程以及目前比较流行的NeRF三维实景建模库,旨在帮助读者更好地理解和应用NeRF三维实景重建技术,为NeRF三维实景重建技术落地提供参考。
一点人工一点智能
2024/04/29
2.4K0
基于NeRF的三维实景重建技术探索
【他山之石】3D Gaussian Splatting:实时的神经场渲染
“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件,编程技巧等,开辟“他山之石”专栏,助你乘风破浪,一路奋勇向前,敬请关注。
马上科普尚尚
2023/12/15
2.9K0
【他山之石】3D Gaussian Splatting:实时的神经场渲染
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
从稀疏输入合成新视图对于辐射场来说是一个挑战。神经辐射场(NeRF)的最新进展在仅使用少量输入视图就能重建出高度逼真的外观和准确的几何信息方面取得了卓越成果。然而,大部分基于稀疏视图的NeRF实现速度较慢,内存消耗也较大,导致时间和计算成本很高,限制了它们的实际应用。
用户1324186
2024/05/31
1.3K0
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
Nerf技术在三维重建中起到什么作用?
NeRF的核心思想是将三维场景建模成一个连续的函数,这个函数可以接收三维空间中的一点以及观察这个点的相机的方向,然后输出该点的颜色和不透明度。这样,通过学习这个函数,我们就可以得到整个三维场景的信息,从而可以渲染出从任何角度观察这个场景的结果。
一点人工一点智能
2024/04/02
5710
Nerf技术在三维重建中起到什么作用?
神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
没有了神经网络,辐射场(Radiance Fields)也能达到和神经辐射场(Neural Radiance Fields,NeRFs)相同的效果,但收敛速度快了 100 多倍。 2020 年,加州大学伯克利分校、谷歌、加州大学圣地亚哥分校的研究者提出了一种名为「NeRF」的 2D 图像转 3D 模型,可以利用少数几张静态图像生成多视角的逼真 3D 图像。其改进版模型 NeRF-W (NeRF in the Wild)还可以适应充满光线变化以及遮挡的户外环境,分分钟生成 3D 旅游观光大片。
机器之心
2021/12/28
1.6K0
神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场
计算机视觉中一个研究方向是在 MLP 的权重中编码对象和场景,使得该 MLP 直接从 3D 空间位置映射到形状的隐式表示。然而,之前的方法无法使用离散的方式(如三角形网格或体素网格)以相同的保真度再现具有复杂几何形状的真实场景,迄今为止也仅限于表示具有低几何复杂性的简单形状,从而导致渲染过度平滑。NeRF提出将一个静态场景表示为5D输入,即:空间中某个位置的3D坐标以及观察方向,通过MLP神经网络得到该位置的颜色以及体密度,使用体绘制技术可以得到输入相机位姿条件下的视角图片,然后和 ground truth 做损失即可完成可微优化,从而渲染出连续的真实场景。
用户1324186
2022/11/07
3.5K0
经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场
本科生新算法打败NeRF,不用神经网络照片也能动起来,提速100倍|开源
它是一个简单的全连接神经网络,使用2D图像的信息作为训练数据,还原拥有体积的3D场景。
量子位
2021/12/24
1.5K0
本科生新算法打败NeRF,不用神经网络照片也能动起来,提速100倍|开源
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
从2D图像中进行3D重建和建模近年来受到了极大的关注,这要归功于具有3D重建能力的真实感视图合成方法的最新进展。从技术角度来看,这是一个跨计算机视觉、计算机图形学和摄影测量学的交叉研究领域。
AIGC 先锋科技
2024/07/08
7490
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
SIGGRAPH 2023 | 用于实时辐射场渲染的 3D Gaussian Splatting
网格和点是最常见的可以用于基于 GPU/CUDA 快速光栅化的显式三维场景表征方式。而神经辐射场基于 MLP 使用体渲染对捕捉的场景化进行自由视角合成。而提升辐射场效率的方案目前多基于体素、哈希网格或是点。辐射场方法的连续性有助于场景的优化,但是渲染过程中所需的随机采样需要的花销较大同时会带来噪声。因此,在本文中,作者提出了一种新的方法:本文所提出的 3D 高斯表达在能达到 sota 视觉质量和可比的渲染时间的同时,本文所提出的基于 tile 的 Splatting 方法可以实时渲染 1080p 的结果。
用户1324186
2023/10/10
1.7K0
SIGGRAPH 2023 | 用于实时辐射场渲染的 3D Gaussian Splatting
CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法
单目动态场景(Monocular Dynamic Scene)是指使用单眼摄像头观察并分析的动态环境,其中场景中的物体可以自由移动。单目动态场景重建对于理解环境中的动态变化、预测物体运动轨迹以及动态数字资产生成等任务至关重要。
机器之心
2024/03/07
4560
CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法
速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 2023
机器之心原创 编辑:杜伟 针对逆渲染技术的研究成果连续两年入选计算机视觉顶会 CVPR,并从处理单张图像跨越到覆盖整个室内大场景,如视在三维重建领域的视觉算法技术底蕴得到了淋漓尽致的展现。 三维重建是计算机视觉(CV)和计算机图形学(CG)的热点主题之一,它通过 CV 技术处理相机等传感器拍摄的真实物体和场景的二维图像,得到它们的三维模型。随着相关技术的不断成熟,三维重建越来越广泛地应用于智能家居、AR 旅游、自动驾驶与高精度地图、机器人、城市规划、文物重建、电影娱乐等多个不同领域。 典型的基于二维图像的
机器之心
2023/03/29
7830
速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 2023
3张图片生成一个手办3D模型!南加州大学华人博士提出新模型NeROIC,更真实!
---- 新智元报道   编辑:LRS 【新智元导读】通过几张二维照片还原为3D模型一直是一个图形学的一个难题,并且照片的不同光线、相机型号都会影响到最终的生成效果,也限制了模型的实际应用场景。最近南加州大学华人博士提出新模型NeROIC,不仅让模型的易用性大大提升,还显著提升了真实感! 随着深度学习的加入,计算机图形学又产生了很多新兴领域。神经渲染(Neural Rendering)技术就是利用各种深度神经网络进行图像合成,通过自动化的流程,能够节省大量从业人员的时间和精力。例如给定几张不同角度拍摄
新智元
2022/03/04
7290
谷歌华人研究员发布MobileNeRF,渲染3D模型速度提升10倍
---- 新智元报道   编辑:LRS 【新智元导读】最近谷歌发布了全新的MobileNeRF模型,直接将神经辐射场拉入移动时代,内存需求仅为1/6,渲染3D模型速度提升10倍,手机、浏览器都能用! 2020年,神经辐射场(NeRF)横空出世,只需几张2D的静态图像,即可合成出该模型的3D场景表示,从此改变了3D模型合成的技术格局。 NeRF以一个多层感知器(MLP)来学习表示场景,评估一个5D隐式函数来估计从任何方向、任何位置发出的密度和辐射,可在体渲染(volumic rendering)框架下
新智元
2022/08/26
1.1K0
谷歌华人研究员发布MobileNeRF,渲染3D模型速度提升10倍
CVPR2024 | HUGS:人体高斯溅射
真实渲染和人体动态是一个重要的研究领域,具有在AR/VR、视觉特效、虚拟试衣、电影制作等众多应用。早期的工作创建人类化身依赖于多相机捕捉设置中的高质量数据捕捉、大量计算和大量手工努力。最近的工作通过使用3D参数化身体模型如SMPL,直接从视频生成3D化身来解决这些问题,这些模型具有高效光栅化和适应未见变形的能力。然而,参数化模型的固定拓扑结构限制了对衣物、复杂发型和其他几何细节的建模。最近的进展探索了使用神经场来建模3D人类化身,通常使用参数化身体模型作为建模变形的模版。神经场在捕捉衣物、配饰和头发等细节方面表现出色,超越了通过纹理和其他属性光栅化参数化模型所能实现的质量。然而,它们也有不足,特别是在训练和渲染效率方面较低。
用户1324186
2024/05/31
5420
CVPR2024 | HUGS:人体高斯溅射
上交通提出 AdR-Gaussian ,实现310%的渲染速度提升 !
新颖视角合成(NVS)旨在给定一组输入视图的情况下生成新视角的光照真实渲染结果,由于其在新颖视角合成在模型设计[Chen等人2023a; Tang等人2023]、自动驾驶[Cao等人2024; Matsuki等人2023]和虚拟现实 [Qian等人2023; Wang等人2023]等领域的广泛应用,吸引了广泛关注。3D高斯散射(3DGS)模型[Kerbl等人2023]是一种最近的3D表示方法,它使用一组3D高斯椭球来模拟3D场景,实现了复杂场景的高质量实时渲染。然而,高斯光栅化管线由于可避免的串行高斯剔除和因像素间渲染高斯数量不同导致的负载不均,存在不必要的开销,这限制了3D高斯的渲染速度并阻碍了其更广泛的应用。
AIGC 先锋科技
2024/09/25
3120
上交通提出 AdR-Gaussian ,实现310%的渲染速度提升 !
NeurIPS2022的Spotlight文章,性能超出当前SOTA的神经隐式表面重建方法20%
近年来,通过基于体渲染技术的神经隐式表面学习来实现多视图三维重建成为计算机三维视觉领域研究的热点。然而,目前仍然存在一个关键性问题亟待解决:现有的方法缺乏明确的多视图几何约束,因此通常无法实现几何一致的三维重建。为了应对这一问题,我们提出了一种几何一致的神经隐式多视图三维重建算法。首先,我们从理论上分析了基于积分的体渲染技术和基于空间点的符号距离函数(SDF)建模之间存在着固有偏差。为了消除这一偏差,我们直接定位到SDF网络的零测度集,并通过利用来自运动恢复结构(SFM)的稀疏三维信息和多视图立体视觉(MVS)中的光度一致性约束来显式地对表面进行多视图几何优化。这保证了我们的符号距离函数优化无偏,并使得多视图几何约束聚焦于真正表面的优化。大量实验表明,我们提出的方法在复杂的精细结构和大范围的平滑区域都实现了高质量的三维重建,从而在性能上大大优于现有技术。
CV君
2023/03/06
9720
NeurIPS2022的Spotlight文章,性能超出当前SOTA的神经隐式表面重建方法20%
现实虚拟化:从三维重建到逆渲染(Inverse Rendering)
原文:https://zhuanlan.zhihu.com/p/568205134
一点人工一点智能
2023/02/02
1.8K0
现实虚拟化:从三维重建到逆渲染(Inverse Rendering)
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
是否还在担心大规模场景训练和压缩耗时太长、显存开销太大?是否还在苦恼重建出的建筑物和道路表面破碎不堪?是否还在困扰如何定量衡量大规模场景几何重建的精确程度?
机器之心
2025/02/06
1350
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
推荐阅读
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
1.6K0
高真实感、全局一致、外观精细,面向模糊目标的NeRF方案出炉
8780
基于NeRF的三维实景重建技术探索
2.4K0
【他山之石】3D Gaussian Splatting:实时的神经场渲染
2.9K0
CVPR 2024 | DNGaussian: 全局局部深度归一化优化的稀疏三维高斯辐射场
1.3K0
Nerf技术在三维重建中起到什么作用?
5710
神经辐射场去掉「神经」,训练速度提升100多倍,3D效果质量不减
1.6K0
经典论文 | Nerf: 将场景表示为用于视图合成的神经辐射场
3.5K0
本科生新算法打败NeRF,不用神经网络照片也能动起来,提速100倍|开源
1.5K0
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
7490
SIGGRAPH 2023 | 用于实时辐射场渲染的 3D Gaussian Splatting
1.7K0
CVPR 2024满分论文:浙大提出基于可变形三维高斯的高质量单目动态重建新方法
4560
速度提升24倍,30分钟完成室内大场景逆渲染,如视研究成果入选CVPR 2023
7830
3张图片生成一个手办3D模型!南加州大学华人博士提出新模型NeROIC,更真实!
7290
谷歌华人研究员发布MobileNeRF,渲染3D模型速度提升10倍
1.1K0
CVPR2024 | HUGS:人体高斯溅射
5420
上交通提出 AdR-Gaussian ,实现310%的渲染速度提升 !
3120
NeurIPS2022的Spotlight文章,性能超出当前SOTA的神经隐式表面重建方法20%
9720
现实虚拟化:从三维重建到逆渲染(Inverse Rendering)
1.8K0
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
1350
相关推荐
谷歌给NeRF动了个小手术,2D变3D,照片视角随心换
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档