你有没有在规划旅行时,面对平面的2D地图,难以分清城市天际线和著名地标的真实样貌?
你是否在浏览城市街景时,因为导航上只有单调的色块和线条,而对眼前真实的环境感到陌生和迷茫?
你是否曾希望,地图不仅能指路,更能像“数字沙盘”一样,为你“秒速”还原一个真实、立体、遍布全国的沉浸感城市?
那些让旅行者和“云逛街”用户感到平淡的场景,如今正被一种全新的地图渲染能力所改变——百度地图至真3D楼宇。当你放大地图,它能“秒速加载”城市;当你寻找地标,它能“瞬间还原”建筑细节;当你漫游全国任意街区,它都能让你身临其境,精准识别每一个街角。
百度地图究竟是如何实现3D楼宇“秒速上线”的?从“知道有这栋楼”到“看清这栋楼的样式”,这背后蕴藏着怎样的技术突破?
【AI地图 Tech说】第六期将为你揭开奥秘!



要实现全国范围海量3D楼宇的“秒速上线”,其背后依赖的并非传统的人工建模。百度地图联合百度视觉技术团队,联合开发了一套高度自动化、端到端的AI内容生产管线。该管线构建在“多维数据融合”与“AI智能生成”两大核心技术支柱之上,实现了从数据输入到模型上线的全流程闭环。
其通用流程涵盖三大核心模块:
1.多视角引导生成,奠定相似度与美观度基石
管线首先从多视角数据融合起步。系统智能整合来自卫星、倾斜摄影、街景乃至互联网图片的多源视觉资料,利用先进的多视角图片引导图像Diffusion技术,对这些不同来源、不同光照、不同角度的影像进行分析与提炼,生成适合百度地图设计风格的楼宇参考图。这一步骤的核心是“去粗取精”,模型会摒弃临时的光影、遮挡(如行人、车辆),提炼出建筑物稳定的色彩、材质和结构特征,最终生成一组统一风格、高可信度的建筑参考图,为后续的精细建模奠定坚实的视觉基础。
2.3D AIGC + 智能减面处理,兼顾精度与性能
随后,这些高可信度的参考图被用于生成3D几何结构。这是实现从2D图像到3D模型跨越的关键一步。得益于近年图转静态3D模型的快速发展,当前业内已可实现较高质量的3D高精模型生成。然而,原始的高精模型包含海量面片(数十万+),对于地图应用的“秒速加载”而言过于庞大。为此,百度视觉技术部设计一套了基于点云理解的智能减面机制。这与传统“一刀切”的统一减面算法截然不同。该机制首先通过点云理解算法深度分析建筑的几何特征:例如,它能精准识别出平坦的墙体、屋顶(适合高比例的激进减面),同时也能识别出结构复杂的檐口、建筑的轮廓线与结构支撑,确保在减面过程中不发生模型“塌陷”。基于此,系统会为建筑物的不同部分智能完成减面操作。这套机制在极大压缩模型体积(通常可压缩至一万面以下)的同时,完美保留了建筑物的核心视觉特征,实现了加载性能与视觉精度的最佳平衡。



3.AI高清纹理,赋予模型灵魂
最后一步是为减面后的模型,绘上高清纹理,这也是决定最终真实感的关键。尽管业界已有了较好的多视角生成算法与纹理烘焙技术,但在大规模城市场景中依然面临棘手难题。建筑物天然的自遮挡问题——即建筑自身结构(如屋檐、内凹处)会遮挡住其他部分,导致AI无法从卫星或街景视角捕捉到完整的表面信息;而主流生成模型受限于分辨率,又使其在处理窗框等精细结构时清晰度严重不足。这两大瓶颈共同作用,常导致最终生成的纹理杂乱、模糊甚至大片缺失,严重影响了3D模型的真实感。为攻克这一行业难题,百度视觉技术部的交互式AI纹理生成编辑工具通过“智能生成 + AI修复 + 交互精调”的组合拳,实现了建筑物完整纹理的生成。它支持修复各类人工或AIGC生成的3D模型纹理,利用多视角纹理Diffusion技术智能修复因遮挡和低分辨率导致的瑕疵区域。对于极端复杂情况,工具还将由AI辅助运营人员进行快速的交互式修正。最终,这套机制确保了输出的纹理在任何视角下都达到了完整、清晰且一致的高清标准,真正实现了可供海量用户“秒速”漫游的3D世界。

基于今年4月百度地图发布的次世代渲染引擎-Real至真引擎,进一步提升AI生成精模的质感,更好的与地图数据融合在一起。这些核心的能力包括如下:
光照材质系统从可以烘托从清晨到黄昏的全局光照,到可以勾勒出模型的缝隙、转角的环境光遮蔽,这动态且富有层次的光照环境,极大地增强了模型的立体感和体积感,更好烘托了城市氛围。动态阴影系统生成具有柔和边缘的软阴影,更符合真实世界的光线漫反射,避免生硬的“锯齿感”。极大地增强了场景的立体感和层次感,建筑物和地标因其投射的阴影而牢牢“锚定”在地面上,避免了“漂浮”的虚假感,让整个3D城市显得无比稳固和真实。实时倒影系统让摩天大楼、车辆等3D模型可以在地面、水面等接收面上产生逼真倒影。利用倒影这一强烈的视觉线索,极致地提升了场景的质感与沉浸感。特别是摩天楼群在水畔或雨后的街道上产生的倒影,能瞬间营造出如同摄影作品般的城市美学效果。远端雾化系统可模拟大气散射效果,使距离观察者越远的景物,看起来越模糊、颜色越淡,并逐渐融入背景天色。有效增强了场景的空间纵深感和空气感,避免了远处景物“剪纸”一样贴在眼前的突兀感。这不仅符合现实视觉规律,也能艺术化地营造出城市的朦胧与壮阔之美。通过融合光照材质、动态光影(阴影/倒影)和大气模拟(雾化)这三大支柱,百度地图至真渲染引擎成功地将AI生成的这些精模与原有的地图数据,转化为了一个生动、鲜活、充满细节并极具视觉冲击力的3D数字世界,真正实现了让用户“身临其境”地漫游全国街区的愿景。


被折叠的 条评论
为什么被折叠?



