高德把城市生成带到消费级GPU后,世界模型开始争夺空间入口

高德发布3D原生城市世界模型ABot-Earth0.5,把“世界模型”这件事从科幻感很强的演示,往可落地的城市级空间生产又推了一步。它支持用图像、文本或3D模型生成城市空间,据报道在消费级GPU上约10分钟就能生成3D城市,效率提升达到千倍级,并覆盖190多个国家和地区。这个信号很明确:AI不只是在屏幕上生成一段视频或一张图,而是开始尝试把道路、建筑、街区、导航、游戏、机器人训练和城市数字化连接成同一套空间底座。

相关资讯里,世界模型企业知天下完成天使轮融资,计算所与ETH Zurich提出单图3D化提速方案,NeRF重要贡献者获得ACM Grace Hopper奖,机器人仿真数据集和家庭场景也在快速扩容。它们看似分散在地图、视觉生成、机器人和3D资产生产里,背后其实是同一条主线:AI正在从“理解文字和图片”,走向“构建可交互、可计算、可训练的空间”。谁能更低成本地生成真实世界,谁就可能掌握下一代AI应用的入口。

城市生成进入新阶段

ABot-Earth0.5最值得关注的地方,是它把城市级3D生成的门槛压到了更低。过去做大规模城市三维建模,往往依赖测绘、航拍、人工建模、游戏引擎资产和长期工程积累,成本高、周期长,也很难快速覆盖不同国家和地区的城市形态。高德这次强调“3D原生城市世界模型”,说明它不是简单把地图贴上三维外壳,而是在尝试让AI理解城市结构本身。

消费级GPU约10分钟生成城市空间的说法,如果后续能稳定兑现,会改变很多行业对三维场景生产的预算预期。游戏团队可以更快搭建原型,影视和广告可以更低成本生成城市背景,导航和本地生活服务可以获得更强的空间表达能力,城市规划和应急推演也有机会从静态图纸走向动态模拟。对普通用户来说,最直观的变化可能是地图不再只是平面路线,而更像一个可进入、可编辑、可理解的城市界面。

世界模型不再只做视频

过去一年,世界模型常常和视频生成绑定在一起:给一段提示词,模型生成一个看起来连续的虚拟世界。但真正能支撑应用的世界模型,不能只让画面好看,还要保持空间关系稳定、物体一致、视角切换可靠,并能被其他系统调用。高德的城市模型之所以重要,是因为地图天然连接真实道路、地点、POI、交通规则和位置服务,它比纯娱乐化场景更接近真实世界的操作入口。

知天下完成天使轮融资,也说明资本仍在押注“中国版World Labs”这类方向。它们要解决的问题不是生成一段炫酷视频,而是把生成式3DGS基模、海外创作者社区和平台化生产结合起来。世界模型如果只停留在短片生成,就很难形成护城河;但如果能沉淀可复用的场景资产、空间理解能力和交互接口,就会从内容工具变成基础设施。

高德3D城市世界模型与AI空间生成
配图依据:文章核心新闻点是高德ABot-Earth0.5推动城市级3D世界模型生成,视觉主体选择未来城市三维建模、空间网格与AI计算界面。

3D资产生产正在提速

世界模型要进入真实应用,离不开更快、更便宜的3D资产生产。中科院计算所联合ETH Zurich提出Fast-SAM3D,强调单图生成3D资产时,同等质量下单对象生成提速2.67倍,场景生成提速2.01倍。这个方向虽然不像大模型发布会那样吸睛,却是3D AI真正规模化的关键:如果每个物体、房间、街区都需要漫长建模,世界模型就无法快速扩张。

NeRF之父级研究者Ben Mildenhall和Pratul Srinivasan获得ACM Grace Hopper奖,也把这条技术脉络重新拉回公众视野。NeRF曾经证明,多角度照片可以重建逼真三维场景,为后来的3D生成、数字孪生和空间计算打下基础。现在,从NeRF到3DGS,再到各种单图3D化和场景生成模型,技术路线的共同目标都是让AI更快把二维信息转成可用三维空间。

机器人需要可训练的世界

世界模型的另一个关键出口,是机器人训练。大晓机器人联合港中文MMLab发布Kairos-Homeworld,开源30万套中国住宅户型和5000个可交互3D家庭场景,目的就是让机器人能在虚拟环境里练习家务、导航和物体交互。对具身智能来说,数据不是简单越多越好,而是要覆盖足够真实、足够复杂、足够贴近实际家庭和工作场景的空间变化。

这与高德城市模型形成了有趣呼应:一个面向城市级空间,一个面向家庭级交互。前者可能服务导航、出行、城市管理和本地生活,后者可能服务家务机器人、仓储机器人和工业自动化。机器人真正走进现实世界之前,需要在虚拟世界里经历大量低成本试错;世界模型越接近真实,机器人从仿真迁移到现实的成本就越低。

应用入口正在扩大

世界模型的商业化不会只靠“生成城市”四个字完成,它需要和开发工具、内容平台、地图服务、游戏引擎、机器人系统和企业数据结合。AI游戏项目从“一句话生成Demo”转向理解游戏世界和进入开发流程,说明创作者已经不满足于临时玩具,而希望AI参与真正的生产链条。高德、知天下、AI游戏平台和3D资产工具如果继续靠近,未来可能出现更轻量的虚拟城市、数字景区、品牌空间和交互式教学场景。

这里也会出现新的竞争问题。地图公司有真实地理数据和位置入口,视觉模型公司有生成能力,游戏和机器人公司有交互需求,云厂商和芯片公司则掌握算力成本。世界模型一旦从演示走向应用,竞争就不再是谁的视频更漂亮,而是谁能把数据授权、空间一致性、实时渲染、成本控制和开发者生态同时做好。它会是一场系统工程,而不是单点模型能力的胜负。

空间AI要补上可信边界

城市级世界模型越强,越需要处理可信边界。城市道路、建筑外观、商业地点和公共空间都不是普通素材,涉及地图数据、隐私保护、版权归属和现实安全。AI可以帮助生成城市,也可能制造错误的道路关系、虚假的空间信息或不合规的数字资产。对地图和城市服务来说,漂亮画面只是第一步,可靠、可校验、可追责才是长期使用的前提。

因此,ABot-Earth0.5带来的真正看点,不只是“把地球玩成了游戏”,而是城市空间数据正在被AI重新组织。未来的AI应用可能不再只打开一个聊天框,而是进入一个可操作的城市、房间、工厂或实验室。文字模型让AI会说话,图像和视频模型让AI会表达,世界模型则让AI开始拥有可计算的空间。下一阶段,谁能把空间生成做得又快、又准、又能接入真实业务,谁就更可能拿到AI落地的新入口。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容