高德把城市生成带到消费级GPU后，世界模型开始争夺空间入口-速维云

高德发布3D原生城市世界模型ABot-Earth0.5，把“世界模型”这件事从科幻感很强的演示，往可落地的城市级空间生产又推了一步。它支持用图像、文本或3D模型生成城市空间，据报道在消费级GPU上约10分钟就能生成3D城市，效率提升达到千倍级，并覆盖190多个国家和地区。这个信号很明确：AI不只是在屏幕上生成一段视频或一张图，而是开始尝试把道路、建筑、街区、导航、游戏、机器人训练和城市数字化连接成同一套空间底座。

相关资讯里，世界模型企业知天下完成天使轮融资，计算所与ETH Zurich提出单图3D化提速方案，NeRF重要贡献者获得ACM Grace Hopper奖，机器人仿真数据集和家庭场景也在快速扩容。它们看似分散在地图、视觉生成、机器人和3D资产生产里，背后其实是同一条主线：AI正在从“理解文字和图片”，走向“构建可交互、可计算、可训练的空间”。谁能更低成本地生成真实世界，谁就可能掌握下一代AI应用的入口。

城市生成进入新阶段

ABot-Earth0.5最值得关注的地方，是它把城市级3D生成的门槛压到了更低。过去做大规模城市三维建模，往往依赖测绘、航拍、人工建模、游戏引擎资产和长期工程积累，成本高、周期长，也很难快速覆盖不同国家和地区的城市形态。高德这次强调“3D原生城市世界模型”，说明它不是简单把地图贴上三维外壳，而是在尝试让AI理解城市结构本身。

消费级GPU约10分钟生成城市空间的说法，如果后续能稳定兑现，会改变很多行业对三维场景生产的预算预期。游戏团队可以更快搭建原型，影视和广告可以更低成本生成城市背景，导航和本地生活服务可以获得更强的空间表达能力，城市规划和应急推演也有机会从静态图纸走向动态模拟。对普通用户来说，最直观的变化可能是地图不再只是平面路线，而更像一个可进入、可编辑、可理解的城市界面。

世界模型不再只做视频

过去一年，世界模型常常和视频生成绑定在一起：给一段提示词，模型生成一个看起来连续的虚拟世界。但真正能支撑应用的世界模型，不能只让画面好看，还要保持空间关系稳定、物体一致、视角切换可靠，并能被其他系统调用。高德的城市模型之所以重要，是因为地图天然连接真实道路、地点、POI、交通规则和位置服务，它比纯娱乐化场景更接近真实世界的操作入口。

知天下完成天使轮融资，也说明资本仍在押注“中国版World Labs”这类方向。它们要解决的问题不是生成一段炫酷视频，而是把生成式3DGS基模、海外创作者社区和平台化生产结合起来。世界模型如果只停留在短片生成，就很难形成护城河；但如果能沉淀可复用的场景资产、空间理解能力和交互接口，就会从内容工具变成基础设施。

配图依据：文章核心新闻点是高德ABot-Earth0.5推动城市级3D世界模型生成，视觉主体选择未来城市三维建模、空间网格与AI计算界面。

3D资产生产正在提速

世界模型要进入真实应用，离不开更快、更便宜的3D资产生产。中科院计算所联合ETH Zurich提出Fast-SAM3D，强调单图生成3D资产时，同等质量下单对象生成提速2.67倍，场景生成提速2.01倍。这个方向虽然不像大模型发布会那样吸睛，却是3D AI真正规模化的关键：如果每个物体、房间、街区都需要漫长建模，世界模型就无法快速扩张。

NeRF之父级研究者Ben Mildenhall和Pratul Srinivasan获得ACM Grace Hopper奖，也把这条技术脉络重新拉回公众视野。NeRF曾经证明，多角度照片可以重建逼真三维场景，为后来的3D生成、数字孪生和空间计算打下基础。现在，从NeRF到3DGS，再到各种单图3D化和场景生成模型，技术路线的共同目标都是让AI更快把二维信息转成可用三维空间。

机器人需要可训练的世界

世界模型的另一个关键出口，是机器人训练。大晓机器人联合港中文MMLab发布Kairos-Homeworld，开源30万套中国住宅户型和5000个可交互3D家庭场景，目的就是让机器人能在虚拟环境里练习家务、导航和物体交互。对具身智能来说，数据不是简单越多越好，而是要覆盖足够真实、足够复杂、足够贴近实际家庭和工作场景的空间变化。

这与高德城市模型形成了有趣呼应：一个面向城市级空间，一个面向家庭级交互。前者可能服务导航、出行、城市管理和本地生活，后者可能服务家务机器人、仓储机器人和工业自动化。机器人真正走进现实世界之前，需要在虚拟世界里经历大量低成本试错；世界模型越接近真实，机器人从仿真迁移到现实的成本就越低。

应用入口正在扩大

世界模型的商业化不会只靠“生成城市”四个字完成，它需要和开发工具、内容平台、地图服务、游戏引擎、机器人系统和企业数据结合。AI游戏项目从“一句话生成Demo”转向理解游戏世界和进入开发流程，说明创作者已经不满足于临时玩具，而希望AI参与真正的生产链条。高德、知天下、AI游戏平台和3D资产工具如果继续靠近，未来可能出现更轻量的虚拟城市、数字景区、品牌空间和交互式教学场景。

这里也会出现新的竞争问题。地图公司有真实地理数据和位置入口，视觉模型公司有生成能力，游戏和机器人公司有交互需求，云厂商和芯片公司则掌握算力成本。世界模型一旦从演示走向应用，竞争就不再是谁的视频更漂亮，而是谁能把数据授权、空间一致性、实时渲染、成本控制和开发者生态同时做好。它会是一场系统工程，而不是单点模型能力的胜负。

空间AI要补上可信边界

城市级世界模型越强，越需要处理可信边界。城市道路、建筑外观、商业地点和公共空间都不是普通素材，涉及地图数据、隐私保护、版权归属和现实安全。AI可以帮助生成城市，也可能制造错误的道路关系、虚假的空间信息或不合规的数字资产。对地图和城市服务来说，漂亮画面只是第一步，可靠、可校验、可追责才是长期使用的前提。

因此，ABot-Earth0.5带来的真正看点，不只是“把地球玩成了游戏”，而是城市空间数据正在被AI重新组织。未来的AI应用可能不再只打开一个聊天框，而是进入一个可操作的城市、房间、工厂或实验室。文字模型让AI会说话，图像和视频模型让AI会表达，世界模型则让AI开始拥有可计算的空间。下一阶段，谁能把空间生成做得又快、又准、又能接入真实业务，谁就更可能拿到AI落地的新入口。

文章版权归作者所有，未经允许请勿转载。

THE END