OpenRouter披露的模型调用数据,把中国大模型这轮竞争从“谁的参数更大、跑分更高”拉到了更直接的问题上:谁正在被真实调用,谁能把能力变成稳定、便宜、可接入的生产力。数据显示,上周全球AI大模型总调用量达到44.6万亿Token,中国大模型周调用量达到18.42万亿Token,已经连续七周居全球首位,前五名中有四款来自中国模型。

这组数字的分量不只在规模。Token调用量本质上是用户、开发者、企业流程和应用生态共同投票的结果。一个模型可以靠发布会获得关注,也可以靠榜单获得讨论,但持续调用意味着它进入了聊天、代码、办公、内容生产、政务、电商、文档解析和自动化流程。中国模型正在从“能不能追上前沿能力”转向“能不能被高频、低成本、稳定地用起来”。
调用量成为新信号
过去一年,大模型行业很喜欢讨论参数规模、上下文长度、数学推理、编程榜单和多模态能力,这些指标当然重要,但它们更像是模型公司的技术体检表。调用量不同,它更接近市场温度计:只有当模型价格、速度、可用性、API稳定性和生态适配都达到一定水平,开发者才会把真实任务交给它。
中国大模型周调用量达到18.42万亿Token,说明底层需求已经不是零散试用。对开发者来说,调用量高意味着模型在更多工作流中被反复验证;对企业来说,调用量高意味着单位成本可能被进一步摊薄;对模型厂商来说,调用量高也意味着必须面对更现实的工程问题,例如限流、延迟、上下文成本、推理峰值和服务可靠性。
国产模型进入密集上新
在同一批最新资讯里,MiniMax M3升至调用量榜单前列,智谱GLM-5.2正式发布并强调开源、753B参数和1M稳定上下文,DeepSeek首轮融资继续引发行业关注,PaddleOCR以小模型精度反超GPT-5.5的消息也在开发者圈传播。它们不完全属于同一条产品线,却共同构成了国产AI生态的几个关键层次:通用模型、长上下文模型、低成本调用、文档理解和工程工具。
这意味着竞争已经不是单个模型之间的孤立较量。一个开发者要做企业知识库,可能需要长上下文模型;要做票据、PDF和图片解析,可能需要OCR与视觉语言模型;要做客服、运营或内部流程自动化,还需要Agent框架、权限系统和数据接口。国产模型如果能在这些环节形成组合,就不只是“某个模型很强”,而是能支撑一套可落地的应用栈。
企业入口开始变多
广东上线省级政务智能中枢平台“湾擎”,小米推出云端办公Agent产品Xiaomi MiMo Claw,Zleap预售本地部署企业Agent一体机,LangChain团队用GTM Agent改进销售营销流程,这些消息说明AI应用正在从个人聊天框继续向组织流程移动。模型调用量上升,很可能与这类企业场景扩张互相推动。
企业真正关心的不是模型会不会聊天,而是它能不能读懂文档、调用系统、生成报告、跟踪客户、协助审批、整理数据,并且在权限、日志和责任边界内运行。政务办公、企业销售、文档协作和本地一体机的共同点,是把AI从“问答工具”改造成“流程节点”。一旦AI进入流程,Token消耗就会变成持续发生的基础成本。
开源与成本仍是关键
GLM-5.2的开源定位、MiniMax M3的调用表现、PaddleOCR的轻量化能力,都指向一个现实:真正大规模使用AI,不能只依赖少数昂贵闭源模型。企业和开发者会根据任务复杂度选择不同模型,有些任务需要最强推理,有些任务只需要稳定抽取、总结、改写、分类或代码辅助。
这也是为什么“便宜且够用”会成为非常强的竞争力。当大量任务从人工转向AI,成本会被放大到每一天、每一个部门、每一条工作流。模型厂商既要证明能力上限,也要证明单位Token的价值;应用厂商则需要把不同模型放进同一套调度系统里,让高难任务用强模型,普通任务用低成本模型,最终把AI账单控制在可接受范围内。
世界模型和机器人提供新变量
除了语言模型,世界模型和机器人也在变成这轮AI竞争的重要侧面。中国团队Mogo推出高动态物理交互世界模型Magpie 1.0,达摩院联合高校推出WorldOlympiad评测基准,Genesis AI发布三折叠机器人Eno,具身智能数据基础设施公司刻行时空完成新融资。这些消息说明AI不再只围绕文本与代码扩张,而是在尝试理解物理世界、模拟物理过程,并进入机器人本体。
这类方向短期内未必贡献最高调用量,却可能决定下一阶段的应用入口。世界模型需要视频、空间、动作和物理一致性;机器人需要感知、规划、控制和数据闭环。它们对算力和模型能力的要求很高,也会催生新的数据服务、仿真平台和评测标准。如果说大语言模型正在占领办公与软件流程,那么世界模型和具身智能正在为AI进入工厂、仓储、家庭和真实空间打底。
热闹之外也有风险
行业热度升高,也带来了不少反讽式新闻。溜溜梅因为股票简称LLM与大语言模型缩写撞名,在港股上市首日被炒成AI概念股;xAI员工误删三周训练数据,暴露出高速扩张中的工程管理风险;有人花费上亿Token横评顶尖模型,也说明用户正在用真金白银寻找可靠答案。这些边角新闻看似花边,却能提醒行业不要只看叙事。
AI越走向真实调用,就越需要补齐基础工程。训练数据要可追溯,生产系统要有备份,模型评测要贴近真实任务,企业采购要看实际ROI,资本市场也要区分真正的AI业务和蹭概念。调用量可以证明需求,但不能自动证明利润;模型能力可以吸引用户,但不能自动保证交付。接下来真正拉开差距的,可能是成本控制、工程可靠性和生态整合能力。
从追赶到使用
18.42万亿Token的意义,在于它让中国大模型竞争出现了一个更清晰的判断维度:不只是有没有顶级模型,而是有没有足够多的真实任务愿意持续使用这些模型。通用模型、开源模型、OCR、Agent、一体机、政务平台、世界模型和机器人正在共同组成一个更复杂的生态。
这也解释了为什么AI行业的竞争正在变得更务实。发布更强模型仍然重要,但用户最终会用脚投票:谁更稳定,谁更便宜,谁更容易接入,谁能解决真实业务问题,谁就会获得更多调用。中国模型连续领跑调用量,不代表竞争结束,而是说明下一阶段已经开始——从追赶参数和榜单,进入争夺真实工作流、真实成本和真实交付的阶段。











