OpenSquilla估值升温后，AI Agent竞争从模型能力转向运行成本-速维云

OpenSquilla把一个过去很容易被忽视的问题推到了台前：当企业开始让Agent连续读文档、调用工具、写代码、处理流程时，真正压垮预算的往往不是单次模型价格，而是运行过程中不断膨胀的上下文、重复检索、无效尝试和缺乏约束的工具调用。这个由上海基元律动开发的开源Agent Harness框架，试图把智能体从“能跑起来”推进到“跑得可控、算得清、交付得稳”。披露信息显示，它希望通过路由、上下文管理和执行框架降低Agent不必要的token消耗，相关成本优化幅度已经足以让资本把它看成一类新的基础设施。

这件事的意义不只在省钱。Lovable用无代码软件生成工具拿到更高估值，腾讯推出智能体社区“虾友会”，Boson AI与SGLang把Higgs Audio v3 TTS推向实时可控语音智能体，OpenAI和Thrive把AI报税系统推进后台流程，说明AI产品正在从聊天框走向持续执行。越是进入真实工作流，越需要有人回答一个朴素问题：Agent到底该怎样组织、怎样记忆、怎样选择工具、怎样避免把成本烧在无效动作上。

成本开始变成产品能力

过去评价大模型应用，很多人习惯先看模型榜单、响应速度和演示效果。但Agent进入真实业务后，成本本身就变成了产品能力。一个能完成任务但每次都要长上下文反复塞满、工具调用多次失败、检索结果越堆越乱的Agent，在演示现场也许还能看起来很聪明，一旦放进企业日常流程，就会迅速变成账单压力和可靠性风险。

OpenSquilla所强调的路由成本下降、上下文管理降本，本质上是在给Agent补“运行时工程”。同一个任务，并不一定需要每一步都调用最贵、最强的大模型；同一段历史，也不应该无限制塞回上下文；同一组工具，也需要根据任务阶段、风险等级和输出要求做选择。企业真正需要的不是一个偶尔灵光的Agent，而是一个能在预算内稳定完成工作的系统。

Harness成为新底座

Agent Harness可以理解为智能体执行层的脚手架：它不直接替代模型，却决定模型如何被组织起来工作。好的Harness会管理任务拆解、模型路由、工具调用、上下文压缩、记忆读取、错误恢复和结果验收；差的Harness则容易让Agent在复杂任务里自说自话、重复尝试，最后既没有交付结果，又消耗大量token。

这也是OpenSquilla值得关注的地方。开源框架一旦被开发者和企业采用，就可能形成一套围绕Agent运行的工程标准。未来企业比较AI系统时，可能不会只问“你接了哪个模型”，还会问“你的上下文怎么治理”“失败调用怎么回滚”“多模型路由怎么决策”“每个任务的成本能不能审计”。这些问题听起来不如新模型发布刺激，但决定了AI能不能进入长期生产环境。

AI Agent从模型调用走向运行框架、上下文治理与成本控制。

开发者入口正在改写

Lovable的高估值说明另一个趋势：软件生成正在从专业开发者工具扩展到更广泛的业务人群。用户不写代码也能生成应用，这会把大量原本停留在需求文档里的想法直接推向可运行软件。但无代码生成并不等于没有工程成本，越是让更多人生成应用，越需要底层系统处理权限、数据、部署、测试和后续维护。

OpenSquilla和Lovable看似一个偏底层、一个偏产品入口，其实都在回答同一个问题：AI如何从一次性生成走向持续交付。前者关心Agent运行时的成本和稳定性，后者关心普通用户如何把需求变成软件。当这两类能力结合，企业内部很可能出现新的开发方式：业务人员描述目标，Agent生成初版系统，Harness负责控制执行链路，开发者则把精力放在架构、审查和关键模块上。

智能体生态需要社区

腾讯推出“虾友会”这类智能体社区，也说明AI产品竞争正在从单个工具转向生态运营。一个智能体是否好用，不只取决于模型能力，还取决于用户能不能找到合适玩法、教程、案例和插件。社区的价值在于把分散经验沉淀下来，让用户知道某个Agent适合做什么、不适合做什么，以及遇到问题时该怎样调整工作流。

这对企业AI同样重要。许多AI工具失败，不是因为模型完全不行，而是因为组织内部缺少可复用的流程模板、权限边界和验收标准。智能体社区如果能沉淀真实案例，就能把“个人试用”推进到“团队协作”。但社区越活跃，越需要治理：哪些Agent可以被推荐，哪些提示词和工作流存在风险，哪些生成结果需要人工复核，都不能只靠热度排序决定。

语音与多模态加入执行层

Boson AI与SGLang围绕Higgs Audio v3 TTS推进实时可控语音智能体，代表了Agent形态的另一条路。未来智能体不一定总是以文字聊天呈现，它可能出现在客服、教育、会议、数字人和多语言协作场景里，用语音实时解释、确认和执行任务。语音一旦进入执行层，对延迟、可控性和稳定性的要求会更高，因为用户很难接受一个长时间沉默或反复改口的语音Agent。

这会进一步放大Harness和基础设施的重要性。语音智能体需要实时路由、内容安全、上下文压缩和多语言控制；软件生成Agent需要代码执行、测试和回滚；报税、财务、客服等后台Agent则需要审计、权限和错误追踪。不同场景的表层交互差异很大，但底层都离不开对运行链路的治理。

落地竞争回到工程细节

从OpenSquilla到Lovable，从智能体社区到实时语音，AI应用正在进入一个更务实的阶段。模型能力仍然重要，但企业真正买单的往往是可控交付：能否接入现有系统，能否解释每一步操作，能否限制成本，能否在出错时定位原因，能否让团队持续复用经验。AI如果不能回答这些问题，就很难从演示走进核心流程。

对行业来说，这意味着新的竞争焦点会落在“模型之上”的工程层。谁能把上下文、工具、权限、记忆、成本和验收组织成可靠系统，谁就更有机会承接企业场景。OpenSquilla把烧token的问题摆出来，其实是在提醒所有AI应用开发者：智能体不是越复杂越好，真正有价值的是在合适预算、合适约束和合适风险边界内，把任务稳定完成。

文章版权归作者所有，未经允许请勿转载。

THE END