OpenSquilla把一个过去很容易被忽视的问题推到了台前:当企业开始让Agent连续读文档、调用工具、写代码、处理流程时,真正压垮预算的往往不是单次模型价格,而是运行过程中不断膨胀的上下文、重复检索、无效尝试和缺乏约束的工具调用。这个由上海基元律动开发的开源Agent Harness框架,试图把智能体从“能跑起来”推进到“跑得可控、算得清、交付得稳”。披露信息显示,它希望通过路由、上下文管理和执行框架降低Agent不必要的token消耗,相关成本优化幅度已经足以让资本把它看成一类新的基础设施。
这件事的意义不只在省钱。Lovable用无代码软件生成工具拿到更高估值,腾讯推出智能体社区“虾友会”,Boson AI与SGLang把Higgs Audio v3 TTS推向实时可控语音智能体,OpenAI和Thrive把AI报税系统推进后台流程,说明AI产品正在从聊天框走向持续执行。越是进入真实工作流,越需要有人回答一个朴素问题:Agent到底该怎样组织、怎样记忆、怎样选择工具、怎样避免把成本烧在无效动作上。
成本开始变成产品能力
过去评价大模型应用,很多人习惯先看模型榜单、响应速度和演示效果。但Agent进入真实业务后,成本本身就变成了产品能力。一个能完成任务但每次都要长上下文反复塞满、工具调用多次失败、检索结果越堆越乱的Agent,在演示现场也许还能看起来很聪明,一旦放进企业日常流程,就会迅速变成账单压力和可靠性风险。
OpenSquilla所强调的路由成本下降、上下文管理降本,本质上是在给Agent补“运行时工程”。同一个任务,并不一定需要每一步都调用最贵、最强的大模型;同一段历史,也不应该无限制塞回上下文;同一组工具,也需要根据任务阶段、风险等级和输出要求做选择。企业真正需要的不是一个偶尔灵光的Agent,而是一个能在预算内稳定完成工作的系统。
Harness成为新底座
Agent Harness可以理解为智能体执行层的脚手架:它不直接替代模型,却决定模型如何被组织起来工作。好的Harness会管理任务拆解、模型路由、工具调用、上下文压缩、记忆读取、错误恢复和结果验收;差的Harness则容易让Agent在复杂任务里自说自话、重复尝试,最后既没有交付结果,又消耗大量token。
这也是OpenSquilla值得关注的地方。开源框架一旦被开发者和企业采用,就可能形成一套围绕Agent运行的工程标准。未来企业比较AI系统时,可能不会只问“你接了哪个模型”,还会问“你的上下文怎么治理”“失败调用怎么回滚”“多模型路由怎么决策”“每个任务的成本能不能审计”。这些问题听起来不如新模型发布刺激,但决定了AI能不能进入长期生产环境。

开发者入口正在改写
Lovable的高估值说明另一个趋势:软件生成正在从专业开发者工具扩展到更广泛的业务人群。用户不写代码也能生成应用,这会把大量原本停留在需求文档里的想法直接推向可运行软件。但无代码生成并不等于没有工程成本,越是让更多人生成应用,越需要底层系统处理权限、数据、部署、测试和后续维护。
OpenSquilla和Lovable看似一个偏底层、一个偏产品入口,其实都在回答同一个问题:AI如何从一次性生成走向持续交付。前者关心Agent运行时的成本和稳定性,后者关心普通用户如何把需求变成软件。当这两类能力结合,企业内部很可能出现新的开发方式:业务人员描述目标,Agent生成初版系统,Harness负责控制执行链路,开发者则把精力放在架构、审查和关键模块上。
智能体生态需要社区
腾讯推出“虾友会”这类智能体社区,也说明AI产品竞争正在从单个工具转向生态运营。一个智能体是否好用,不只取决于模型能力,还取决于用户能不能找到合适玩法、教程、案例和插件。社区的价值在于把分散经验沉淀下来,让用户知道某个Agent适合做什么、不适合做什么,以及遇到问题时该怎样调整工作流。
这对企业AI同样重要。许多AI工具失败,不是因为模型完全不行,而是因为组织内部缺少可复用的流程模板、权限边界和验收标准。智能体社区如果能沉淀真实案例,就能把“个人试用”推进到“团队协作”。但社区越活跃,越需要治理:哪些Agent可以被推荐,哪些提示词和工作流存在风险,哪些生成结果需要人工复核,都不能只靠热度排序决定。
语音与多模态加入执行层
Boson AI与SGLang围绕Higgs Audio v3 TTS推进实时可控语音智能体,代表了Agent形态的另一条路。未来智能体不一定总是以文字聊天呈现,它可能出现在客服、教育、会议、数字人和多语言协作场景里,用语音实时解释、确认和执行任务。语音一旦进入执行层,对延迟、可控性和稳定性的要求会更高,因为用户很难接受一个长时间沉默或反复改口的语音Agent。
这会进一步放大Harness和基础设施的重要性。语音智能体需要实时路由、内容安全、上下文压缩和多语言控制;软件生成Agent需要代码执行、测试和回滚;报税、财务、客服等后台Agent则需要审计、权限和错误追踪。不同场景的表层交互差异很大,但底层都离不开对运行链路的治理。
落地竞争回到工程细节
从OpenSquilla到Lovable,从智能体社区到实时语音,AI应用正在进入一个更务实的阶段。模型能力仍然重要,但企业真正买单的往往是可控交付:能否接入现有系统,能否解释每一步操作,能否限制成本,能否在出错时定位原因,能否让团队持续复用经验。AI如果不能回答这些问题,就很难从演示走进核心流程。
对行业来说,这意味着新的竞争焦点会落在“模型之上”的工程层。谁能把上下文、工具、权限、记忆、成本和验收组织成可靠系统,谁就更有机会承接企业场景。OpenSquilla把烧token的问题摆出来,其实是在提醒所有AI应用开发者:智能体不是越复杂越好,真正有价值的是在合适预算、合适约束和合适风险边界内,把任务稳定完成。












