< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

AI原生时代下,让世界适应Agent,而非教AI做人 | 港大黄超@AIGC2026

CLI更像是Agent的母语

编辑部 整理自 2026中国AIGC产业峰会

量子位 | 公众号 QbitAI

Agent时代,究竟需要什么样的基础设施?

港大助理教授黄超给出的答案是:

不是让Agent不停地适应人,而是为Agent重新设计数字世界。

在2026中国AIGC产业峰会上,黄超系统梳理了他过去两年多围绕AI Agent的思考与实践。

他的团队做的第一件事,是

把Agent做“轻”做“薄”

看到OpenClaw发布时有43万行代码(现在已经超过100万行),他们反其道而行之,用最轻量化的方式开源了通用Agent——

结果关注度远超预期,连续100天日更迭代,下载量突破20万次,被DeepSeek推荐为全球15个Agent之一,也曾登上OpenRouter平台通用Agent榜单第四名。

接下来他们计划用nanobot挑战更复杂的长程任务,验证Agent在真实生产环境中的持续执行能力。

这里的长程任务不仅指运行时间长,更关键是任务链路复杂——需要跨越多个软件生态、调用异构工具组合,要求Agent具备跨领域协调和持续决策的综合能力。

这反映了他们对Agent能力边界的深度思考:真正的生产力Agent不能只停留在对话和代码生成,而要能够熟练操控复杂软件生态,在动态环境中自我进化,并在集群协作中创造价值。

基于将Agent从“AI助手”升级为“数字劳动力”的愿景,他们提出了

CLI-Anything

与其让Agent费力学习人类界面,不如让软件原生支持Agent语言

通过将专业软件重新包装为命令行接口,Agent能够直接驱动3D建模、设计工具、多媒体编辑等原本需要人类大量学习成本的复杂应用。

相比GUI,CLI可能才是真正AI原生的Computer Use方式。

这不是技术选择,而是交互范式的根本重构——从让AI适应人类工具,转向让数字世界说AI的语言。

除了Agent-native接口这一基础设施,他们团队同样重视Agent自进化能力的构建。毕竟,仅有好的接口还不够,Agent还需要在使用过程中持续学习和自我优化。

黄超指出,当前自进化研究主要分为Internal和External两个方向。

Internal模式专注于优化Agent内核——升级框架、调整参数、改进推理链路,但这种内向型进化往往困于特定场景,难以实现真正的跨域迁移。

相比之下,External模式采用技能积累策略,通过不断扩充和优化工具库,逐步构建具有协同效应的Agent生态。

这种外向型进化更符合”重新设计数字世界”的理念——不是让单个Agent变得更聪明,而是让整个Agent网络变得更强大。

为验证这种协同进化模式的可行性,他们设计了一个AI自动化科研实验:

让8个Agent协调8张H100显卡进行分布式模型训练

实验结果证实,在合理的任务分发架构下,Agent集群确实能够显著提升生产效率。

但当他们进一步扩展Agent规模时,边际收益开始递减,甚至出现协调开销超过性能增益的临界点。

这说明Agent Swarm的Scaling Law远比想象中复杂,可能存在一个最优的临界规模,超过这个阈值反而会产生负收益。

如何找到这个平衡点,仍然是重新设计Agent协作生态的核心挑战。

为了完整体现黄超的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。

2026中国AIGC产业峰会是由量子位主办的行业峰会,近20位产业代表与会讨论。线下参会观众超千人,线上直播观众近400万,获得了主流媒体的广泛关注与报道。

Agent的核心架构本质上是一个优雅的ReAct循环

:通过reasoning进行任务规划,action执行具体工具调用,然后基于环境feedback调整策略。通用Agent的能力并非全来自复杂的架构设计,而是来自推理、执行、反馈这一基本认知循环的有效实现。

ReAct架构的泛化性源自其模块化解耦:reasoning处理抽象推理,action负责具体执行,observation提供环境反馈。Agent面对新任务时,通过重组已有的推理策略和行动原语来适应新环境,实现真正的跨域泛化能力。

长程任务的本质挑战不在于执行时间,而在于复杂性的指数级增长。成功的Agent不是避免错误,而是预期错误并实现优雅降级,能够主动设计、持续监控和动态优化整个执行过程,这正是将AI助手升级为强生产力协作者的核心所在。

Agent需要learning from real tasks,在错误中不断学习、感知自己错在哪里,才能真正节约Token成本。这揭示了一个核心矛盾:

作者 gjqs