
随着 25 年 LLM 的智能进一步提升，大模型应用场景经历了从“被动响应”到“自主演进”的范式转换， Agent 架构逐渐流行起来， 
从 Q1 开始，团队内部就不断的探索大模型 Agent 的研发范式，能力边界，和相关的实践落地，并最终取得以下成就:

- Hero 通用智能体：对标 Manus 等通用智能体框架，基于 ReAct + ToolCall 深度协同架构，集成了 Agent Computer Interface (ACI) 沙盒。智能体具备跨文件操作、自主网页浏览及代码闭环执行能力，打通了从“数字感知”到“环境干预”的链路，为团队沉淀了一套标准化的 Agent 开发规范。

- Hero Agent Package：后续为了探索 Agent 能力上限，团队内部自主研发出 Hero 智能体框架，相较于其他厂商的智能体框架，具有更高的移植扩展性，可靠性，并可以针对具体领域进行深度改造和研发；并最终于Gaia Validation榜单5月份TOP1

- 复刻 Alpha Evolve, Stanford Fast Kernel：五月份 Alpha Evolve 发布了自主进化框架，进一步提高了大模型在实际场景上的能力上限，团队针对其框架设计和能力边界表现，使用 Hero 框架最终复刻出其自助编程，评估和进化能力，实现了单机环境对论文中大规模集群进化能力的平替，在部分评测维度上超越原论文分值。后续依靠 Hero Core 框架，同时延伸至 Stanford Fast Kernel 等项目，验证了 Hero 框架在自主进化场景下的泛化性。

- 伐谋项目子 Agent，IDG 自动驾驶项目 Agent 探索，架构工程组 Coding Agent 探索：验证 Hero Agent 能力后，通过进一步通用化架构能力，并在各个领域进行持续的垂类能力增强，先后在伐谋 Agent，IDG 自动驾驶项目，AI 计算部 Coding Agent Benchmark 等项目中，实践并落地 Hero Agent。

- P800/GPU训推任务诊断：依赖 Hero Core 的自助规划，行动和反思能力，针对 P800 和 GPU 训推阶段出现的精度问题，增加 Hero Agent 自主实验，代码检查，调用链分析，代码修改，动态环境变量等能力，持续优化 Agent 在实际开发环境中的提效能力，并在训推场景下的过往 Case 和现有 Case 中展示出其能力。