<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>程默的博客 &#187; 代理循环</title>
	<atom:link href="http://blog.chacuo.net/tag/%e4%bb%a3%e7%90%86%e5%be%aa%e7%8e%af/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.chacuo.net</link>
	<description>web原理、web架构、web安全、web性能、服务器性能、服务器架构、服务器安全;你不能预知明天，但你可以利用今天。你不能样样顺利，但你可以事事尽力!</description>
	<lastBuildDate>Wed, 01 Jul 2026 14:52:01 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>AI Agent Loops 最新进展：所有 Agent 都在&#8221;循环&#8221;，但只有少数在&#8221;学习&#8221;</title>
		<link>http://blog.chacuo.net/1535.html</link>
		<comments>http://blog.chacuo.net/1535.html#comments</comments>
		<pubDate>Tue, 30 Jun 2026 13:37:41 +0000</pubDate>
		<dc:creator>程默</dc:creator>
				<category><![CDATA[ai]]></category>
		<category><![CDATA[Agent Loop]]></category>
		<category><![CDATA[AI Agent Loops]]></category>
		<category><![CDATA[Andrew Ng]]></category>
		<category><![CDATA[AutoGPT]]></category>
		<category><![CDATA[Claude Code]]></category>
		<category><![CDATA[Codex CLI]]></category>
		<category><![CDATA[CrewAI]]></category>
		<category><![CDATA[Hermes Agent]]></category>
		<category><![CDATA[LangGraph]]></category>
		<category><![CDATA[motoagent]]></category>
		<category><![CDATA[motoagent.net]]></category>
		<category><![CDATA[Reflexion]]></category>
		<category><![CDATA[代理循环]]></category>
		<category><![CDATA[学习回路]]></category>
		<category><![CDATA[智能体循环]]></category>
		<category><![CDATA[自改进循环]]></category>

		<guid isPermaLink="false">http://blog.chacuo.net/?p=1535</guid>
		<description><![CDATA[一、AI Agent Loops 已经成为行业共识 如果说 2024 年是&#34;AI Agent 元年&#038; [...]]]></description>
				<content:encoded><![CDATA[<h2>一、AI Agent Loops 已经成为行业共识</h2>
<p>如果说 2024 年是&quot;AI Agent 元年&quot;，那 2025 年到 2026 年就是&quot;AI Agent Loops 普及年&quot;。现在几乎所有的 AI Agent 产品都在谈论&quot;循环&quot;——让代理不仅仅是回答一次问题，而是进入一个持续迭代的执行流程。</p>
<p>这个共识的形成，主要来自几个里程碑事件：</p>
<p>1. <strong>Andrew Ng 的 Agentic Design Patterns</strong>（2024 年 3 月）：系统化提出反思、工具使用、规划、多代理协作四大模式，用数据证明 Agent 循环可以让 GPT-3.5 的编码能力超过 GPT-4</p>
<p>2. <strong>Reflexion 论文</strong>（Noah Shinn 等，2023）：开创了&quot;语言强化学习&quot;方法，智能体通过语言反馈在试错中学习</p>
<p>3. <strong>Anthropic 的 Building effective agents</strong>（2024 年 12 月）：从 Prompt Chaining 到 Evaluator-Optimizer 到自主 Agent，正式将 Agent 循环纳入主流技术路线</p>
<p>4. <strong>Auto-GPT 的无限循环模式</strong>：最早将 LLM-in-a-loop 推向主流的产品</p>
<p>到了 2026 年，几乎没有哪个正经的 AI Agent 产品敢说自己不支持循环。但问题来了——大家都是怎么&quot;循环&quot;的？效果一样吗？</p>
<p>访问 <a href="https://motoagent.net/" target="_blank">MotoAgent</a> 了解真正的带学习回路的 Agent 循环。</p>
<h2>二、&quot;循环&quot;和&quot;学习&quot;是两回事</h2>
<p>在深入各家产品之前，我们需要先厘清一个关键区别：</p>
<p><strong>执行循环 vs 学习循环</strong></p>
<table style="border-collapse:collapse;border:1px solid #d0d0d0;width:100%;margin:10px 0;">
<tr>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">对比维度</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">执行循环</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">学习循环</th>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">工作方式</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">反复执行相同流程</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">每次循环后总结经验</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">跨会话</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">每次从零开始</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">记忆和技能持续积累</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">改进机制</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">无</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">自动创建和优化技能</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">效果变化</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">始终不变</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">越用越好</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">代表产品</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">AutoGPT、Claude Code</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">Hermes Agent（Nous Research）</td>
</tr>
</table>
<p>很多所谓支持&quot;Agent Loop&quot;的产品，实际上只是把 LLM 放在一个循环里反复调用——每次执行同样的步骤，无法积累经验，下次遇到同样的问题还是从头再来。这不是真正的&quot;学习&quot;，只是&quot;重复&quot;。</p>
<p>而真正意义上的 AI Agent Loops，应该是：<strong>每次循环都有信息沉淀下来，下次循环变得更好</strong>。</p>
<h2>三、各主流产品的 Loop 实现情况</h2>
<p>现在市面上主流 AI Agent 产品的 Loop 实现情况究竟如何？我们来逐一分析。</p>
<h3>Hermes Agent（Nous Research）—— 唯一内置完整学习回路</h3>
<p>Hermes Agent 是目前唯一一个真正实现了&quot;学习循环&quot;的主流 Agent。它的循环机制是：</p>
<p>1. <strong>执行阶段</strong>：完成任务，调用工具，生成输出</p>
<p>2. <strong>后台回顾</strong>：每次对话结束后，自动运行自改进回顾</p>
<p>3. <strong>记忆写入</strong>：将有用的信息自动存入 MEMORY.md 或 USER.md</p>
<p>4. <strong>技能创建</strong>：从成功完成的任务中创建可复用的技能</p>
<p>5. <strong>技能改进</strong>：下次使用技能时，自动修正和优化</p>
<p>6. <strong>策展归档</strong>：长时间不用的技能自动归档</p>
<p>这套机制确保了每完成一次任务，Agent 的能力就有一点点提升。在 <a href="https://motoagent.net/" target="_blank">MotoAgent</a> 中使用的就是 Hermes Agent 后端。</p>
<h3>Claude Code（Anthropic）—— 执行循环，无学习能力</h3>
<p>Claude Code 支持 Evaluator-Optimizer 模式，可以在执行过程中反复评估和优化输出。但它没有跨会话的记忆和技能积累机制，每次会话都是独立的。属于&quot;执行循环&quot;范畴。</p>
<h3>Codex CLI（OpenAI）—— 执行循环，会话级上下文</h3>
<p>Codex CLI 有一个执行器架构，支持 MCP 工具调用循环。但它的记忆仅限于会话级别，不支持跨会话的知识积累。同样属于&quot;执行循环&quot;。</p>
<h3>LangChain / LangGraph —— 框架层支持，需自行构建</h3>
<p>LangGraph 提供了非常灵活的循环编排能力——通过有向图状态机和检查点机制，开发者可以构建各种复杂的循环流程。但它是一个框架，不是开箱即用的产品。你需要自己实现记忆、技能、学习等上层逻辑。</p>
<h3>AutoGPT —— 无限循环的先驱</h3>
<p>AutoGPT 是最早将 LLM-in-a-loop 推向主流的产品。它的核心模式是&quot;目标分解 -&gt; 执行 -&gt; 观察 -&gt; 再执行&quot;的循环。但它的问题是：每次循环之间没有真正的学习发生，长时间运行可能会出现重复和漂移。</p>
<h3>CrewAI —— 多代理协作循环</h3>
<p>CrewAI 的循环体现在多代理之间的协作上——不同角色的代理组成团队，通过层级流程循环完成复杂任务。但在单个代理层面，它没有内置的学习机制。</p>
<h2>四、各产品 Loop 能力对比</h2>
<table style="border-collapse:collapse;border:1px solid #d0d0d0;width:100%;margin:10px 0;">
<tr>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">产品</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">循环类型</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">跨会话记忆</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">技能自我改进</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">后台自动学习</th>
<th style="background:#4a90d9;color:#fff;padding:10px 12px;border:1px solid #3a7bc8;text-align:left;font-weight:600;">循环可控性</th>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">Hermes Agent</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">学习循环</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">是（MEMORY.md + FTS5）</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">是</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">是（每次对话后）</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">高（自然语言管理）</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">Claude Code</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">执行循环</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">否（会话级）</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">中（CLI 控制）</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">Codex CLI</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">执行循环</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">否（会话级）</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">中（CLI 控制）</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">LangGraph</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">框架，可构建</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">需自行实现</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">需自行实现</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">需自行实现</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">高（开发者控制）</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">AutoGPT</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">执行循环</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">有限（平台层）</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;">低（易漂移）</td>
</tr>
<tr>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">CrewAI</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">协作循环</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">需外部存储</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">否</td>
<td style="padding:8px 12px;border:1px solid #e0e0e0;background:#f4f6f8;">中（配置驱动）</td>
</tr>
</table>
<p>从对比可以清楚地看到：支持&quot;执行循环&quot;的产品很多，但真正支持&quot;学习循环&quot;的只有 Hermes Agent 一个。</p>
<h2>五、为什么学习循环这么难实现</h2>
<p>你可能会问：既然学习循环这么好，为什么其他产品不做？</p>
<p>原因有几个：</p>
<p><strong>1. 技术复杂度高</strong></p>
<p>学习循环不是简单的&quot;存个历史记录&quot;，而是需要一整套基础设施：</p>
<ul>
<li>持久化记忆系统（什么该记、什么不该记）</li>
<li>技能生成和评估机制（怎么判断一个经验值得固化）</li>
</ul>
<ul>
<li>记忆压缩和合并（记忆空间有限，需要去重和合并）</li>
<li>跨会话检索（如何找到几个月前的相关经验）</li>
</ul>
<p><strong>2. 成本控制挑战</strong></p>
<p>每次对话后都运行后台回顾，意味着额外的 LLM 调用成本。Hermes Agent 在这方面做了精妙的设计——可以配置使用更便宜的模型来做回顾，同时利用缓存减少开销。</p>
<p><strong>3. 学习质量难以保证</strong></p>
<p>不是所有经验都值得学习。如果 Agent 学到了错误的东西，反而会降低后续的表现。这就需要一套有效的评估和策展机制——也就是 Hermes Agent 的&quot;技能策展&quot;系统，30 天未使用的技能自动标记为陈旧，90 天自动归档。</p>
<h2>六、MotoAgent 让 AI Loops 变得人人可用</h2>
<p>虽然 AI Agent Loops 是个技术性很强的概念，但在 <a href="https://motoagent.net/" target="_blank">MotoAgent</a> 中，你不需要理解这些底层原理就能享受它带来的好处。</p>
<p>在 MotoAgent 中创建一个 Agent，选择 Hermes 后端：</p>
<ul>
<li>做过的事情会被记住——不需要重复交代</li>
<li>做过的任务会变成技能——下次更快更好</li>
</ul>
<ul>
<li>对话越多进步越大——越用越聪明</li>
</ul>
<p>MotoAgent 把 Hermes Agent 的学习循环能力和微信、飞书等日常通讯工具结合在了一起。你不需要懂技术，只需要像聊天一样跟它说话，它就会在每一次对话中变得更懂你。</p>
<h2>七、总结</h2>
<p>AI Agent Loops 已经从实验室概念变成了行业共识。几乎所有主流 Agent 产品都在做&quot;循环&quot;，但大多数还停留在&quot;执行循环&quot;的层面——不断地重复，但没有真正的成长。</p>
<p>真正的 AI Loops，应该是&quot;学习循环&quot;——每循环一次，Agent 就进步一点。目前在这个方向上走得最远的就是 Nous Research 的 Hermes Agent，而 <a href="https://motoagent.net/" target="_blank">MotoAgent</a> 让每个人都能轻松地用上这个能力。</p>
<p>如果你还在用&quot;没有记忆、不会成长的 AI&quot;，是时候升级了。下载 MotoAgent，创建一个 Hermes Agent，和它聊上几天——你会感受到什么叫真正的&quot;越用越聪明&quot;。</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.chacuo.net/1535.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
