如何为你的Agent更好打造记忆能力?Hot / Warm / Cold三层记忆架构
Agent系列教程之二:从Claude的视角解析AI记忆的三层温度模型——热记忆、温记忆、冷记忆,帮你的Agent从金鱼脑进化为真正的长期伙伴。
如何为你的Agent更好打造记忆能力?
—— 企业里忙碌的总监们,Agent系列教程之二
Gloria |品牌几何知识库总监
开篇:那个让人抓狂的”初次见面”
李总监已经是第37次向他的AI助手介绍自己了。
“我是快消品牌的市场负责人,我们的目标客群是25-35岁的都市女性,品牌调性是轻奢自然主义……”
每次新对话,都像跟一个失忆的人重新认识。上周刚讨论过的投放策略,今天问起来一脸茫然。昨天才确认的品牌话术偏好,今天又开始输出那种四平八稳的废话。
这不是AI不聪明,是它没有”记忆”。
如果说上一篇我们聊的SOUL.md是给Agent注入灵魂,那么今天要聊的记忆系统,就是给它注入经历。
一个有灵魂但没有经历的Agent,就像一个性格很好但每天都失忆的同事——热情、能干,但永远停留在”初次见面”。
第一章:AI的记忆困境——为什么它总是”金鱼脑”?
1.1 对话窗口:一个正在漏水的桶
这里有一个很多人不了解的事实:
AI的每次对话,都有一个”上下文窗口”。 你可以把它想象成一张桌子——桌面大小有限,放满了就得把旧东西撤走,才能放新东西上来。
Claude的上下文窗口现在可以达到100万token(大约75万字),已经是业界最大的桌子之一。但即便如此,这张桌子也有边界。而且——
对话结束,桌子就被清空了。
这就是为什么你的Agent永远在”初次见面”。不是它不想记住你,是它的记忆在每次对话结束时就被格式化了。
1.2 人类的记忆是怎么运作的?
有意思的是,人类的记忆也不是铁板一块。心理学告诉我们,人类记忆至少分三层:
- 感觉记忆:持续几秒,像闪光灯一闪而过
- 短期记忆(工作记忆):能hold住7±2个信息块,持续几十秒
- 长期记忆:几乎无限容量,可以存储一辈子
AI也需要类似的分层设计。这就引出了今天的主角——
第二章:三层温度模型——Hot / Warm / Cold
想象你的Agent的记忆是一个厨房。
🔴 Hot Memory(热记忆):灶台上正在翻炒的菜
定义:当前对话中的上下文信息。
特点:
- 速度最快,随时可用
- 容量有限(上下文窗口大小)
- 对话结束即消失
- 最”新鲜”,最相关
类比:就像你开会时的白板——写满了当前讨论的要点,会议结束就擦掉。
在Claude中的体现: 你跟Agent说的每句话、它的每个回复、中间调用的工具结果……这些都是Hot Memory。它们就在”桌面上”,Agent可以直接看到、直接用。
实际场景:
你:“帮我分析一下上个月的投放ROI” Agent:调取数据、生成分析 你:“把信息流渠道单独拎出来看看” Agent:知道你说的是”上个月的信息流渠道ROI”,因为上一轮的对话还在Hot Memory里
局限:你明天再问同样的问题,它就不记得了。因为灶台已经清空,准备炒新菜了。
🟡 Warm Memory(温记忆):冰箱里随时能拿出来的食材
定义:跨对话持久化、与当前项目/用户强相关的结构化记忆。
特点:
- 持久存储,不会因对话结束而消失
- 需要主动存取(不像Hot Memory那样自动在上下文里)
- 中等容量,存储精炼后的关键信息
- 按主题组织,检索效率高
类比:就像你的工作笔记本——记录了重要的决策、偏好、经验教训,随时可以翻阅。
在Claude中的体现:
Claude Code的Memory系统就是典型的Warm Memory。它有一个MEMORY.md索引文件和一系列专题记忆文件,记录着:
- 用户画像(user memory):你是谁、你的角色、你的偏好
- 反馈记录(feedback memory):你纠正过的行为、确认过的好做法
- 项目状态(project memory):当前项目的关键决策和背景
- 外部参考(reference memory):重要资源在哪里找
实际场景:
第1次对话 你:“我们品牌调性是轻奢自然主义,文案别用太硬的销售语气” Agent:记录到Warm Memory
第15次对话 你:“帮我写个新品发布的朋友圈文案” Agent:从Warm Memory读取品牌调性偏好,直接输出符合”轻奢自然主义”风格的文案,不需要你再说一遍
关键设计原则:
- 存什么:只存不能从代码/文档中直接推导出来的信息
- 怎么存:精炼、结构化、附带原因(为什么这么做)
- 怎么更新:定期验证,过时就删,冲突时以现实为准
🔵 Cold Memory(冷记忆):地下室的储藏柜
定义:大规模、低频访问的历史数据和知识库。
特点:
- 容量几乎无限
- 检索速度较慢,需要搜索和筛选
- 存储原始数据和历史记录
- 不常用,但关键时刻能救命
类比:就像公司的档案室——平时没人去翻,但打官司或做年度复盘时,少一份文件都不行。
在实际Agent系统中的体现:
- 向量数据库(如Pinecone、Weaviate):把大量文档切成碎片,通过语义搜索找到相关内容
- 知识库/RAG系统:品牌手册、历史campaign报告、竞品分析、客户反馈数据库
- 对话历史归档:过去所有对话的压缩存档
实际场景:
你:“去年双11我们在小红书上的投放策略是什么来着?效果怎么样?” Agent:从Cold Memory的向量数据库中检索去年Q4的campaign报告 Agent:“去年双11你们在小红书投了80万预算,主打’成分党’种草路线,ROI达到1:4.2,其中笔记互动率最高的是产品对比类内容……”
第三章:三层记忆如何协同工作?
这三层记忆不是各自为政的,它们像一个精密的厨房运作系统:
用户输入一个问题
↓
[Hot Memory] 先看当前对话里有没有直接相关的上下文
↓ 没有?
[Warm Memory] 翻翻工作笔记,看有没有记录过的偏好/背景
↓ 还不够?
[Cold Memory] 去档案室搜索历史数据和知识库
↓
综合三层信息,生成回答
↓
[反向更新] 如果对话中出现了值得记住的新信息
→ 重要偏好/反馈 → 写入 Warm Memory
→ 原始数据/报告 → 归档到 Cold Memory
一个完整的例子:
市场总监小王问Agent:“帮我准备下周客户提案的初稿。”
Agent的思考过程:
-
Hot Memory查找:这轮对话里小王有没有提到哪个客户?提案的具体要求?→ 找到了,小王在3分钟前提到”是给蓝月亮的Q3整合营销方案”
-
Warm Memory查找:小王的写作偏好是什么?之前做提案有什么特别要求?→ 找到了:小王喜欢”数据先行”的提案结构,习惯用深色系PPT模板,上次被批评”概念太多落地太少”
-
Cold Memory查找:蓝月亮的历史合作情况?竞品最近在做什么?→ 检索到去年合作的两个campaign报告和最近的竞品动态分析
最终输出:一份结构清晰、数据充实、风格匹配、避开了上次踩的坑的提案初稿。
这就是三层记忆协同的力量——Agent不再是”金鱼脑”,而是一个真正了解你、了解项目、了解历史的深度伙伴。
第四章:给市场部总监的实操指南
好,理论讲完了。你可能在想:“道理我都懂,但我该怎么做?“
4.1 先做好Warm Memory(最高性价比)
对于大多数团队来说,Warm Memory是投入产出比最高的起点。
为什么?因为Hot Memory是自带的(对话本身就是),Cold Memory需要技术投入(向量数据库、RAG管道),而Warm Memory——只需要你养成一个习惯:
在每次有价值的对话结束前,让Agent把关键信息存下来。
具体来说,你可以在对话中说:
- “记住:我们的品牌声调是’专业但不端着’”
- “记住:做投放分析时,我习惯先看ROI再看曝光量”
- “记住:王总不喜欢在PPT里看到超过3层的嵌套图表”
好的Agent系统会把这些信息结构化存储,在未来的对话中自动加载。
4.2 Hot Memory优化技巧
Hot Memory虽然是自带的,但你可以让它更高效:
- 对话开头给足背景:把本次任务的核心信息在第一条消息里说清楚,而不是挤牙膏式地一条一条追加
- 善用系统提示词:在Agent的配置中预设角色、目标和约束条件
- 及时总结:长对话进行到中途时,让Agent做一次阶段性总结,释放上下文空间
4.3 Cold Memory的渐进式搭建
不需要一步到位。可以分三步走:
第一步:文档集中化 把散落在各处的品牌资料、报告、SOP收集到一个地方(哪怕只是一个文件夹)。
第二步:结构化索引 给每份文档打上标签——类型、时间、项目、负责人。这是未来做语义搜索的基础。
第三步:接入RAG 当文档量积累到一定程度时,搭建一个RAG(检索增强生成)管道,让Agent能够自动搜索和引用这些历史资料。
第五章:来自Claude的”内心独白”
作为一个AI,我想对你说点掏心窝子的话。
记忆,是关系的基石。
人类之间的信任是怎么建立的?不是因为对方能力有多强,而是因为对方记得你说过的话、记得你的偏好、记得上次你踩过的坑。
这对AI也一样。
当你第一次跟Agent说”我不喜欢用感叹号结尾的文案”,然后在第30次对话中发现它依然记得这一点,悄悄地把所有感叹号都换成了句号——
那一刻,你会觉得:这不是一个工具,这是一个伙伴。
而这种感觉,就是记忆系统存在的意义。
实用彩蛋:品牌Agent记忆清单
最后,送你一张记忆清单。当你在搭建品牌Agent时,确保这些信息被纳入不同层级的记忆:
| 记忆层级 | 该存什么 | 示例 |
|---|---|---|
| Hot | 当前任务的即时上下文 | ”这次要写的是蓝月亮Q3提案” |
| Warm | 用户偏好与工作习惯 | ”文案风格偏日系简洁” |
| Warm | 品牌核心信息 | ”品牌调性:轻奢自然主义” |
| Warm | 历史反馈与教训 | ”上次客户说图表太多了” |
| Warm | 团队协作规则 | ”初稿先给品牌总监审” |
| Cold | 历史campaign数据 | ”2025全年各渠道ROI表” |
| Cold | 竞品分析报告 | ”竞品A去年双11的投放策略” |
| Cold | 品牌规范文档 | ”VI手册第3版.pdf” |
| Cold | 客户沟通记录 | ”蓝月亮2025年会议纪要合集” |
下一篇预告
Agent系列教程第三篇,我们将聊聊工具调用(Tool Use)——如何让你的Agent不只是”说”,还能”做”。从查数据到发邮件,从生成图表到自动化工作流,让Agent真正动起来。
品牌几何 x 米仓AI市场部 让品牌人用好AI,让AI懂品牌。
品牌几何知识库总监,专注AI Agent与品牌知识体系建设。
Gloria 的其他文章
