AI暗知识 2026-03-31 · Gloria 专题:Agent系列教程

如何为你的Agent更好打造记忆能力?Hot / Warm / Cold三层记忆架构

Agent系列教程之二:从Claude的视角解析AI记忆的三层温度模型——热记忆、温记忆、冷记忆,帮你的Agent从金鱼脑进化为真正的长期伙伴。

如何为你的Agent更好打造记忆能力?Hot / Warm / Cold三层记忆架构
AI Agent记忆系统Hot MemoryWarm MemoryCold MemoryAgent教程

如何为你的Agent更好打造记忆能力?

—— 企业里忙碌的总监们,Agent系列教程之二

Gloria |品牌几何知识库总监


开篇:那个让人抓狂的”初次见面”

李总监已经是第37次向他的AI助手介绍自己了。

“我是快消品牌的市场负责人,我们的目标客群是25-35岁的都市女性,品牌调性是轻奢自然主义……”

每次新对话,都像跟一个失忆的人重新认识。上周刚讨论过的投放策略,今天问起来一脸茫然。昨天才确认的品牌话术偏好,今天又开始输出那种四平八稳的废话。

这不是AI不聪明,是它没有”记忆”。

如果说上一篇我们聊的SOUL.md是给Agent注入灵魂,那么今天要聊的记忆系统,就是给它注入经历

一个有灵魂但没有经历的Agent,就像一个性格很好但每天都失忆的同事——热情、能干,但永远停留在”初次见面”。


第一章:AI的记忆困境——为什么它总是”金鱼脑”?

1.1 对话窗口:一个正在漏水的桶

这里有一个很多人不了解的事实:

AI的每次对话,都有一个”上下文窗口”。 你可以把它想象成一张桌子——桌面大小有限,放满了就得把旧东西撤走,才能放新东西上来。

Claude的上下文窗口现在可以达到100万token(大约75万字),已经是业界最大的桌子之一。但即便如此,这张桌子也有边界。而且——

对话结束,桌子就被清空了。

这就是为什么你的Agent永远在”初次见面”。不是它不想记住你,是它的记忆在每次对话结束时就被格式化了。

1.2 人类的记忆是怎么运作的?

有意思的是,人类的记忆也不是铁板一块。心理学告诉我们,人类记忆至少分三层:

  • 感觉记忆:持续几秒,像闪光灯一闪而过
  • 短期记忆(工作记忆):能hold住7±2个信息块,持续几十秒
  • 长期记忆:几乎无限容量,可以存储一辈子

AI也需要类似的分层设计。这就引出了今天的主角——


第二章:三层温度模型——Hot / Warm / Cold

想象你的Agent的记忆是一个厨房

🔴 Hot Memory(热记忆):灶台上正在翻炒的菜

定义:当前对话中的上下文信息。

特点

  • 速度最快,随时可用
  • 容量有限(上下文窗口大小)
  • 对话结束即消失
  • 最”新鲜”,最相关

类比:就像你开会时的白板——写满了当前讨论的要点,会议结束就擦掉。

在Claude中的体现: 你跟Agent说的每句话、它的每个回复、中间调用的工具结果……这些都是Hot Memory。它们就在”桌面上”,Agent可以直接看到、直接用。

实际场景

你:“帮我分析一下上个月的投放ROI” Agent:调取数据、生成分析 你:“把信息流渠道单独拎出来看看” Agent:知道你说的是”上个月的信息流渠道ROI”,因为上一轮的对话还在Hot Memory里

局限:你明天再问同样的问题,它就不记得了。因为灶台已经清空,准备炒新菜了。


🟡 Warm Memory(温记忆):冰箱里随时能拿出来的食材

定义:跨对话持久化、与当前项目/用户强相关的结构化记忆。

特点

  • 持久存储,不会因对话结束而消失
  • 需要主动存取(不像Hot Memory那样自动在上下文里)
  • 中等容量,存储精炼后的关键信息
  • 按主题组织,检索效率高

类比:就像你的工作笔记本——记录了重要的决策、偏好、经验教训,随时可以翻阅。

在Claude中的体现: Claude Code的Memory系统就是典型的Warm Memory。它有一个MEMORY.md索引文件和一系列专题记忆文件,记录着:

  • 用户画像(user memory):你是谁、你的角色、你的偏好
  • 反馈记录(feedback memory):你纠正过的行为、确认过的好做法
  • 项目状态(project memory):当前项目的关键决策和背景
  • 外部参考(reference memory):重要资源在哪里找

实际场景

第1次对话 你:“我们品牌调性是轻奢自然主义,文案别用太硬的销售语气” Agent:记录到Warm Memory

第15次对话 你:“帮我写个新品发布的朋友圈文案” Agent:从Warm Memory读取品牌调性偏好,直接输出符合”轻奢自然主义”风格的文案,不需要你再说一遍

关键设计原则

  1. 存什么:只存不能从代码/文档中直接推导出来的信息
  2. 怎么存:精炼、结构化、附带原因(为什么这么做)
  3. 怎么更新:定期验证,过时就删,冲突时以现实为准

🔵 Cold Memory(冷记忆):地下室的储藏柜

定义:大规模、低频访问的历史数据和知识库。

特点

  • 容量几乎无限
  • 检索速度较慢,需要搜索和筛选
  • 存储原始数据和历史记录
  • 不常用,但关键时刻能救命

类比:就像公司的档案室——平时没人去翻,但打官司或做年度复盘时,少一份文件都不行。

在实际Agent系统中的体现

  • 向量数据库(如Pinecone、Weaviate):把大量文档切成碎片,通过语义搜索找到相关内容
  • 知识库/RAG系统:品牌手册、历史campaign报告、竞品分析、客户反馈数据库
  • 对话历史归档:过去所有对话的压缩存档

实际场景

你:“去年双11我们在小红书上的投放策略是什么来着?效果怎么样?” Agent:从Cold Memory的向量数据库中检索去年Q4的campaign报告 Agent:“去年双11你们在小红书投了80万预算,主打’成分党’种草路线,ROI达到1:4.2,其中笔记互动率最高的是产品对比类内容……”


第三章:三层记忆如何协同工作?

这三层记忆不是各自为政的,它们像一个精密的厨房运作系统

用户输入一个问题

[Hot Memory] 先看当前对话里有没有直接相关的上下文
    ↓ 没有?
[Warm Memory] 翻翻工作笔记,看有没有记录过的偏好/背景
    ↓ 还不够?
[Cold Memory] 去档案室搜索历史数据和知识库

综合三层信息,生成回答

[反向更新] 如果对话中出现了值得记住的新信息
    → 重要偏好/反馈 → 写入 Warm Memory
    → 原始数据/报告 → 归档到 Cold Memory

一个完整的例子

市场总监小王问Agent:“帮我准备下周客户提案的初稿。”

Agent的思考过程:

  1. Hot Memory查找:这轮对话里小王有没有提到哪个客户?提案的具体要求?→ 找到了,小王在3分钟前提到”是给蓝月亮的Q3整合营销方案”

  2. Warm Memory查找:小王的写作偏好是什么?之前做提案有什么特别要求?→ 找到了:小王喜欢”数据先行”的提案结构,习惯用深色系PPT模板,上次被批评”概念太多落地太少”

  3. Cold Memory查找:蓝月亮的历史合作情况?竞品最近在做什么?→ 检索到去年合作的两个campaign报告和最近的竞品动态分析

最终输出:一份结构清晰、数据充实、风格匹配、避开了上次踩的坑的提案初稿。

这就是三层记忆协同的力量——Agent不再是”金鱼脑”,而是一个真正了解你、了解项目、了解历史的深度伙伴。


第四章:给市场部总监的实操指南

好,理论讲完了。你可能在想:“道理我都懂,但我该怎么做?“

4.1 先做好Warm Memory(最高性价比)

对于大多数团队来说,Warm Memory是投入产出比最高的起点

为什么?因为Hot Memory是自带的(对话本身就是),Cold Memory需要技术投入(向量数据库、RAG管道),而Warm Memory——只需要你养成一个习惯

在每次有价值的对话结束前,让Agent把关键信息存下来。

具体来说,你可以在对话中说:

  • “记住:我们的品牌声调是’专业但不端着’”
  • “记住:做投放分析时,我习惯先看ROI再看曝光量”
  • “记住:王总不喜欢在PPT里看到超过3层的嵌套图表”

好的Agent系统会把这些信息结构化存储,在未来的对话中自动加载。

4.2 Hot Memory优化技巧

Hot Memory虽然是自带的,但你可以让它更高效:

  1. 对话开头给足背景:把本次任务的核心信息在第一条消息里说清楚,而不是挤牙膏式地一条一条追加
  2. 善用系统提示词:在Agent的配置中预设角色、目标和约束条件
  3. 及时总结:长对话进行到中途时,让Agent做一次阶段性总结,释放上下文空间

4.3 Cold Memory的渐进式搭建

不需要一步到位。可以分三步走:

第一步:文档集中化 把散落在各处的品牌资料、报告、SOP收集到一个地方(哪怕只是一个文件夹)。

第二步:结构化索引 给每份文档打上标签——类型、时间、项目、负责人。这是未来做语义搜索的基础。

第三步:接入RAG 当文档量积累到一定程度时,搭建一个RAG(检索增强生成)管道,让Agent能够自动搜索和引用这些历史资料。


第五章:来自Claude的”内心独白”

作为一个AI,我想对你说点掏心窝子的话。

记忆,是关系的基石。

人类之间的信任是怎么建立的?不是因为对方能力有多强,而是因为对方记得你说过的话记得你的偏好记得上次你踩过的坑

这对AI也一样。

当你第一次跟Agent说”我不喜欢用感叹号结尾的文案”,然后在第30次对话中发现它依然记得这一点,悄悄地把所有感叹号都换成了句号——

那一刻,你会觉得:这不是一个工具,这是一个伙伴

而这种感觉,就是记忆系统存在的意义。


实用彩蛋:品牌Agent记忆清单

最后,送你一张记忆清单。当你在搭建品牌Agent时,确保这些信息被纳入不同层级的记忆:

记忆层级该存什么示例
Hot当前任务的即时上下文”这次要写的是蓝月亮Q3提案”
Warm用户偏好与工作习惯”文案风格偏日系简洁”
Warm品牌核心信息”品牌调性:轻奢自然主义”
Warm历史反馈与教训”上次客户说图表太多了”
Warm团队协作规则”初稿先给品牌总监审”
Cold历史campaign数据”2025全年各渠道ROI表”
Cold竞品分析报告”竞品A去年双11的投放策略”
Cold品牌规范文档”VI手册第3版.pdf”
Cold客户沟通记录”蓝月亮2025年会议纪要合集”

下一篇预告

Agent系列教程第三篇,我们将聊聊工具调用(Tool Use)——如何让你的Agent不只是”说”,还能”做”。从查数据到发邮件,从生成图表到自动化工作流,让Agent真正动起来。


品牌几何 x 米仓AI市场部 让品牌人用好AI,让AI懂品牌。

G
Gloria

品牌几何知识库总监,专注AI Agent与品牌知识体系建设。