(本文作者为 字母AI,钛媒体经授权发布)
文 | 字母AI
agent正在变得越来越能干,但它还有一个很尴尬的问题,那就是干着干着,就忘了自己要干什么了。
长任务、跨会话、连续执行,这些的确是agent的发展方向,可前提是它必须有一套可靠的记忆系统。否则,再强的模型也只能在一次次对话里反复“重新认识世界”。
腾讯最近开源的AgentDB,瞄准的正是这个问题。
这一个是专门用来解决记忆问题的独立组件,一共只有几MB的大小,下载到电脑以后,在OpenClaw或者Hermes Agent里输入一个指令,AgentDB就安装完成了。
就是这么一个“小玩意”,在发布的同时,腾讯专门为其开设了独立的X账号( @TencentDBAbxo2),并由团队亲自在社交媒体上与开发者互动。

01 AgentDB解决了什么问题?
对于模型记忆这个问题,Codex和OpenClaw曾尝试用压缩的方式解决,把冗长的历史对话压缩成一小段摘要,但这种做法会不可逆地损失记忆的细节。
当Agent需要回溯某个具体决策的依据时,那些被压缩掉的信息就永远找不回来了。
这就是传统记忆系统的现状。要么把所有历史对话无脑塞进上下文窗口,导致token消耗爆炸,成本直线上升。要么用总结压缩历史,虽然省了token,但细节永久丢失,Agent在需要考证时只能靠模糊的印象瞎猜。
这两种方案都不够优雅,也都不够实用。
AgentDB本质上是一个分层渐进式的Agent记忆管道系统。它采用“符号化短期记忆+分层长期记忆”的双轨架构,试图在token效率和信息完整性之间找到平衡点。
这套系统的设计理念包含三个维度。
第一个维度,拒绝暴力堆积,也拒绝不可逆压缩。
AgentDB设计了L0到L3四层记忆金字塔。L0是原始对话,完整保留每一轮交互的原始记录。L1是提取的原子记忆,由LLM自动从对话中提取结构化事实、用户偏好、任务约束和中间结论。L2是场景聚合,按任务类型自动归纳相关记忆,形成场景块。L3是用户画像,持续提炼信息,形成稳定的长期用户档案。
02 姚顺雨的“上下文理论”找到了最佳实践
AgentDB这个产品,某种程度上来说,就是腾讯对姚顺雨“上下文理论”的一个落地方案。
姚顺雨此前多次强调,AI的核心能力不在于参数规模,而在于对上下文的理解、管理和利用。

这个观点在他加入腾讯后发布的第一个模型Hy3 preview中,得到了充分体现。
Hy3 preview这个模型最特别的地方在于,它把“出色的上下文学习和指令遵循能力”单独拎出来,写进了核心能力清单的第一条。
当其他厂商都在卷agent能力、代码生成、多模态的时候,Hy3把上下文能力放在了最显眼的位置。
姚顺雨加入腾讯后发布的第一个研究成果是CL-bench,这是一个专门用来测试模型能否从上下文中学习新知识并正确应用的基准。
在Hy3 preview的性能展示中,第一张图放的不是SWE-Bench Pro或者Terminal-Bench 2.0这种agent和代码榜单,而是AdvancedIF、AA-LCR,以及CL-bench这些看上下文推理、检索和指令遵循的榜单。
腾讯认为上下文管理能力,才是AI下一阶段赛道。
其实市面上有不少模型厂商都会在宣传时都会强调自己支持多长的上下文,包括OpenAI和Anthropic,从一开始的32K到128K,再到1M甚至微软曾经提到过的10M上下文。
但你真正用的时候就会发现,上下文越长,模型的表现往往越差。
信息密度被稀释,注意力被分散,模型在海量的无关信息中迷失方向,反而做出更多错误的决策。
姚顺雨团队的消融实验验证了这个观点,无关信息会稀释了注意力。这也是AgentDB的分层设计想要去解决的问题。
腾讯为AgentDB专门开设X账号,并由团队成员主动发起AMA,这在腾讯的开源项目中并不常见。这种高调姿态背后,是腾讯希望将AgentDB打造成“上下文管理”领域标杆的野心。
然而AgentDB目前在实战这块并没有很抢眼的表现,腾讯需要给AgentDB“带货”。
AgentDB的价值需要通过具体场景才能被感知。
比如,腾讯可以拿出混元模型,结合AgentDB构建一个“连续工作30天不丢失上下文的代码审查Agent”,或者“记住用户所有偏好的个性化内容推荐Agent”。
只有当开发者看到“某个模型+AgentDB”产生的化学反应,大家才会去用它。
03 唐杰的“上联”,姚顺雨的“下联”
就在AgentDB发布前夕,智谱创始人唐杰深夜发布了一条长文反思,核心观点直指,长周期任务将是今年AI最可能的突破点。
唐杰认为,AI的真正价值不在于单轮对话的智能,而在于通过与环境持续交互,完成复杂、延展的任务。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
冠军资讯
字母AI