Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

前言

"My friend Milla Jovovich and I spent months creating an AI memory system with Claude. It just posted a perfect score on the standard benchmark — beating every product in the space, free or paid.

It's called MemPalace, and it works nothing like anything else out there."

--- Ben Sigman (@bensig)

2026 年初,这条推文在技术社区引发了一场不大不小的震动。震动的原因不在于又一个 AI 记忆产品问世——市场上从来不缺这样的产品——而在于两件不寻常的事实:第一,它在 LongMemEval 完整 500 题上拿到了一个 500/500 的满分;同一份 benchmark 文档又同时公开了 hybrid_v4 在 held-out 450 上的 98.4%,把"竞争成绩"和"更干净的泛化数字"并列展示。第二,它的两位创始人的组合实在令人意外。

Ben Sigman,UCLA 古典学学位,二十余年系统工程经验,Bitcoin Libre 的 CEO,一个在去中心化借贷市场深耕多年的技术创业者,同时也是《Bitcoin One Million》的作者。Milla Jovovich——是的,就是那个 Milla Jovovich,好莱坞演员,拥有五百万 Instagram 粉丝,她的 GitHub 个人简介里写着 "architect of the MemPalace"。

Milla Jovovich
Milla Jovovich — from The Fifth Element to the architect of MemPalace.

一个古典学背景的系统工程师,一个好莱坞演员,他们和 Claude 一起花了数月时间构建的系统,击败了所有商业产品和学术系统。

这个事实本身就值得认真对待。


为什么写这本书

MemPalace 在短时间内积累了两千多颗 GitHub star,以 MIT 协议完全开源。Brian Roemmele——The Zero-Human Company 的创始人——在测试后说:"We have been testing MemPalace... absolutely blown away! It is a freaking masterpiece and we have deployed it to 79 employees." Wayne Sutton 说得更直白:"Milla Jovovich launching an AI memory system with Claude was not on my 2026 list." LLMJunky 则总结道:"She's co-developed the highest-scoring AI memory system ever benchmarked. Totally free and OSS. What a boss."

然而,围绕 MemPalace 的讨论大多停留在两个层面:一是惊讶于创始人身份的反差,二是对基准测试分数的传播。很少有人深入分析它的设计为什么有效,它做了哪些与主流 AI 记忆系统根本不同的选择,以及这些选择背后的工程权衡。

这本书试图填补这个空白。

这不是一本教程,而是一本设计分析。 你不会在这里找到"第一步安装,第二步配置"的操作指南——MemPalace 的 README 和文档已经做得足够好了。这本书关心的是更深层的问题:为什么古希腊的记忆术原理能在大语言模型时代重新生效?为什么一个零 API 调用的本地系统能在检索精度上达到 96.6%,加上一次轻量级重排序能在完整 benchmark 上冲到 100%,而同一套文档又会诚实地给出 98.4% 的 held-out 数字?为什么一种面向 AI 的压缩方言能在保留全部事实断言的前提下实现 5-10 倍格式压缩,而对长对话可以达到更高?为什么放弃"让 AI 决定什么值得记住"反而带来了更好的结果?

每一个设计决策背后都有一个具体的工程问题。这本书的工作是把这些问题和决策之间的关系讲清楚。


这本书不是什么

有几件事需要提前说明。

第一,这不是 MemPalace 的官方文档。本书是独立的第三方技术分析,基于公开的源代码、基准测试数据和设计文档进行逆向解读。书中的分析代表作者的理解,不代表项目创始人的意图。

第二,这不是一本 AI 记忆系统的综述。虽然为了说明设计选择的独特性,我们会在必要时与其他方案进行对比,但本书的焦点始终是 MemPalace 本身的架构逻辑。

第三,这不是一本让你从零构建类似系统的实战指南。本书的目标读者是已经具备一定 AI 工程经验、对记忆系统设计有兴趣的技术从业者和研究者。如果你正在设计自己的 AI 记忆方案,这本书能帮你理解一种已经被验证有效的思路;但它不会手把手教你写代码。


MemPalace 做了什么不同的事

在进入正文之前,值得用几段话勾勒 MemPalace 的核心设计选择,以便读者建立初步的心智模型。

主流的 AI 记忆系统遵循一个共同的范式:让模型在对话过程中提取"重要信息",存入向量数据库,检索时通过语义相似度匹配。这个范式的问题在于,它在存储阶段就引入了不可逆的信息损失——模型提取出"用户偏好 PostgreSQL",但丢掉了那次长达两小时的对话中你解释为什么从 MongoDB 迁移过来的全部上下文。

MemPalace 的核心立场是:存储一切,然后让结构使其可检索。

这个立场催生了三个关键设计:

记忆宫殿结构。 借用古希腊演说家的记忆术——通过将想法放置在想象中建筑的不同房间来记忆整篇演说词——MemPalace 将你的记忆组织为翼(人物和项目)、厅(记忆类型)和房间(具体概念)。这个空间隐喻不是装饰,而是一个真实的检索加速机制:仅靠结构化组织就带来了 34% 的检索精度提升。

AAAK 压缩方言。 这是一种专为 AI 智能体设计的速记语言。它不是给人读的——它是给你的 AI 读的,而且读得很快。对于结构化信息(团队、项目、决策),格式压缩可达 5-10 倍且保留全部事实断言;对于冗余度高的长对话记录,结合内容筛选可以达到 README 中宣称的 30 倍——但后者涉及关键语句提取,不完全等同于"零损失"(详见第 8-9 章的诚实分析)。因为 AAAK 本质上只是结构化文本加通用语法,它可以与任何能读取文本的模型协作——Claude、GPT、Gemini、Llama、Mistral——不需要解码器,不需要微调,不需要云端 API。

四层记忆栈。 从临时工作记忆到长期持久化,MemPalace 模拟了认知科学中的记忆层级。不同层级的记忆有不同的生命周期、不同的压缩策略和不同的检索路径。这不是一个扁平的键值存储,而是一个有时间感知能力的知识图谱。

这三个设计彼此交织,共同解释了那些看起来不可思议的基准测试数字:LongMemEval R@5 满分、零 API 调用下 96.6%、ConvoMem 92.9%、LoCoMo 100%(含重排序;基线 60.3%,详见第 23 章的诚实分析)。


推荐阅读路径

本书共分九个部分、二十五章。根据你的背景和兴趣,这里提供几条不同的阅读路径。

路径一:系统架构师

如果你是正在设计 AI 记忆系统或知识管理系统的工程师,建议按以下顺序阅读:

  • 第一部分(第 1-3 章):问题空间 ——理解 MemPalace 要解决的核心问题,以及为什么现有方案不够好。这是后续所有设计决策的动机来源。
  • 第二部分(第 4-7 章):记忆宫殿结构 ——空间隐喻如何转化为工程结构,翼-厅-房间的三级体系如何实现检索加速。
  • 第四部分(第 11-13 章):时态知识图谱 ——MemPalace 如何在图结构中编码时间维度,使得"去年关于 X 的讨论"变成一个可计算的查询。
  • 第五部分(第 14-15 章):四层记忆栈 ——从工作记忆到长期存储的分层策略。
  • 第八部分(第 22-23 章):验证 ——基准测试的设计和结果分析。

这条路径覆盖了系统的骨架,让你理解整体架构,然后根据需要回溯其他章节的细节。

路径二:AI 应用开发者

如果你更关心如何将类似的记忆能力集成到自己的 AI 应用中,建议从这些章节入手:

  • 第一部分(第 1-3 章):问题空间 ——同样从问题开始。
  • 第三部分(第 8-10 章):AAAK 压缩语言 ——理解这种面向 AI 的压缩方言是如何设计的,它的格式压缩如何保留全部事实断言,以及为什么它能在任何模型上工作。这可能是 MemPalace 最具独创性的贡献。
  • 第六部分(第 16-18 章):数据摄入管道 ——从原始对话数据到结构化记忆的完整流程。
  • 第七部分(第 19-21 章):接口设计 ——MCP 工具集、命令行接口和本地模型集成方案。
  • 第九部分(第 24-25 章):设计哲学与未来 ——MemPalace 的设计哲学对 AI 应用开发的更广泛启示。

这条路径侧重于可迁移的设计模式和集成方案。

路径三:快速概览

如果你时间有限,只想了解 MemPalace 为什么有效,可以只读第 1 章(问题定义)、第 4 章(宫殿结构概述)、第 8 章(AAAK 核心原理)和第 22 章(基准测试结果)。四章大约两小时,足以建立完整的高层理解。

当然,你也完全可以从头到尾顺序阅读。书的结构本身就是按照逻辑递进安排的:从问题到方案,从方案到实现,从实现到验证,从验证到反思。


一个关于背景的注脚

Ben Sigman 的古典学学位不是一个无关的背景细节。MemPalace 的核心隐喻——记忆宫殿,也称"位置法"(Method of Loci)——正是古希腊和古罗马修辞学传统的核心技术。西塞罗在《论演说家》中详细描述了这种方法:演说家在想象中的建筑里行走,每经过一个位置就想起一个论点。两千多年后,同样的空间隐喻被证明对大语言模型的记忆检索同样有效。

这不是巧合。空间结构之所以在人类记忆和 AI 记忆中都能发挥作用,是因为它提供了一种与内容正交的组织维度。当你不再需要记住"信息在哪里"(因为结构已经告诉你了),你就可以把全部认知资源用于理解信息本身。这个原理不依赖于记忆的载体是大脑还是语言模型。

一个学过古典学的系统工程师意识到了这一点。一个好莱坞演员——同时也是一个认真的技术贡献者——帮助将这个洞见变成了可工作的代码。然后 Claude 帮助他们把它构建了出来。

这个组合看起来不可能,但结果说明了一切:满分。


致谢与声明

本书基于 MemPalace 的公开源代码(github.com/milla-jovovich/mempalace,MIT 协议)、官方文档和公开基准测试数据进行分析。所有引用的推文和评论均来自公开发布的社交媒体内容。

感谢 Ben Sigman 和 Milla Jovovich 将这个系统开源,使得这样的深度分析成为可能。感谢 MemPalace 社区中分享使用经验和测试数据的贡献者们。

让我们开始吧。