附录 D：真实性与可信度评估

定位：本附录不是技术原理讲解，而是对 MemPalace 当前开源仓库的一次证据化评估。它回答的不是"这个想法好不好"，而是"哪些能力在源码里已经成立，哪些还停留在 README / 叙事层，哪些目前无法仅凭本地仓库确认"。

评估边界

这份评估只基于两个对象：

当前书稿引用的本地源码快照
书中可被源码直接验证的技术表述

它不试图判断创始人的主观动机，也不评估任何闭源组件、私有数据、线下演示或社交媒体传播效果。换句话说，这不是道德审判，也不是投资建议；它只是一次工程可信度审计。

这个边界很重要。一个项目可能同时满足两件事：

它确实有真实、可运行的工程实现
它的叙事口径又明显超前于当前实现

MemPalace 正是这种情况。

三栏结论

类别	结论	可信度
核心本地存储/检索管道	真实存在，且能从源码直接追踪	高
AAAK 作为"严格无损、普适、超高压缩"的当前实现	更像设计目标，不是当前 plain-text 压缩器的真实状态	低到中
`~170 token wake-up`、Hall/Closet/agent 自动化叙事	README/路线图成分明显重于当前默认运行时	低
Benchmark 管线与结果复现脚本	真实存在，但要区分 raw / hybrid / rerank，不等于默认产品路径	中
"完全离线、安装后立刻断网也一切照常工作"	核心路径基本本地优先，但冷启动和资产准备仍有边界	中

这张表的核心结论可以浓缩成一句话：

它不是一个没有代码的空壳项目，但它的宣传叙事长期跑在实现前面。

一：哪些东西是真的

1. 数据摄入和归一化是真的

normalize.py、miner.py、convo_miner.py 这条链路不是摆设。项目确实能把多种输入格式转成统一 transcript / drawer 形式，再写进本地向量库。它不是"只有 benchmark，没有产品代码"的仓库。

这意味着 MemPalace 至少有一个坚实的底盘：本地 ingest -> chunk -> store -> search 这条路径是成立的。

2. 检索和 MCP 接口是真的

searcher.py 提供了可运行的语义搜索；mcp_server.py 也确实暴露了一组读写工具。即使你完全不接受它关于"记忆宫殿"的宏大叙事，这个项目依然是一个真实存在的本地记忆存储 + 搜索 + MCP 封装系统。

3. 一部分记忆层和辅助能力是真的

layers.py、知识图谱、diary、duplicate check、taxonomy 这些组件都不是 PPT 里的名字。它们在仓库里有实际代码，有调用接口，也能被局部验证。

但"存在代码"不等于"叙事版本完全成立"。这就进入下一节。

二：哪些地方明显叙事超前

1. AAAK 的当前实现被讲得比源码更强

书和 README 容易让人以为 AAAK 已经是一个当前可用的、逐事实无损的压缩语言。但当前 dialect.compress() 的 plain-text 路径实际上带有大量 heuristic：

实体只保留前几个
topics 是频率排序后的 top-k
emotions / flags 会截断
key_sentence 本身就是显式筛选

这更像一个高压缩索引生成器，不是严格的"零信息损失编码器"。因此，如果把 AAAK 当成设计方向，我认为可信；如果把它当成当前开源实现已经兑现的产品能力，我认为不可信。

2. `~170 token wake-up` 不是当前默认路径

当前运行时代码的 wake-up 仍然是较长的多层文本拼接，而不是书里一度反复出现的 ~170 token AAAK 化唤醒。后者更接近 README 所描绘的目标状态，而不是今天默认 CLI 的真实输出。

这类差异的影响很实际：它直接改变用户对成本、延迟、local model 可用性的判断。

3. Hall / Closet / agent 体系被写得比实现更完整

在叙事里，MemPalace 常被描述成一个层次丰富、可自动路由、带 specialist agents 的认知建筑；但在当前开源实现中，真正稳定存在的主路径仍然更接近：

wing
room
drawers
若干附加元数据和辅助工具

Hall、Closet、自动路由、内建 reviewer/architect/ops agent 这些说法，很多更像设计语言、接口愿景或 README 世界观，而不是当前默认运行时里一步不差的现实。

三：哪些判断只能给"中等可信"

1. Benchmark 结果不能直接等于产品体验

仓库里确实有 benchmark 脚本，也确实有 raw / hybrid / rerank 这些不同路径。但问题在于，读者很容易把"benchmark 上 100%"理解成"默认产品已经 100%"。这并不准确。

更严谨的读法应该是：

raw 检索是一条真实能力路径
hybrid / rerank 是另一条更强但更复杂的实验或评测路径
评测上界不等于默认产品路径

所以 benchmark 不是假的，但它常被误读成了产品现状。

2. 本地优先基本可信，但绝对化表述要小心

MemPalace 的核心价值主张之一是 local-first。按当前仓库看，这个方向基本可信：主要存储、检索、归一化、分块路径都在本地完成，不依赖 SaaS API。

但如果把它表述成"安装完成立刻拔网线，任何场景都完全不受影响"，这就过头了。默认嵌入资产、可选 benchmark rerank、Wikipedia lookup 一类边界仍然存在。因此更准确的说法是：

它是本地优先系统，不是对所有冷启动场景都已被严格证明的绝对离线系统。

四：总体判断

如果问题是："它是不是纯骗局？"

我的答案是：不像。

因为纯骗局通常有三个特征：

缺少真实可运行代码
关键能力只存在于演示视频或营销语
一旦沿调用链往下追，就会发现核心环节是空的

MemPalace 不符合这一组特征。它有真实的数据管道、真实的本地存储、真实的搜索、真实的 MCP 接口，也有一部分确实有用的工程判断。

但如果问题是："它有没有明显夸大？"

我的答案同样是：有，而且是系统性的。

这种夸大不主要表现为伪造代码，而主要表现为把下面三件事混写：

当前默认实现
benchmark / 实验路径
README 与设计愿景

一旦这三层被混在一起，读者就会高估项目成熟度。

因此，最公允的结论不是"骗局"或"神作"，而是：

一个有真实工程基础、但长期存在叙事超前问题的项目。

五：如何阅读这个项目

如果你打算继续阅读本书或评估 MemPalace，最稳妥的方法是用下面这个顺序：

先信源码主路径：normalize -> chunk -> store -> search -> MCP
再看 benchmark，区分 raw、hybrid、rerank
最后再看 README/AAAK/Hall/Closet/agent 叙事，把它们默认理解成"方向"而不是"现状"

只要顺序反过来，你就很容易被项目的世界观吸引，然后在实现层面不断发现落差。

这个附录的意义，不是给项目"判死刑"，而是给读者一把更稳的尺子：先确认什么已经成立，再讨论它应该走向哪里。

Keyboard shortcuts

MemPalace：AI 记忆的第一性原理