附录 D:真实性与可信度评估
定位:本附录不是技术原理讲解,而是对 MemPalace 当前开源仓库的一次证据化评估。它回答的不是"这个想法好不好",而是"哪些能力在源码里已经成立,哪些还停留在 README / 叙事层,哪些目前无法仅凭本地仓库确认"。
评估边界
这份评估只基于两个对象:
- 当前书稿引用的本地源码快照
- 书中可被源码直接验证的技术表述
它不试图判断创始人的主观动机,也不评估任何闭源组件、私有数据、线下演示或社交媒体传播效果。换句话说,这不是道德审判,也不是投资建议;它只是一次工程可信度审计。
这个边界很重要。一个项目可能同时满足两件事:
- 它确实有真实、可运行的工程实现
- 它的叙事口径又明显超前于当前实现
MemPalace 正是这种情况。
三栏结论
| 类别 | 结论 | 可信度 |
|---|---|---|
| 核心本地存储/检索管道 | 真实存在,且能从源码直接追踪 | 高 |
| AAAK 作为"严格无损、普适、超高压缩"的当前实现 | 更像设计目标,不是当前 plain-text 压缩器的真实状态 | 低到中 |
~170 token wake-up、Hall/Closet/agent 自动化叙事 | README/路线图成分明显重于当前默认运行时 | 低 |
| Benchmark 管线与结果复现脚本 | 真实存在,但要区分 raw / hybrid / rerank,不等于默认产品路径 | 中 |
| "完全离线、安装后立刻断网也一切照常工作" | 核心路径基本本地优先,但冷启动和资产准备仍有边界 | 中 |
这张表的核心结论可以浓缩成一句话:
它不是一个没有代码的空壳项目,但它的宣传叙事长期跑在实现前面。
一:哪些东西是真的
1. 数据摄入和归一化是真的
normalize.py、miner.py、convo_miner.py 这条链路不是摆设。项目确实能把多种输入格式转成统一 transcript / drawer 形式,再写进本地向量库。它不是"只有 benchmark,没有产品代码"的仓库。
这意味着 MemPalace 至少有一个坚实的底盘:本地 ingest -> chunk -> store -> search 这条路径是成立的。
2. 检索和 MCP 接口是真的
searcher.py 提供了可运行的语义搜索;mcp_server.py 也确实暴露了一组读写工具。即使你完全不接受它关于"记忆宫殿"的宏大叙事,这个项目依然是一个真实存在的本地记忆存储 + 搜索 + MCP 封装系统。
3. 一部分记忆层和辅助能力是真的
layers.py、知识图谱、diary、duplicate check、taxonomy 这些组件都不是 PPT 里的名字。它们在仓库里有实际代码,有调用接口,也能被局部验证。
但"存在代码"不等于"叙事版本完全成立"。这就进入下一节。
二:哪些地方明显叙事超前
1. AAAK 的当前实现被讲得比源码更强
书和 README 容易让人以为 AAAK 已经是一个当前可用的、逐事实无损的压缩语言。但当前 dialect.compress() 的 plain-text 路径实际上带有大量 heuristic:
- 实体只保留前几个
- topics 是频率排序后的 top-k
- emotions / flags 会截断
key_sentence本身就是显式筛选
这更像一个高压缩索引生成器,不是严格的"零信息损失编码器"。因此,如果把 AAAK 当成设计方向,我认为可信;如果把它当成当前开源实现已经兑现的产品能力,我认为不可信。
2. ~170 token wake-up 不是当前默认路径
当前运行时代码的 wake-up 仍然是较长的多层文本拼接,而不是书里一度反复出现的 ~170 token AAAK 化唤醒。后者更接近 README 所描绘的目标状态,而不是今天默认 CLI 的真实输出。
这类差异的影响很实际:它直接改变用户对成本、延迟、local model 可用性的判断。
3. Hall / Closet / agent 体系被写得比实现更完整
在叙事里,MemPalace 常被描述成一个层次丰富、可自动路由、带 specialist agents 的认知建筑;但在当前开源实现中,真正稳定存在的主路径仍然更接近:
wingroom- drawers
- 若干附加元数据和辅助工具
Hall、Closet、自动路由、内建 reviewer/architect/ops agent 这些说法,很多更像设计语言、接口愿景或 README 世界观,而不是当前默认运行时里一步不差的现实。
三:哪些判断只能给"中等可信"
1. Benchmark 结果不能直接等于产品体验
仓库里确实有 benchmark 脚本,也确实有 raw / hybrid / rerank 这些不同路径。但问题在于,读者很容易把"benchmark 上 100%"理解成"默认产品已经 100%"。这并不准确。
更严谨的读法应该是:
- raw 检索是一条真实能力路径
- hybrid / rerank 是另一条更强但更复杂的实验或评测路径
- 评测上界不等于默认产品路径
所以 benchmark 不是假的,但它常被误读成了产品现状。
2. 本地优先基本可信,但绝对化表述要小心
MemPalace 的核心价值主张之一是 local-first。按当前仓库看,这个方向基本可信:主要存储、检索、归一化、分块路径都在本地完成,不依赖 SaaS API。
但如果把它表述成"安装完成立刻拔网线,任何场景都完全不受影响",这就过头了。默认嵌入资产、可选 benchmark rerank、Wikipedia lookup 一类边界仍然存在。因此更准确的说法是:
它是本地优先系统,不是对所有冷启动场景都已被严格证明的绝对离线系统。
四:总体判断
如果问题是:"它是不是纯骗局?"
我的答案是:不像。
因为纯骗局通常有三个特征:
- 缺少真实可运行代码
- 关键能力只存在于演示视频或营销语
- 一旦沿调用链往下追,就会发现核心环节是空的
MemPalace 不符合这一组特征。它有真实的数据管道、真实的本地存储、真实的搜索、真实的 MCP 接口,也有一部分确实有用的工程判断。
但如果问题是:"它有没有明显夸大?"
我的答案同样是:有,而且是系统性的。
这种夸大不主要表现为伪造代码,而主要表现为把下面三件事混写:
- 当前默认实现
- benchmark / 实验路径
- README 与设计愿景
一旦这三层被混在一起,读者就会高估项目成熟度。
因此,最公允的结论不是"骗局"或"神作",而是:
一个有真实工程基础、但长期存在叙事超前问题的项目。
五:如何阅读这个项目
如果你打算继续阅读本书或评估 MemPalace,最稳妥的方法是用下面这个顺序:
- 先信源码主路径:
normalize -> chunk -> store -> search -> MCP - 再看 benchmark,区分 raw、hybrid、rerank
- 最后再看 README/AAAK/Hall/Closet/agent 叙事,把它们默认理解成"方向"而不是"现状"
只要顺序反过来,你就很容易被项目的世界观吸引,然后在实现层面不断发现落差。
这个附录的意义,不是给项目"判死刑",而是给读者一把更稳的尺子:先确认什么已经成立,再讨论它应该走向哪里。