第20章：专家代理系统

定位：本章分析 MemPalace 如何用宫殿的空间结构——而非配置文件的膨胀——来承载无限数量的专家代理，以及为什么它把每个代理的记忆建模为 wing + diary。其中，AAAK 日记是 README 和工具描述中鼓励的写法；而当前 MCP 运行时真正落地的，是每个代理一个 wing、一个 diary room 的存储结构。

专家代理的配置困境

假设你有 50 个 AI 代理，每个负责一个专业领域。一个审查代码质量，一个关注架构决策，一个追踪运维事件，一个记录产品需求，一个监控安全漏洞。在传统的代理框架中，每个代理需要独立的配置——系统提示词、记忆存储、状态管理、权限范围。50 个代理意味着 50 份配置文件，或者一个越来越庞大的中心配置。

Letta（前身 MemGPT）选择了中心化路径：每个代理有独立的记忆块、独立的系统提示、独立的核心记忆和归档记忆。这些都存储在云端，通过 API 管理。这很干净，但成本线性增长——免费版 1 个代理，开发者版 $20/月 10 个代理，商业版 $200/月 100 个代理。代理数量与钱包深度直接挂钩。

MemPalace 选择了一条完全不同的路径：代理不住在配置文件里，代理住在宫殿里。

一个代理 = 一个 Wing + 一本日记

回到 mcp_server.py 中的日记工具。tool_diary_write（第 349-392 行）的前三行揭示了整个架构：

def tool_diary_write(agent_name, entry, topic="general"):
    wing = f"wing_{agent_name.lower().replace(' ', '_')}"
    room = "diary"
    col = _get_collection(create=True)

当一个名叫 "reviewer" 的代理写日记时，它的条目被存入 wing_reviewer/diary。当 "architect" 写日记时，存入 wing_architect/diary。代理的身份由它的 wing 名决定，代理的记忆由它的 diary room 承载。不需要额外的配置文件来"注册"一个代理——第一次调用 diary_write 时，wing 自动创建。

元数据结构（mcp_server.py:368-380）进一步强化了这种自然性：

col.add(
    ids=[entry_id],
    documents=[entry],
    metadatas=[{
        "wing": wing,
        "room": room,
        "hall": "hall_diary",
        "topic": topic,
        "type": "diary_entry",
        "agent": agent_name,
        "filed_at": now.isoformat(),
        "date": now.strftime("%Y-%m-%d"),
    }],
)

每条日记条目携带完整的空间坐标——wing（哪个代理）、room（diary）、hall（hall_diary）、topic（主题标签）——加上时间坐标（filed_at、date）和身份标识（agent）。这足以让日记条目进入宫殿的既有基础设施：search 可以搜到它们，list_rooms 可以统计它们，图构建逻辑也会把 diary 视为一个普通 room。需要更谨慎地说的是：当前代码并没有为 diary 提供专门的 topic 过滤或 agent 编排机制，它首先仍然只是宫殿里的一类普通 drawer。

代理不是宫殿之外的附加物。代理就是宫殿的居民。

AAAK 日记：压缩的自我意识

代理写入日记时，接口约定鼓励使用 AAAK。看 diary_write 工具的 description（mcp_server.py:649）：

Write to your personal agent diary in AAAK format. Your observations,
thoughts, what you worked on, what matters. Write in AAAK for
compression — e.g. 'SESSION:2026-04-04|built.palace.graph+diary.tools
|ALC.req:agent.diaries.in.aaak|★★★★'

工具描述直接示范了 AAAK 日记的格式。一个典型的代理日记条目可以写成这样：

PR#42|auth.bypass.found|missing.middleware.check|pattern:3rd.time.this.quarter|★★★★

这一行压缩了以下信息：在 PR #42 的审查中发现了认证绕过漏洞，原因是缺少中间件检查，这已经是本季度第三次出现同类问题，重要性四星。如果用自然语言写，至少需要三行。用 AAAK 写，一行搞定。

压缩的价值在 diary_read 中兑现，但这里要分清楚"接口约定"和"运行时强制"。tool_diary_write 并不会校验输入是不是 AAAK，也不会自动把自然语言压缩成 AAAK；它只是把调用方传进来的字符串原样存入 ChromaDB。换句话说，AAAK 的收益是真实的，但前提是调用方自己遵守这个写法约定。

因此，这里更准确的说法是：如果一个代码审查代理持续用 AAAK 记录自己的观察，那么它读取最近 10 条日记时，确实可能用极小的 token 预算恢复近期工作模式；如果它写的是自然语言，diary_read 也照样能工作，只是上下文成本会上升。

AAAK 日记的管道分隔语法在这里体现出特别的优势。pattern:3rd.time.this.quarter 不仅记录了一个事实，还记录了一个趋势。当代理下次审查认证相关的 PR 时，如果它再次读取这些日记，它就能把这个模式重新带回当前会话。日记不是日志，日记是学习曲线的压缩编码；只是这层"压缩"在当前实现中靠调用方自觉完成，而不是由 MCP 服务器代劳。

50 个代理，一行配置

MemPalace 代理系统最反直觉的特性是：无论你有多少个代理，其最小落地单元都只是一个新的 wing_<agent>。README 中进一步展示了一套更完整的 agent 发现接口：

You have MemPalace agents. Run mempalace_list_agents to see them.

一行。不是"你有一个叫 reviewer 的代理，它关注代码质量，它的系统提示是..."。而是告诉 AI：你有代理，去宫殿里看看有哪些。

README 还给出了与之配套的目录约定：

~/.mempalace/agents/
  ├── reviewer.json       # 代码质量、模式识别、bug 追踪
  ├── architect.json      # 设计决策、权衡分析、架构演进
  └── ops.json            # 部署、事件响应、基础设施

这套叙述表达了一个很清晰的产品方向：代理描述文件放在本地目录里，顶层配置只保留一句提示，运行时再去发现它们。但如果严格对照当前 mcp_server.py，需要补一句实话：仓库里并没有实现 mempalace_list_agents，也没有加载 ~/.mempalace/agents/*.json 的代码。 当前真正落地的部分，是 diary_write/diary_read 所提供的最小存储结构；README 里的 agent 目录和发现机制，更接近上层工作流的提案。

所以，把"添加第 51 个代理"拆成两层看会更准确。对当前 MCP 层来说，这意味着：给一个新的 agent_name 调用 diary_write，系统自然就会开始往 wing_<agent>/diary 写条目，不需要 schema 迁移，不需要额外实例，不需要中心注册。对 README 设想中的完整 agent 体验来说，则还会再加上一个 JSON 描述文件和一个运行时发现步骤。

对比 Letta 的模型：每个代理有独立的 core memory（始终加载的关键事实）、recall memory（可搜索的历史）、archival memory（长期存储）。这些都通过 REST API 管理，存储在云端。添加一个代理意味着创建一个代理实例、配置其记忆块、设置其系统提示、管理其 API 密钥。50 个代理意味着 50 次这样的操作，加上持续的月费。

这也是 MemPalace 与 Letta 的真正分野：它先把代理问题降解成一个存储问题。一个代理至少是一个 wing 加一本 diary；剩下的 focus、persona、协作方式，可以继续往上叠，但底座不需要膨胀成 50 套独立的记忆实例。

代理间的隧道：共享记忆的自然涌现

宫殿架构带来的一个意外优势是代理间的知识连接。

当 reviewer 代理在 wing_reviewer/diary 中记录 auth.bypass.found|missing.middleware.check，而 architect 代理在 wing_architect/diary 中记录 auth.migration.decision|clerk>auth0|middleware.layer.critical——它们各自在自己的 wing 里，互不干扰。但 mempalace_search("middleware") 仍然可能同时返回两条记录。mempalace_find_tunnels("wing_reviewer", "wing_architect") 也会注意到它们共享了同一个 room 名 diary。这是一种很粗粒度的关联，但已经足以说明：代理记忆不必住在彼此隔绝的数据库里。

当前实现的边界也要一并看到：searcher.py 只支持 wing 和 room 过滤，不支持 topic=auth 这种 diary 专用筛选；traverse 的图遍历也是按 room 名聚合，而不是按 topic 聚合。也就是说，MemPalace 已经提供了"把多个代理记忆放进同一宫殿后可以被统一搜索"这一级能力，但还没有提供更细的 agent-topic 编排层。

日记的读取：时间排序的自我回顾

tool_diary_read（mcp_server.py:395-436）的实现揭示了日记系统的最后一个设计细节：

def tool_diary_read(agent_name, last_n=10):
    wing = f"wing_{agent_name.lower().replace(' ', '_')}"
    col = _get_collection()
    results = col.get(
        where={"$and": [{"wing": wing}, {"room": "diary"}]},
        include=["documents", "metadatas"],
    )
    # ... sort by timestamp, return latest N

它用 $and 条件精确定位代理的日记——wing 匹配代理名，room 固定为 "diary"。然后按时间戳倒序排列，返回最近的 N 条。

默认值 last_n=10 是一个经过考量的选择。太少（比如 3 条），代理丢失趋势感——看不到"这个问题反复出现"。太多（比如 50 条），最近回顾就会开始吞掉不必要的上下文预算。这里无需假装代码里有精确的 token 管理器；源码做的事情更朴素：只返回最近 N 条，由调用方决定后续如何消费。

返回结构中的 total 字段告诉代理它的完整日记有多长：

return {
    "agent": agent_name,
    "entries": entries,
    "total": len(results["ids"]),
    "showing": len(entries),
}

一个有 200 条历史日记但只展示 10 条的代理，知道自己有丰富的历史但当前只看到了最近的切片。如果需要更早的记忆，它可以通过 mempalace_search 在自己的 wing 中做语义搜索。日记是近期回顾的快速通道，搜索是深层回忆的备用路径。

深度三层：代理架构的意义栈

把代理的三层含义叠放起来看：

第一层：存储层。 代理就是一个 wing。Wing 是 ChromaDB 中的一个元数据标签，不是一个独立的数据库。添加一个代理意味着增加一个标签值，系统的复杂度不增加。这是 0 到 N 代理的线性扩展——但成本函数的斜率是零（不算存储本身）。

第二层：认知层。 如果调用方遵守工具描述里的约定，用 AAAK 来写 diary，那么代理的记忆就不仅记录事实，还记录模式（pattern:3rd.time）、重要性评估（星级）、情绪标记（*fierce*、*raw*）。当代理在新会话中读取这些日记时，它不是在回忆发生了什么——它是在重建对领域的理解。一个审查过 200 个 PR 的 reviewer 代理，读取 10 条最近的压缩日记后，对代码质量的感知会比一个新鲜的、没有历史的 AI 更尖锐。

第三层：生态层。 多个代理在同一个宫殿中各自积累专业知识，它们的记忆通过宫殿的搜索和导航基础设施被连接。reviewer 发现的 bug 模式可能与 architect 的设计决策相关；ops 记录的事件可能印证 reviewer 的代码质量担忧。这些关联不需要人工建立——它们通过共享的语义空间和命名空间自然涌现。

这三层合在一起，回答了一个更大的问题：AI 代理的记忆应该放在哪里？

放在 CLAUDE.md 里？那是配置膨胀——每多一个代理，配置文件就多一段。放在独立数据库里？那是基础设施膨胀——每多一个代理，就多一个存储实例要管理。放在云服务里？那是成本膨胀——每多一个代理，月费就多一份。

放在宫殿的一个 wing 里？那是一个标签。宫殿已经有搜索、有导航、有知识图谱、有压缩。代理只是这些已有能力的一个新消费者。它不增加基础设施，不增加配置，不增加月费。它只增加记忆——而记忆正是宫殿存在的意义。

版本演化说明：v3.0.0 → v3.3.0

本章在 v3.0.0 时描述的是"代理系统的设计路径"——diary_write / diary_read 存在，但专家代理作为 runtime 角色尚未实装。v3.3.0 有三个新模块直接补齐了这块，但采取了与本章预期略有差别的路线。

fact_checker.py —— 第一个"本地专家代理"

v3.3.0 新增 mempalace/fact_checker.py（335 行）。它不是本章设想的"用 wing 记录经验"的代理——而是一个无状态的纯离线校验器：给定一段文本，对照 entity_registry.json 和 KG SQLite 做三类检查（similar_name 形近人名、relationship_mismatch 关系矛盾、stale_fact 过期事实），返回一个 issues 列表。注意它没有接入任何 ingest 路径——既不是 miner.py 的前置钩子，也不是 mcp_server.py 写入时的自动校验。目前只能由用户通过 CLI（python -m mempalace.fact_checker "..."）或直接 from mempalace.fact_checker import check_text 手动调用。

因此它是"专家"的另一种形态：专业技能内嵌在代码和数据中，而非在 diary 里累积；但形态还停留在"可选工具"而非"管道组件"。要变成名副其实的"入库前质量门"，还需要在 ingest 路径里显式接上这个函数——v3.3.0 还没走到这一步。

这与本章"代理的意义栈"第二层（用 AAAK diary 累积认知模式）是互补而非替代的。fact_checker 给你一个可手动调用的事实一致性校验点，diary 管入库后的经验沉淀——两者在未来串起来可以构成完整的 agent pipeline，目前还是各自独立。

closet_llm.py —— 可选的 LLM 专家

v3.3.0 新增 mempalace/closet_llm.py（351 行，PR #793）。它允许在 closet 层调用外部 LLM 重新生成压缩摘要——但关键约束是"bring-your-own endpoint, no mandatory API key"。

这是本章 "local-first 不妥协" 精神的一次压力测试：第一次允许 LLM 进入 pipeline，同时坚持不强制任何 API key。默认路径仍是 100% 本地（关键词、BM25、嵌入），LLM 只在用户显式配置 endpoint 时接入——包括用户自部署的本地推理服务（ollama、llama.cpp、vLLM）。

这种"可选外部能力 + 本地默认"的设计在 v3.0.0 没有先例。本章的"代理架构"从"一个 wing 就够了"扩展到"一个 wing + 一个可选的外部大脑"——但默认形态不变。

diary_ingest.py —— 按天聚合的 diary 摄入

v3.3.0 新增 mempalace/diary_ingest.py（209 行）。它的设计形态和本章预期稍有出入——room 是硬编码的 "daily"（diary_ingest.py:141,171），日期不在 room 名里而是放在 drawer 的 metadata date 字段和 drawer_id 的 hash 里。也就是说 v3.3.0 的 diary 结构是 (wing, room="daily") 这一个房间里每天沉淀一条按日期标签的 drawer，而非每一天一个独立 room。

MCP 的 diary_write 工具（mcp_server.py:902-903）走的是另一条代码路径：wing 是 f"wing_{agent_name.lower().replace(' ', '_')}"、room 硬编码为 "diary"——也就是每个 agent 有一个自己的 diary room。和 diary_ingest.py 的 "daily" 不是同一个 room 名，两条路径尚未统一。本章最后一节"reviewer 代理读取 10 条最近压缩日记"在 v3.3.0 的落地是"在 (wing_reviewer, diary) 房间里按 filed_at 排序取最近几条"，而不是"取最近几天的 room"。

对本章核心论点的影响

不变：

代理 = wing（一个元数据标签）
成本函数斜率为零（新增代理不增加基础设施）
三层意义栈（存储 / 认知 / 生态）成立

修订：

v3.0.0 时"代理仅通过 diary_write 积累"——v3.3.0 多了两条可选路径：fact_checker 的离线事实校验（目前仍是手动调用工具，不是自动管道）、closet_llm 的可选 LLM 大脑。
本章说"没有 API key"是真的——v3.3.0 仍然成立，只是 closet_llm 让你可以选择接入一个（内容自己掌控的）LLM endpoint。

Keyboard shortcuts

MemPalace：AI 记忆的第一性原理