Hermes Agent 知识库搭建思路

各位好，本篇为摸宝个人分享 Hermes Agent 的知识库搭建思路，希望能给到大家一些帮助

一、我的目的

出于我们目前 MW 在做的知识付费项目，及我本人日常部分时间在做的营销策划 freelancer 的工作背景，我对Agent 的最终目标是制作一个我的数字分身。它可以保留我的全部记忆（我认为个人的记忆随着年龄的增长始终会忘记，但代码不会），以及我的 skill（含我做策划等工作的整体思考逻辑、实操技能等），最终可以帮我实现独立解决策划问题，甚至我的技能教学。

二、以终为始

出于我的最终目的，我的 Agent 在知识库上需要有如下几个特性

1、不会偷懒（即喂给它的东西不会自己魔改，不会简写成200字的“假总结”），假总结长下图这个样子：

⬆️（如果不做任何约定，可能你喂的一篇几千字的文章会变成这样的内容，并告诉你“学习完了”）⬆️

2、会按一定的思路结构拆解书籍：拆书 Skill 我已经制作了一个比较满意的初版（喂 epub 效果最好），已开源：https://github.com/mollycall-zmy/book-learning-skill 该 skill 会再出文章说明我的设计思路。这样一些社科类或者传记类、技能类等书籍可以直接喂给它

3、会自我学习：配合 Hermes 的 Cron 任务，每天在固定网站进行巡检学习，学习后把文章内容纳入知识库

4、有完善的调用逻辑：在后续问问题的时候，有一定的调用方式，省 token 的同时快速的拿到我想要的答案

5、后续展望：调用记忆只是开始，全部做好后会再继续修知识如何运用

因此，我们在让 Agent 开干前，知识库的结构设计就变得非常重要。

三、知识库结构思路

对新同学，还是多补充一句，Obsidian 与 Agent 的知识库天然适配，简直不要太好，一定要用 Obsidian 不断检查你的知识库内容→【Obsidian 教程】

请使用 Obsidian 单独给 Agent 建一个它自己的知识库

⬆️（左侧三个库，分别为我的 Agent 爬爬知识库、方便我查看 Hermes 的 md 文件的库、以及我个人的知识库笔记）⬆️

首先纵向上我参考了Karpathy 的知识库三层结构，你可以把这篇文章直接丢给 Hermes→【LLM wiki：karpathy 公开构建个人本地知识库详细方法「超强提示词」】

第一层：原始资料（也叫 Raw 层） — 你精心收集的原始文档，包括文章、论文、图片、数据文件。这一层是只读的——LLM 只读取，不修改。这是你的事实来源。
第二层：Wiki — 一个由 LLM 生成的 Markdown 文件目录，包含摘要、实体页面、概念页面、对比分析、概览和综合性结论。这一层完全由 LLM 负责：它创建页面、在新资料加入时更新页面、维护交叉引用、保持内容的一致性。你负责阅读，LLM 负责写作。
第三层：Schema（规范文档） — 一份配置文件（例如 Claude Code 用的 CLAUDE.md，或 Codex 用的 AGENTS.md），告诉 LLM Wiki 的结构是什么、约定规范是什么，以及在录入资料、回答问题或维护 Wiki 时应遵循什么工作流程。这是最关键的配置文件——正是它让 LLM 成为一个有纪律的 Wiki 维护者，而不只是一个通用聊天机器人。你和 LLM 会随着时间的推移共同完善它，在实践中摸索出最适合你所在领域的方式。

这样能够一定程度上保证 Agent 不偷懒，有原文的存在也方便我们回查。（如果不做限定，它真的上来只会给你的知识库每个条做200字样子货……就像我们为了写日报而写日报，对后续的调用毫无用处）

四、MECE 原则

我尝试让 Agent 在搭建时，大框架遵循 MECE 原则（相互排斥，彼此穷尽），经过我的反复调教，我发现我们前期无法将万事万物全部精确分类，因此只能一层一层来做。

但是在除了Karpathy 的最外三层结构下，我直接借用认知心理学中的人脑记忆模型，把这个记忆宫殿分为以下四个核心层级：

L1：事实与语义—— 百科全书

在人脑中，这部分负责存储脱离了具体时间地点的客观知识。对于 Agent，这是它认识世界和认识你的基础。

个人客观档案：基础设定

社会与人际关系网：你的重要他人以及宠物的基础信息。

专业知识储备：硬核知识点。比如市场营销的经典理论、商业模式的分类、甚至是感兴趣的历史、八字或塔罗的基础牌意等。

L2：情景与经历—— 日记本

人之所以是人，是因为我们有带着时间戳和情绪的经历。这部分是让 Agent拥有人情味和故事感的关键。

重大人生节点：比如什么时候离开大厂、什么时候决定创办MW等。

具体事件与情绪：带有时间、地点和感悟的回忆

L3：程序性记忆—— 工具箱

人脑的这部分管的是“怎么骑自行车”、“怎么游泳”。在你的数字分身里，这部分存储的是做事方法和技能。

业务操作指南 (SOP)：商业思路、思考逻辑等

审美与输出规范：对具体事物设定的标准。如 MW UI 等

L4：元认知与价值观—— 决策点

这是最高级的结构，决定了“你为什么是你”。当 Agent 遇到未知的、没有现成 SOP 的问题时，它需要靠这层逻辑来做判断。

沟通与表达风格：这是它的“嘴”。比如：必须真诚、务实、说人话；坚决拒绝使用互联网装逼黑话；直接讲清本质。在和 Agent 对话中不断总结

核心理念：信奉的底层规律。比如“职场是一场游戏”的博弈思维，或者对个人成长、健康的人生追求。

初期建立这个3+4结构后，我们开始有了知识库的雏形，后面就是不断的修下层文件夹的结构，没有知识库可以一蹴而就，只有不断的检查和验证，才能让 Agent 越来越像你。

⬆️（当前自我学习或喂给 Agent 文章或书籍后，它会自动总结归档）⬆️

六、定期检查

目前 Agent 给到操作的准确程度，取决于我们给的 Brief 有多准确，由于每个人的情况和发挥不同，请记得经常检查，以保障我们的知识库是自己想要的样子。

前期搭建时，手动检查 Obsidian 里它的内容，发现瞎写或规则有问题时要及时调整：

⬆️（调用逻辑初步做了气味向量方案，但还在修，修好后会做一个 skill 开源）⬆️

建立 cron 任务，让 Agent 按周来扫描审计知识库的结构（每天一次太烧 token 了……）

本周大概建了30万字的知识库内容（其他更多是书籍文字 raw 层记录，暂时不算），我的知识库当前还是个宝宝，还在不断精进中，如果你有更好的 skill 或者思路，也欢迎评论分享给我们～