各位好,本篇为摸宝个人分享 Hermes Agent 的知识库搭建思路,希望能给到大家一些帮助
一、我的目的
出于我们目前 MW 在做的知识付费项目,及我本人日常部分时间在做的营销策划 freelancer 的工作背景,我对Agent 的最终目标是制作一个我的数字分身。它可以保留我的全部记忆(我认为个人的记忆随着年龄的增长始终会忘记,但代码不会),以及我的 skill(含我做策划等工作的整体思考逻辑、实操技能等),最终可以帮我实现独立解决策划问题,甚至我的技能教学。
二、以终为始
出于我的最终目的,我的 Agent 在知识库上需要有如下几个特性
1、不会偷懒(即喂给它的东西不会自己魔改,不会简写成200字的“假总结”),假总结长下图这个样子:

⬆️(如果不做任何约定,可能你喂的一篇几千字的文章会变成这样的内容,并告诉你“学习完了”)⬆️
2、会按一定的思路结构拆解书籍:拆书 Skill 我已经制作了一个比较满意的初版(喂 epub 效果最好),已开源:https://github.com/mollycall-zmy/book-learning-skill 该 skill 会再出文章说明我的设计思路。这样一些社科类或者传记类、技能类等书籍可以直接喂给它
3、会自我学习:配合 Hermes 的 Cron 任务,每天在固定网站进行巡检学习,学习后把文章内容纳入知识库
4、有完善的调用逻辑:在后续问问题的时候,有一定的调用方式,省 token 的同时快速的拿到我想要的答案
5、后续展望:调用记忆只是开始,全部做好后会再继续修知识如何运用
因此,我们在让 Agent 开干前,知识库的结构设计就变得非常重要。
三、知识库结构思路
对新同学,还是多补充一句,Obsidian 与 Agent 的知识库天然适配,简直不要太好,一定要用 Obsidian 不断检查你的知识库内容→【Obsidian 教程】
请使用 Obsidian 单独给 Agent 建一个它自己的知识库

⬆️(左侧三个库,分别为我的 Agent 爬爬知识库、方便我查看 Hermes 的 md 文件的库、以及我个人的知识库笔记)⬆️
首先纵向上我参考了Karpathy 的知识库三层结构,你可以把这篇文章直接丢给 Hermes→【LLM wiki:karpathy 公开构建个人本地知识库详细方法「超强提示词」】
第一层:原始资料(也叫 Raw 层) — 你精心收集的原始文档,包括文章、论文、图片、数据文件。这一层是只读的——LLM 只读取,不修改。这是你的事实来源。
第二层:Wiki — 一个由 LLM 生成的 Markdown 文件目录,包含摘要、实体页面、概念页面、对比分析、概览和综合性结论。这一层完全由 LLM 负责:它创建页面、在新资料加入时更新页面、维护交叉引用、保持内容的一致性。你负责阅读,LLM 负责写作。
第三层:Schema(规范文档) — 一份配置文件(例如 Claude Code 用的
CLAUDE.md,或 Codex 用的AGENTS.md),告诉 LLM Wiki 的结构是什么、约定规范是什么,以及在录入资料、回答问题或维护 Wiki 时应遵循什么工作流程。这是最关键的配置文件——正是它让 LLM 成为一个有纪律的 Wiki 维护者,而不只是一个通用聊天机器人。你和 LLM 会随着时间的推移共同完善它,在实践中摸索出最适合你所在领域的方式。
这样能够一定程度上保证 Agent 不偷懒,有原文的存在也方便我们回查。(如果不做限定,它真的上来只会给你的知识库每个条做200字样子货……就像我们为了写日报而写日报,对后续的调用毫无用处)

四、MECE 原则
我尝试让 Agent 在搭建时,大框架遵循 MECE 原则(相互排斥,彼此穷尽),经过我的反复调教,我发现我们前期无法将万事万物全部精确分类,因此只能一层一层来做。
但是在除了Karpathy 的最外三层结构下,我直接借用认知心理学中的人脑记忆模型,把这个记忆宫殿分为以下四个核心层级:
L1:事实与语义—— 百科全书
在人脑中,这部分负责存储脱离了具体时间地点的客观知识。对于 Agent,这是它认识世界和认识你的基础。
个人客观档案:基础设定
社会与人际关系网:你的重要他人以及宠物的基础信息。
专业知识储备:硬核知识点。比如市场营销的经典理论、商业模式的分类、甚至是感兴趣的历史、八字或塔罗的基础牌意等。
L2:情景与经历—— 日记本
人之所以是人,是因为我们有带着时间戳和情绪的经历。这部分是让 Agent拥有人情味和故事感的关键。
重大人生节点:比如什么时候离开大厂、什么时候决定创办MW等。
具体事件与情绪:带有时间、地点和感悟的回忆
L3:程序性记忆—— 工具箱
人脑的这部分管的是“怎么骑自行车”、“怎么游泳”。在你的数字分身里,这部分存储的是做事方法和技能。
业务操作指南 (SOP):商业思路、思考逻辑等
审美与输出规范:对具体事物设定的标准。如 MW UI 等
L4:元认知与价值观—— 决策点
这是最高级的结构,决定了“你为什么是你”。当 Agent 遇到未知的、没有现成 SOP 的问题时,它需要靠这层逻辑来做判断。
沟通与表达风格:这是它的“嘴”。比如:必须真诚、务实、说人话;坚决拒绝使用互联网装逼黑话;直接讲清本质。在和 Agent 对话中不断总结
核心理念:信奉的底层规律。比如“职场是一场游戏”的博弈思维,或者对个人成长、健康的人生追求。
初期建立这个3+4结构后,我们开始有了知识库的雏形,后面就是不断的修下层文件夹的结构,没有知识库可以一蹴而就,只有不断的检查和验证,才能让 Agent 越来越像你。

⬆️(当前自我学习或喂给 Agent 文章或书籍后,它会自动总结归档)⬆️
六、定期检查
目前 Agent 给到操作的准确程度,取决于我们给的 Brief 有多准确,由于每个人的情况和发挥不同,请记得经常检查,以保障我们的知识库是自己想要的样子。
前期搭建时,手动检查 Obsidian 里它的内容,发现瞎写或规则有问题时要及时调整:

⬆️(调用逻辑初步做了气味向量方案,但还在修,修好后会做一个 skill 开源)⬆️
建立 cron 任务,让 Agent 按周来扫描审计知识库的结构(每天一次太烧 token 了……)

本周大概建了30万字的知识库内容(其他更多是书籍文字 raw 层记录,暂时不算),我的知识库当前还是个宝宝,还在不断精进中,如果你有更好的 skill 或者思路,也欢迎评论分享给我们~




