skip to content
usubeni fantasy logo Usubeni Fantasy

知识库构建指南

/ 17 min read

This Post is Available In: CN EN

档案的类型

线性笔记

普通的文字排版形式,从毫无格式的 txt,到使用 word 都属于线性排版。

如果你是程序员,最推荐的还是 Markdown(如果你不是程序员呢?还是推荐 Markdown,因为它的语法其实是非常简单的)。虽然使用其他工具可以添加很多特效,但是 Markdown 的可迁移能力是最强的。LLM 现在的主流读取输出格式也是 Markdown,包括最新的提案 llmstxt

MDX 是 Markdown + react 组件的融合文件,表现力自然是顶级,但是可迁移又稍微下降了。类似技术还有 Markdoc

不过当然可迁移和表现力之间的权衡就要你自己决定了。

目前比较热门的在线笔记软件有:

  • Notion(与其说是笔记软件不如说是个数据库,功能很多,自己挖掘)
  • 飞书文档(当然其实后面的所有类型飞书都可以做到,所以飞书确实是国内文档非常好的一个选择)

当然也可以选择 astro、nextjs 之类的框架做个人博客,可以畅享 MDX 能力。

本地工具推荐 logseqobsidian。两个工具都支持双向链,logseq 倾向于用子弹列表解决一切,而 obsidian 是一个可以自由编写 markdown 的工具。

我们还可以通过插件或者模板把 obsidian 玩出很花里胡哨的玩法,并且你玩熟了并且有流量的话,这甚至是能发大财的。有不少知识博主会贩卖 obsidian 模板,借助这些模板加上一套理论,据说会让你的生活过得更好。

自由式

实体手写

最原始,最自由的实体手写。但现在基本只能回想起高中笔记用的这种形式,现在来说数字化已经覆盖几乎所有场景了。

不过也有例外,那就是:手账。

数字白板

  • 知识博主、留学生最爱:iPad 手写,包括 PDF 标注。
  • 数字化涂鸦风格方案:excalidraw

效果参考以前画的两个流的示意图:

ReadableStream WritableStream
  • 适合程序员画 UML 的工具:diagrams.net
  • 当然,白板功能飞书文档也有

半开放

这时候就有朋友问了,有了自由和线性,为什么还要半开放呢?

思维导图是半开放型笔记的典范。

半开放意味着你能做的少了,但少了不等于就不好,例如你可以在节点排布上解放大脑,高效出图。(特指数字版,手写版的思维导图鼓励用各种彩笔画画,十分不容易,成品可以十分好看,不过上下限都很高就是了)

而且灵活的折叠展开也是全自由的笔记形式没有的。除此之外,思维导图可以自然地显示节点连接(表达节点间关系)和节点总结。这两种操作在稠密的线性文档中看起来会不太自然,在自由式白板中添加又要付出额外的操作成本,而思维导图完美介于两者之间。

桌面端推荐 Xmind、MindElixir(需要买终身版找我!给你打折!🤗),在线飞书文档也依然可以。

mermaid 是在程序员圈子广泛使用的图表表示语言,与思维导图的“无代码”编写相比,mermaid 以低代码方式编写,稍微硬核一点。优点是,作为广泛被接受的图表语言,在 GitHub 等平台可以直接使用,直接用字符表达图表也会节省很多空间,数据检索也十分方便。

Mermaid Playground:https://mermaid.live/edit

碎片记录

现在碎片记事最火的应该是 Flomo,简单来说就像个只有自己看的到的微博。我是真的不太懂这个赛道居然还能跑出个这么火的应用。其强项应该是跟不少工具打通了导入导出工作流,也有插件快速导入信息。

对我来说这种碎片确实是很需要的,灵感的闪现确实转瞬即逝的,尤其是对于 ADHD。

但是我会选择直接记在 obsidian,有空直接转化成完整版,也不需要贴来贴去。

如果是追求快速和输入形式多样,最好的选择应该是你的手机自带的笔记应用,这类型应用一般支持文字、涂画、语音等多种输入方式。

功能型

为什么知道很多道理,但还是过不好这一生呢?因为只是知道道理根本没用,到需要“使用”这个道理的时候根本记不起来,我们只会沿着老路继续走,一些书里把这称为“默认值”。我们要做的不只是知道道理,而且要把这个道理设置为默认值,这样才能生效。

所以有些事情要时刻提醒自己,这个时候我会用手机系统自带的笔记本记下来,然后贴到主屏上,这个应该是无论安卓 iOS 都有的。甚至更变态的,你可以真的配个定时提醒让那句话弹出来……iOS 的那个待办事项是自带这个功能的。

说到待办事项,另一种功能型笔记就是最常用的 TODO list,使用 TODO 可以高效整理短期目标,逐条击破。Todoist 就是个不错的选择,任务可以全端同步,基本功能也是免费的。

为什么要做知识库

应对信息爆炸

Your mind is for having ideas, not holding them. —David Allen

构建第二大脑,人脑的局限还是挺明显的,很难记住所有细节,细节不常用会很容易被丢弃。所以某些细节外置到知识库就很好使。

数字化知识库借助高效检索能力,你只需要记得有这回事,结果一搜就出来了,高效、便捷!

把脑子的记忆记录在外部之后,也能降低你的心智负担,这也是对付失眠很有效的一招。

总之,人会遗忘,是自然进化的馈赠,不要什么都往脑子塞,知识库用起来!

加强记忆

直接看别人的笔记大多数情况下作用是不大的,同理可得直接看 AI 总结的内容实用性也不是很大。人类总是需要花时间,经过自己思考才能更容易记住事和道理,换言之自己总结学到的知识就能加强记忆。

加强记忆最简单的方式就是织网。人类很少能牢牢记住单独的知识,基本上都是和其他知识交织起来才更好记住。

图片来自 https://x.com/gapingvoid

方法和流程

费曼技巧

如果你不能用简单的语言解释一个概念,那么你还没有真正理解它。

花时间去收集信息之后,还需要自己解析信息,用自己的脑子把信息表达一次。如果发现表达不出来,那就意味着没真的懂,还得继续输入内容,这就是经典输出倒逼输入的理论。更为人熟知的叫法是费曼学习法。

难度再高一点,其实费曼学习法是要求你使用最简单的语言来解释的,例如你要向一个没有相关背景知识的孩子解释一些概念,你就必须理解得很透彻,甚至使用生活中的类比来给小孩解释高级概念。

Zettelkasten

Zettel: 便签 + Kasten: 盒子 = 卡片盒笔记法

  • 临时笔记(Fleeting Notes):快速捕捉的原始想法、灵感火花,通常记录在随身携带的工具中。
  • 文献笔记(Literature Notes):阅读文献(书籍、文章等)时,针对特定内容、用自己语言做的简要记录,并注明出处。每条文献笔记也应力求原子化。
  • 永久笔记(Permanent Notes):这是 Zettelkasten 的核心。它们是从临时笔记和文献笔记中提炼、升华出来的,用自己的语言完整阐述一个独立的思想,并与其他相关永久笔记建立链接。
  • 索引笔记/结构笔记(Index/Structure Notes / Maps of Content, MOCs):作为特定主题的入口或枢纽,它们不包含具体知识,而是通过链接指向一系列相关的永久笔记,帮助组织和导航知识网络
结构

上面提到的织网构建知识库的最强实践。

  • 捕捉:随时记录临时笔记和文献笔记。
  • 处理:定期回顾临时笔记和文献笔记。对于有价值的内容,思考其核心观点,用自己的语言将其发展成一条或多条永久笔记。
  • 链接:为新创建的永久笔记寻找并建立与已有永久笔记的链接。思考这些笔记之间存在何种关系(支持、反驳、引申、类比等),并在链接处简要说明。
  • 创建/更新索引:将新的永久笔记添加到相关的索引笔记中,或根据需要创建新的索引笔记。

康奈尔笔记法

由康奈尔大学(Cornell University)的教育学教授沃尔特·波克(Walter Pauk)在 20 世纪 50 年代发明并推广。

康奈尔笔记的结构

康奈尔流程:5R

  • 记录(Record):在主笔记区(通常是页面右侧最大的区域)尽可能完整、清晰地记录讲座、阅读或会议的核心内容。技巧包括使用简洁的短语、符号、缩写,突出重点。
  • 简化(Reduce):课后或阅读后尽快在提示栏(左侧较窄区域)将主笔记区的要点凝练成关键词、问题或简短提示。此步骤旨在澄清含义、强化记忆、梳理逻辑。
  • 复述(Recite):遮住主笔记区,仅看提示栏中的线索,尝试用自己的语言完整地复述笔记内容。然后对照主笔记区进行核查。这是主动回忆和自我检测的关键环节。
  • 思考(Reflect):将笔记内容与个人经验、已有知识和其他课程/主题联系起来,进行批判性思考,提出自己的见解或疑问。此步骤赋予笔记更深层次的意义,防止知识僵化。
  • 复习(Review):定期(如每日、每周)快速回顾笔记,特别是提示栏和总结区的内容,以对抗遗忘曲线,巩固学习成果。

海绵阅读法

以前看了《海绵阅读法》,有点启发。

里面的重点包括:

  • 笔记逐层深入的顺序:碎片 -> 思考重组 -> 思维导图 -> 读书笔记 -> 成体系的读书文章
  • 重点记下本书带来的新知
  • 提高信息行动比,学完动起来

完整版传送门:榨干《海绵阅读法》

其他

  • P.A.R.A.:
    • 项目 (Projects,短期任务)
    • 领域 (Areas,长期支持)
    • 资源 (Resources,支持前两者的资源)
    • 归档 (Archives,过期内容逻辑删除)
  • Getting Things Done (GTD):
    • 收集 (Capture): 将所有引起你注意的事情(无论大小)记录到“收件箱”(Inbox) 或其他收集工具中
    • 理清 (Clarify/Process): 逐一处理收件箱中的每个条目,判断它是什么,是否需要行动
    • 整理 (Organize): 将理清后的条目放入相应的清单或位置
    • 回顾 (Reflect/Review): 定期(通常是每周)回顾整个系统,检查所有清单,确保其完整性,并进行必要的更新和调整
    • 执行 (Engage/Do): 根据情境、可用时间和精力、以及优先级,从你的清单中选择并执行任务

总结

其实这几种方法和流程都有一些基本共通点:

收集(避免收藏家谬误) -> 思考/提炼 -> 转述 -> 回顾/整理

所以知道逻辑就好,没有必要死死遵循一套规则,可以从现有的笔记库架构为基础,融入以上思想逐步搭建知识库,适合自己的才是最好的。

后 AI 时代下的笔记

  • 记录内容优化
    • 后 AI 时代应该记录更少的文档可查的信息,毕竟 LLM 检索能力这么强,单纯从官方技术文档直接复制粘贴的笔记几乎没有太大意义了。至少,我们应该在学习过程中把整个学习对象的结构重新整理过,再适当复制粘贴文档里的重点。也就是说,更多地关联原本文档里相距较远的知识点,而不是完全根据本来的内容做浓缩。
  • 记录更多关于自己本人的思考,说不定以后大模型可以重构一个你
  • 打造个性化提示词知识库,例如:https://ssshooter.com/notebooklm-prompt/
  • 多模态拯救手写知识库

科研调研辅助:

阅读文档辅助:

评论组件加载中……