知识的定义
从整个知识组织的演变历史的视角看,知识的定义其实发生过三次变化。
第一阶段:文献即知识
其实在过去很长一段时间中,书籍往往是和知识划等号的。在过去的年代里,书籍与文献的数量相对有限,凭借着对书籍和文献的有序管理,人们可以较为轻松地找到自己所需的知识。因此,在过去的年代,管理书籍就是管理知识。
但是,随着书籍文献的井喷式增长,人们逐渐发现这种做法逐渐开始不管用了。
我们都知道,无论是一本书还是一篇文献,其往往不会只写一个主题。比如,一篇讲述白切鸡做法的文章,它可能主要讨论白切鸡怎么做,但也可能讨论了哪些鸡是做白切鸡的好鸡。而在文献组织的过程中,很多时候我们只会给 ” 白切鸡怎么做 ” 这个主要主题赋予检索标识,而忽略了 ” 哪些鸡是做白切鸡的好原料 ” 这个细小的主题。这就使得我们后期难以对这个细小主题进行查找。
那该怎么解决这个问题呢?实际上这个问题的根源是我们在进行组织时,把 ” 知识 ” 定义得过大了——一篇文献包含了太多太多的知识。为了将管理单元缩小一些,人们发明了一种名为文摘的东西,开始把文摘定义为知识。
第二阶段:文摘即知识
什么叫文摘呢?或许,你对文摘的第一直觉就是 ” 从文章中摘抄下来的东西 “,但其实这个感觉已经八九不离十了。所谓文摘,就是以提供文献内容梗概为目的,不加评论和补充解释、简明、确切地记述文献重要内容的短文 1。从文摘的用途上来说,文摘可以分成报道性文摘、指示性文摘和选择性文摘三种 2。
- 报道性文摘:正如其名,报道性文摘的作用就是对原文进行报道,向读者介绍原始文献的主要内容、观点、论据、论证方式与结论等等,从而让读者读了文摘后可不用再次回看原文,以节省阅读时间。
- 指示性文摘:指示性文摘则侧重 ” 指示 ” 的作用,其更像是一种简介,向读者展示原文的讨论对象、讨论角度、方法与结论等信息,而不会像报道性文摘那样将这些信息详尽报道。因此,如果读者需要进一步了解原文的内容,则需要去阅读原文,文摘只能帮助读者判断原文是否值得阅读。
- 选择性文摘:选择性文摘则侧重 ” 选择 ” 的作用。正如前文所说,一本书可能会包含不同的主题,而不同学科背景、不同目的的读者需要从书中获取的信息和知识往往是不同的,选择性文摘就是将不同主题的内容分别摘录出来,以供不同需要的读者查阅。
有了文摘,特别是指示性文摘后,我们就能轻松地将书籍与文献中不同主题的内容抽离出来,实现对知识和信息的更细粒度的管理了。实际上,现在我们很多时候做的笔记,本质上就是在做指示性文摘,将书籍、文献、视频等各种信息源中对自己有用的信息抽离出来,以供日后使用。
但是,文摘仍有其自身的问题,其最大的问题在于信息的记录是冗余的。举个例子,张三可能写了一篇如何制作白切鸡的文章,我们可以为这篇文章编写一篇文摘 A;过了一个月,李四也写了一篇如何制作白切鸡的文章,我们也可以为这篇文章编写一篇文摘 B。后面,当我们想查找如何制作白切鸡的相关信息时,我们就会同时检索到文摘 A 和文摘 B——尽管两篇文摘的内容可能没有多大差别,但其仍然作为两个独立的检索结果返回了。这种情况对于文摘本身来说并不是问题,毕竟文摘就是为压缩文献内容而生的,两个作者写的两篇文章,哪怕其内容相似,但也是两篇文献,理应有两篇文摘。但是,当我们出于知识组织的目的来看,两篇文章写的内容(知识)是相似的,其就应该只返回一个结果。
怎么解决这个问题呢?这就是当下知识组织领域的研究内容了。
知识单元即知识
为了解决上面的问题,我们就必须精确的定义什么叫知识,更学术一点来说,就是定义什么叫知识元。所谓知识单元,又可以称为知识元,是文献中相对独立的、最小的、不可分割的、表征知识点的一个元素,它可以是一段文字、一幅图表、一个公式、一章或一节、一段动画、一个程序等 3。乍一听,这个概念与当下笔记圈子里强调的 ” 一篇笔记只记录一个想法 ” 异曲同工。其实在这点学术界和笔记圈子的愿景是相同的,就是希望通过基于知识单元作为基本管理单元,从而避免信息的冗余记录,实现知识的融合以及知识的高效检索。
但可惜的是,愿景目前仍然是愿景。对于知识单元,目前学界仍然无法为其下一个准确地描述性定义,其粒度和形态仍然是不明确的 4。这就使得基于知识单元的标准化知识组织难以开展。这里可能有读者会问,不是已经将知识单元定义为不可分割的最小知识元素了吗,为什么还说其没有一个准确的定义呢?其实仔细一想就能明白,这个定义只是告诉了我们理想状态下知识单元应该是怎样的,但并没有告诉我们在一篇篇具体的文献中,哪些内容是知识单元,哪些内容不是知识单元。
目前来说,关于知识单元的定义问题,学界已经衍生出一个名为 ” 知识表示 ” 的研究领域,专门来研究知识的定义和表示方法。目前,研究中常见的知识表示方法有以下几种:
- 谓词逻辑:谓词逻辑是一种建立在逻辑学的形势逻辑基础上的知识表示方法,其利用逻辑公式来描述对象、性质、关系等知识。比如,” 小明出生于中国 ” 可以表示为 “birthplace (小明,中国)”,” 小明出生于美国 ” 可以表示为 “birthplace (小明,美国)“。那么,” 小明出生于中国或美国 ” 则可以表示为 “birthplace (小明,中国) OR birthplace (小明,美国)”。
- 产生式规则:产生式规则是一种简单而直观的规则表示方法,简单来说就是逻辑链,其由多个 “IF… THEN…” 语句连接而成,表示 ” 如果… 就…”。比如 ” 如果你体温大于 37.5 摄氏度,那么你发烧了 ” 可以表示成 “IF 你体温 > 37.5 摄氏度,THEN 你发烧了 “。另外,当有多个这样的句子时,计算机就可以实现推理功能。比如 “IF 你体温 > 37.5 摄氏度,THEN 你发烧了 ”,“IF 你发烧了, THEN 需要吃布洛芬 “,这样两个句子就构成了一个 ” 体温高 → 发烧 →吃药 ” 的逻辑链,从而实现了机器推理。
- 框架表示:框架表示是一种结构化的知识表示方法,这种方法认为某个领域中的知识可以用一种框架来表示。比如,对于哲学家这个类下的具体知识,其都会具有 ” 性别 ”、” 出生日 ”、” 主要作品 ”、” 主要思想 ” 等共同的属性。
- 语义网络(三元组):语义网络是一种图形化的知识表示方法,它将概念和实体之间的关系表示为图形和节点之间的连接。例如,” 猫抓老鼠 ” 这个知识,我们可以将猫和老鼠表示为两个节点,并使用一条边将它们连接起来表示它们之间抓与被抓的关系。
从以上叙述不难看出,目前的知识表示方法更多是侧重于计算机理解的知识单元,其粒度多为句子级别(甚至更小),与我们人类想做的知识组织还是有所区别的。
到底我们应该怎么去完成知识单元级别的知识组织呢?目前很难有一个定论,只能是去实践各种不同的方法后来找到最符合自己情况的方法。下一节,我们就进入到最后一部分,来看看各种各样的笔记组织方法。
什么是知识组织
知识组织一词最早出现于 20 世纪 20 年代末,由英国著名分类法专家 H. E. Bliss 提出 5。从狭义上来说,知识组织指的是在图书馆、档案馆等机构中由图书管理员、档案管理员等人员进行的文档描述、索引和分类等活动 6。而从广义上来说,知识组织是对人类知识(无论是文献这种显性知识,还是人类经验这种隐性知识)进行的搜集、整理、加工、整序、控制等活动 7。
在知识组织的方法上,不同学者给出了不同的划分。比如,李桂贞认为知识组织的方法可以分成以文献单元为基础的方法、以数据单元(知识单元)为基础的方法,以及以专家智能系统为基础的组织方法 8。而曹思源认为,知识组织方法可以分成以基础知识架构为基础、以分类体系构建为基础和以关系网络建立为基础的三种类别 9。常娥则认为知识组织方法主要分为元数据、知识本体、知识地图和语义网络四种类型 10。考虑到以上学者的划分,并综合组织方法以及所组织单元的粒度,本文将个人知识组织的方式分成以下三种:
- 以文献为单元的知识组织
- 以摘要为单元的知识组织
- 以知识为单元的知识组织
知识组织的基本流程
看到这里,有的读者可能就会好奇,该怎么对知识进行组织呢?这个问题其实非常宏大,因为这里既涉及管理单元是什么,又涉及组织方法是什么。但这里我们可以先放下对管理单元的讨论,先了解一下知识组织的基本流程,从而在宏观上对知识组织有一个大致的了解。
其实知识组织的流程和日常我们整理东西的逻辑是非常相似的。我们可以想想看平时我们是怎么整理衣柜的。
首先,把散落的衣物汇总起来。然后进行分门别类——外套用衣架挂好,放入衣柜专门的外套格;裤子叠好,放入裤子格;内衣裤放入内衣裤格;袜子放入袜子格…… 这样,我们找衣物时,我们就可以先按衣物的种类打开对应的收纳格,再找到我们想要的那件衣物。
在这个过程中,每个收纳格实际上就代表着一类衣物。检索时我们可以通过这个类别符号作为中转,通过 ” 先定位类别,再在类别中寻找特定衣物 ” 的逻辑,轻松地找到任何所需的衣物。
知识组织也是如此。实际上图书馆学家们在过去的几百年中,创建了各种各样的检索符号,让我们可以将知识分门别类。而在检索时,我们就能通过这些检索符号,快速地定位到所需的知识类别,再在那个类别中找到我们所需的知识。
文献组织方法
由于大多数可供利用的信息依附于特定的载体,而这些载体就是所谓的文献,所以研究上常把文献与信息混用,把文献组织、文献信息组织统称为信息组织 11。信息组织是图书馆学的重要研究内容,其主要目的是将零散、无序的信息(文献)予以系统化、有序化的过程 12。
信息组织有两种基本方式:一种是以文献的内容为依据对文献进行组织,另一种是以文献的外表属性为依据进行组织 11。
基于文献外表属性的组织方法
所谓文献的外表属性,指的是文献的题目名称、作者名称、载体形式等外在的属性。依外表属性进行文献组织,就是指依据文献的题名、作者、载体形式等显著属性来对文献进行有序化 11。比如图书馆中将图书与报刊杂志分开管理,我们平时按文件撰写日期、作者来对其进行分组、排序都是典型的按文献外表属性进行组织的例子。
在一些情况下,按这些外表属性进行文献组织是很有用的。比如,我们想找 2019 年 4 月份的项目文件的时候,这种按文件编写时间进行分类组织的方法就非常有效了。
但大多数时候,我们在查找文献时,往往都是从文献的内容入手,希望找到特定内容的文献。比如,我们在写毕业论文的时候,肯定是按照自己论文所研究的内容来搜索文献,而不是说 ” 我要找 xx 年 xx 月发表的文献 “。因此,很多情况下,仅凭基于文献外表属性的组织方法难以满足我们的需求。这就需要依据文献内容进行组织的方法。
基于文献内容的组织方法
人们提到信息组织,更多的是指针对文献内容的组织方法 5。基于文献内容的组织方法,主要有以下几种:
- 分类法:分类法是最传统的组织方法 13
- 主题法:与分类法互补的方法,主要有 主题法标题法, 主题法元词法,主题法叙词法,主题法关键词法。
- 引文网络:这种方法指的是通过文献的参考文献构筑引文网络、然后再使用文献计量学相关方法对其进行分析的方法
基于分类法主题法的个人知识管理系统
了解了以上信息组织方法后,我们就可以实现第一种个人知识管理系统了。
第一种个人知识管理系统由原文库和笔记库两部分组成。理由很简单,因为笔记是我们对文献、图像、音频中知识的概括,因此可能会出现记录不周、日后遗忘的情况,这时候我们就需要辅以一个原文库,在记笔记的时候附上知识的出处,这样我们日后查找复习就方便多了。现在我将分别讲解每个库的搭建方法。
讨论
若阁下有独到的见解或新颖的想法,诚邀您在文章下方留言,与大家共同探讨。
知识管理知识管理基础卢曼卡片盒与知识组织基于分类法主题法的个人知识管理系统引文网络知识组织 zettelkasten 分类法卢曼卡片盒文献组织知识组织索引 Obsidian 主题法