4.知识图谱导论

知识图谱概念

知识图谱本质上是一种语义网络。其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。

问题

三个层面问题

20221029153330-2022-10-29-15-33-31

知识体系组织形式

Ontology vs. Knowledge Base

  • Ontology:共享概念化的规范,涉及概念、关系和公理三个要素
  • Knowledge:服从于ontology 控制的知识单元的载体
  • Ontology是蛋糕的模具,Knowledge Base是蛋糕

Ontology(知识本体)

从语义和知识层次上描述构架信息系统的概念模型

  • 树状结构,不同层节点之间是严格的IsA关系
  • 优点:可以适用于知识的推理
  • 缺点:无法表示概念的二义性(运动员:体育?人物?)

Taxonomy(知识分类学)

关于具体或抽象事物的分类组织的学科与方法

  • 树状结构,上下位节点之间非严格的IsA关系
  • 优点:可以表示概念的二义性(体育->运动员)
  • 缺点:不适用于推理,无法避免概念冗余(餐厅:美食?机构? 地点?)

Folksonomy(分众分类)

大众自发的用标签对网络信息分类标识和共享的资源组织方法

  • 类别标签,更加开放
  • 优点:能够涵盖更多的概念
  • 缺点:如何进行标签管理?

知识图谱的生命周期

  • 知识建模
    • 建模领域知识结构
  • 知识获取
    • 获取领域内的事实知识
  • 知识集成
    • 估计知识的可信度,将碎片知识组装成知识网络
  • 知识存储
    • 提供高性能知识服务

RDF

RDF是一种表述对象(web resources)和对象之间关系的简单语言

  • 使用(subject, predicate, object)三元组的形式来陈述关于对象(使用URI标识的resources)的知识,也就是两个对象之间的带类别链接
  • RDF是一个通用模型,可以用各种不同的格式表示,如XML、N-Triples、N3、JSON-LD等