600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > 从零学习知识图谱——04(常见知识库及知识图谱的知识表示方法 )

从零学习知识图谱——04(常见知识库及知识图谱的知识表示方法 )

时间:2020-02-26 15:16:03

相关推荐

从零学习知识图谱——04(常见知识库及知识图谱的知识表示方法 )

知识库

Cyc

Cyc 是持续时间最久,影响范围较广,争议也较多的知识库项目。Cyc 知识库的知识表示框架主要由术语 Terms 和断言 Assertions 组成。Terms 包含概念、关系和实体的定义。Assertions 用来建立 Terms 之间的关系,这既包括事实 Fact 描述,也包含规则 Rule 的描述。最新的 Cyc 知识库已经包含有 50 万条 Terms 和700 万条 Assertions。 Cyc 的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。 但过于形式化也导致知识库的扩展性和应用的灵活性不够。Cyc 提供开放版本 OpenCyc。

WordNet

WordNet 是最著名的词典知识库,主要用于词义消歧。 WordNet的表示框架主要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词) ,动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等。

ConceptNet

ConceptNet 是常识知识库。 ConceptNet 主要依靠互联网众包、 专家创建和游戏三种方法来构建。ConceptNet 知识库以三元组形式的关系型知识构成。ConceptNet 采用了非形式化、更加接近自然语言的描述,ConceptNet 比较侧重于词与词之间的关系。 从这个角度看, ConceptNet更加接近于 WordNet,但是又比 WordNet 包含的关系类型多。此外,ConceptNet完全免费开放,并支持多种语言。

ConceptNet5 的知识表示框架主要包含如下要素: 概念-Concepts、 词-Words、短语-Phrases、断言 Assertions、关系-Relations、边-Edges。Concepts 由 Words 或Phrases 组成, 构成了图谱中的节点。

Assertions 描述了 Concepts 之间的关系,类似于 RDF 中的 Statements。Edges 类似于 RDF 中的 Property。 一个 Concepts 包含多条边, 而一条边可能有多个产生来源。

语义网与知识图谱

Freebase

是一个开放共享的、协同构建的大规模链接数据库。 Freebase 基于 RDF 三元组模型,底层采用图数据库进行存储。Freebase 的一个特点是不对顶层本体做非常严格的控制,用户可以创建和编辑类和关系的定义。

Freebase 的知识表示框架主要包含如下几个要素: 对象-Object, 事实-Facts,类型-Types 和属性-Properties。“Object”代表实体。每一个“Object”有一个唯一的ID, 称为 MID (Machine ID) 。 一个“Object”可以有一个或多个“Types”。 “Properties”用来描述“Facts”。 例如: “Barack Obama”是一个 Object, 并拥有一个唯一的 MID:“/m/02mjmr” 。这个 Object 的一个 type是“/government/us_president”,并有一个

称为“/government/us_president/presidency_number”的 Property,其数值是“44”。Freebase 使用复合值类型(CVT:Compound V alue Types )来处理多元关系。

DBPedia

是早期的语义网项目。 DBPedia 意指数据库版本的 Wikipedia, 是从Wikipedia 抽取出来的链接数据集。

BPedia 采用了RDF 语义数据模型。

支持各个网站采用语义标签(Semantic Markup) 的方式将语义化的链接数据嵌入到网页中。 搜索引擎自动搜集和归集这些,快速的从网页中抽取语义化的数据。 提供了一个词汇本体用于描述这些语义标签。

WikiData

WikiData 的目标是构建一个免费开放、多语言、任何人或机器都

可以编辑修改的大规模链接知识库。

WikiData 的知识表示框架主要包含如下要素:页面-Pages,实体-Entities,条目-Items, 属性-Properties, 陈述-Statements, 修饰-Qualifiers, 引用-Reference 等。

WikiData 起源于 Wikipedia,因此,与 Wikipedia 一样,是以页面“Page”为基本组织单元。Entities 类似于 OWL: Things,代指最顶层的对象。每一个 Entity 都有一个独立的维基页面。主要有两类 Entities:Items 和 Properties。Item 类似于 RDF中的 Instance,代指实例对象。Properties 和 Statement 分别等价于 RDF 中的

Property 和 Statement。通常一个 Item 的页面还包含有多个别名-aliases 和多个指向维基百科的外部链接-Sitelinks。 每个 Entities 有多个 Statements。 一个 Statement包含:一个 Property、一个或多个 V alues、一个或多个 Qualifiers,一个或多个References、一个标示重要性程度的 Rank。修饰-Qualifiers 用于处理复杂的多元表示。如下图中的一个陈述“spouse: Jane Belson”描述了一个二元关系。我们可以使用 Qualifiers 给这个陈述增加多个附加信息来刻画多元关系。

WikiData 支持多种数值类型,包括:其自有的 Item 类型、RDF Literal、URL、媒体类型 Commons Media 和三种复杂类型:Time、Globe coordinates 和 Quantity。WikiData 允许给每个 Statement 增加三种权重:normal(缺省) ,preferred 和 deprecated。WikiData 定义了三种 Snacks 作为Statement 的 具 体 描 述 结 构 : PropertyV alueSnack 、 PropertyNoV alueSnack 、PropertySomeV alueSnack。“PropertyNoV alueSnack”类似于 OWL 的“Negation”,

用 于 表 示 类 似 于 ““Elizabeth I of England had no spouse.” 的 知 识 。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。