python语义⽹络图_知识图谱之语义⽹络篇
开篇还是从我在情报⼯程发表的⼀篇论⽂的前⾔开始讲起。
销售心得
知识图谱(Knowledge Graph)的概念由⾕歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及,并在智能问答、情报分析、反欺诈等应⽤中发挥重要作⽤。知识图谱本质上是⼀种叫做语义⽹络(mantic network)的知识库,即具有有向图结构的⼀个知识库,其中图的结点代表实体(entity)或者概念(concept),⽽图的边代表实体/概念之间的各种语义关系,⽐如说两个实体之间的相似关系。语义⽹络[1]是20世纪50年代末60年代初提出,代表性⼈物有M. Ross Quillian和Robert F. Simmons。语义⽹络可以看成是⼀种⽤于存储知识的数据结构,即基于图的数据结构,这⾥的图可以是有向图,也可以是⽆向图。使⽤语义⽹络,可以很⽅便地将⾃然语⾔的句⼦⽤图来表达和存储,⽤于机器翻译[2]、问答系统[3]和⾃然语⾔理解[4]。下⾯就举⼀个例⼦,⽐如说,要表⽰John gave a book to Mary这样⼀句话,可以⽤下⾯这样的⼀个语义⽹络来表⽰:
⽽这个树其实就是⼀个TBox(terminological box),是术语逻辑的早期⼯作。相⽐⾃然语⾔⽂本的表⽰⽽⾔,语义⽹络的图结构可以更好地表⽰⾃然语⾔的结构,从⽽更好地将⾃然语⾔的语义提取出来。
下⾯⼀个问题就是,语义⽹络的表达能⼒是否⾜够呢?是不是所有⾃然语⾔的知识都适合⽤语义⽹络来表⽰呢?为了回答这⼀问题,20世纪70年代开始有不少⼯作研究语义⽹络跟⼀阶谓词逻辑之间的关系,
⽐如说,⽂献[5]提供了⼀个算法将⼀个语义⽹络转化成谓词逻辑的形式,⽽⽂献[6]则给出了如何⽤语义⽹络来表⽰⼀阶谓词逻辑中的连接词和量词。这就说明,语义⽹络具有跟⼀阶谓词逻辑同样的表达能⼒。但是既然语义⽹络和⼀阶逻辑具有等价的表达能⼒,为什么我们不直接⽤⼀阶逻辑呢?要回答这个问题,就需要了解知识表⽰和推理⽅法的评价标准是什么。评价⼀个知识表⽰和推理⽅法是否后,不能仅仅看这个⽅法是否⾜够表达知识,还要看这个⽅法是否⽀持⾼效的推理。众所周知,⼀阶谓词逻辑的推理是不可判定的(不可判定逻辑系统_百度百科),⽽且⼀阶逻辑的线性表⽰使得并⾏推理变得困难。相⽐⽽⾔,语义⽹络由于采⽤了图表⽰,可以采⽤⼀些并⾏计算框架,⽐如说Pregel,来做推理,从⽽可以构建⾼效的并⾏推理机。绿色草地图片
到了20世纪80年代,⼈⼯智能研究的主流变成了知识⼯程和专家系统,特别是基于规则的专家系统开始成为研究的重点。这⼀时期,语义⽹络的理论更加完善,特别是基于语义⽹络的推理出现了很多⼯作(例如⽂献[7]中的⼯作),⽽且语义⽹络的研究开始转向具有严格逻辑语义的表⽰和推理。20世纪80年代末到90年代,语义⽹络的⼯作集中在对于概念(concept)之间关系的建模,提出了术语逻辑(terminological logic)以及描述逻辑。这⼀时期⽐较有代表性的⼯作是Brachman等⼈提出的CLASSIC语⾔[8]和Horrock实现的FaCT推理机[9]。进⼊21世纪,语义⽹络有了⼀个新的应⽤场景,即语义Web。语义Web是由Web的创始⼈Berners-Lee及其合作者提出[10],通过W3C1的⼀些标准来实现Web的⼀个扩展,从⽽数据可以在不同应⽤中共享和重⽤。语义Web跟传统Web的⼀个很⼤的区别是
⽤户可以上传各种图结构的数据(采取的是W3C的标准RDF),并且数据之间建⽴链接,从⽽形成链接数据[11]。链接数据项⽬汇集了很多⾼质量知识库,⽐如说Freeba、DBpedia和Yago,这些知识库都是来源于⼈⼯编辑的⼤规模知识库-维基百科。这些⾼质量的知识库的发布,为⾕歌知识图谱项⽬的成功打下了坚实的基础。
参考⽂献江米
[1] John F. Sowa: Principles of Semantic
Networks: Exploration in the Reprentation of Knowledge, Morgan Kaufmann
建军节说说
Publishers, INC. San Mateo, California, 1991.
[2] Robert F. Simmons:Technologies for法律事务管理制度
machine translation [J] // Future Generation Comp. Syst. 2(2): 83-94 (1986)
[3] Robert F. Simmons: Natural language
手机流量查询question-answering systems: 1969 [J] // Commun. ACM 13(1): 15-30 (1970)
[4] Yeong-Ho Yu, Robert F. Simmons:Truly Parallel
Understanding of Text [C] // AAAI 1990: 996-1001
[5] Robert F. Simmons, Bertram C. Bruce. Some
Relations Between Predicate Calculus and Semantic Net Reprentations of
Discour [C] // IJCAI 1971: 524-530
[6] Lenhart K. Schubert. Extending The
Expressive Power of Semantic Networks [C] // IJCAI 1975: 158-164
[7] Scott E. Fahlman, David S. Touretzky,
Walter van Roggen:Cancellation in a Parallel Semantic Network. [C] IJCAI 1981: 257-263
[8] Ronald J. Brachman, Deborah L.
McGuinness, Peter F. Patel-Schneider, Alexander Borgida: "Reducing"
三角地
CLASSIC to Practice: Knowledge Reprentation Theory Meets Reality [J] // Artif. Intell. 114(1-2): 203-237 (1999)
[9] Ian Horrocks. The FaCT System [C] //
TABLEAUX 1998: 307-312
[10] Tim Berners-Lee, James Hendler, Ora
山羊爷爷的故事
Lassila. The Semantic Web [C] // Scientific American Magazine, 2001.
[11] Christian Bizer, Tom Heath, Tim
Berners-Lee:Linked Data - The Story So Far [J]// Int. J. Semantic Web Inf. Syst. 5(3): 1-22 (2009)