基于知识图谱的知识推理
阅读笔记:基于知识图谱的知识推理
论⽂:A review: Knowledge reasoning over knowledge graph
基本概念、定义
⼈⼯智能算法必须具有推理能⼒,推理过程必须依赖于知识⼯程时代的先验知识和经验,⼤量知识图(KGs),如
YAGO,WordNet,Freeba已经开发。KGs包含⼤量的先验知识,同时也能有效地组织数据。
知识图能够从⼤规模数据中挖掘、组织和有效地管理知识,以提⾼信息服务质量,为⽤户提供更智能的服务。所有这些⽅⾯都依赖于知识推理对知识图的⽀持,知识图是推理领域的核⼼技术之⼀。知识图的知识推理是为了识别错误,从现有数据中推断出新的结论。通过知识推理,可以导出实体间的新关系,并反馈丰富知识图,⽀持先进应⽤。
知识推理是利⽤已知知识推断出新知识的过程。
随着互联⽹数据规模的爆炸式增长,传统的基于⼈⼯构建知识库(KBs)的⽅法已不能适应⼤数据时代挖掘⼤量知识的需要。为此,数据驱动的机器推理⽅法逐渐成为知识推理研究的主流。
知识库的丰富内容为知识推理技术的发展提供了新的机遇和挑战。随着知识表⽰学习、神经⽹络等技术的普及,⼀系列新的推理⽅法应运⽽⽣。
前沿的知识图谱:
1. WordNet
WordNet是⼀个于1985年创建英语词汇数据库。句法集是通过概念语义和词汇关系相互联系的,如狗和哺乳动物之间的IS-A关系或汽车与发动机的部分整体关系。WordNet在信息系统中有着⼴泛的应⽤:词义消歧、信息检索、⽂本分类、⽂本摘要、机器翻译甚⾄纵横字谜⽣成。最新版本WordNet3.0包含15万字,20万个语义关系。
河中之水歌
2. Freeba
Freeba是⼀个由社区成员组成的⼤型协作知识库,由Metaweb构建。包含从Wikipedia、NNDB、时尚模特⽬录和MusicBrainz等来源获取的数据,以及⽤户提供的数据。⾕歌的知识图部分是由Freeba提供的。⽬前约有30亿个三元组。
3. ** YAGO**
YAGO中的信息是从Wikipedia、WordNet和GeoNames中提取的。YAGO将WordNet的⼲净分类法与丰富的Wikipedia分类系统相结合,将实体超过35万个类。YAGO将时间维度和空间维度附加到其许多事实和实体上。它从10个不同语⾔的维基百科中提取并合并实体和事实。⽬前,YAGO拥有超过1.5亿个实体和关系。YAGO已被⽤于沃森⼈⼯智能系统。
4. DBpedia
DBpedia是⼀个跨语⾔项⽬,旨在从Wikipedia项⽬创建的信息中提取结构化内容。DBpedia与外部数据集(包括Freeba、OpenCyc等)之间有超过4500万个链接。DBpedia使⽤资源描述框架(RDF)来表⽰提取的信息。DBpedia的实体在
⼀致的本体论,包括⼈、地⽅、⾳乐专辑、电影、电⼦游戏、组织、物种和疾病。DBpedia被⽤作ibmwatson的Jeopardy中的⼀个知识源!如何训练小狗
5. wikidata
wikidata是⼀个多语⾔、开放、链接、结构化的知识库,可以被⼈和机器阅读和编辑。它⽀持超过280种语⾔版本的Wikipedia,并提供共同的结构化数据源。Wikidata继承了Wikipedia的众包协作机制,并
⽀持基于triples的编辑。它依赖于项⽬和报表的概念。项表⽰实体。语句由⼀个编码的主属性值对组成。
6. NELL
Never Ending Language Learning system是⼀个语义机器学习系统,它可以全天候运⾏,永远学习阅读⽹页。NEL的输⼊包括: (1)⼀个初始的本体,它定义了NELL所属的数百个类别和关系希望阅读
(2)10⾄15种⼦的例⼦,每⼀个类别和关系。有了这些输⼊,内尔会⾃动从⽹络中提取三重事实。
基于知识图谱的知识推理:
⽬标是利⽤机器学习的⽅法来推断实体对之间的潜在关系,并根据现有数据⾃动识别错误知识,以补充KGs。例如,如果KG包含⼀个事实,如(Microsoft,IsBadIn,Seattle),(Seattle,StateLocatedIn,Washington)和
(Washington,CountryLocatedIn,USA),那么我们将获得缺少的链接(Microsoft,HeadquarterLocatedIn,USA)。
知识推理的对象不仅是实体之间的属性和关系,还包括实体的属性值和本体的概念层次。例如,如果⼀个实体的⾝份证号码属性已知,则可以通过推理获得该实体的性别、年龄和其他属性。
KG基本上是⼀个语义⽹络和⼀个结构化的语义知识库,可以正式解释现实世界中的概念及其关系。基于知识图的推理不仅局限于传统的基于逻辑和规则的推理⽅法,⽽且具有多样性。同时,知识图由实例组成,使推理⽅法更加具体。
近年来,研究⼈员实现了许多开放式信息抽取(OIE)系统,如textranner,WOE,极⼤地扩展了知识的数据源。
因此,知识库的丰富内容为知识推理技术的发展提供了新的机遇和挑战。随着知识表⽰学习、神经⽹络等技术的普及,⼀系列新的推理⽅法应运⽽⽣。
推理⽅法分为三类:
1. 基于规则的推理
2. 基于分布式表⽰的推理
3. 基于神经⽹络的推理。
知识图推理的相关应⽤
1. 知识图的完成
2. 问题回答
3. 推荐系统
基于规则的推理
急救方
基于⼀阶谓词逻辑规则的知识推理
早期的知识推理⽅法(包括本体推理)受到了⼴泛的关注,并产⽣了⼀系列的推理⽅法。此外,这些⽅法包括谓词逻辑推理、本体推理和随机游⾛推理,可⽤于知识图的推理。
例如,⼈际关系推理可以采⽤⼀阶谓词逻辑,将关系作为谓词,字符作为变量,⽤逻辑运算符来表达⼈际关系,然后设置关系推理的逻辑和约束条件来进⾏简单的推理。使⽤⼀阶谓词逻辑进⾏推理的过程是下式
(姚明,华斯博宁,上海)∧(上海,中国)⇒(姚明,国籍,中国)
⼀阶归纳学习(FOIL)(Schoenmackers,Etzioni,Weld,&Davis,2010)是谓词逻辑的⼀个典型⼯作,其⽬的是搜索KG中的所有关系,并获得每个关系的Horn⼦句集⼀种预测对应关系是否存在的特征模式。最后,利⽤机器学习⽅法得到关系判别模型。
FOIL的相关研究有很多。例如:
1. nFOIL和tFOIL(Landwehr、Kersting和Raedt,2007)分别将朴素贝叶斯学习⽅案和树增强天真贝叶斯与箔⽚相结合。nFOIL通
过朴素贝叶斯的概率得分来指导结构搜索。tFOIL放松了天真的Bayes假设,允许⼦句之间存在额外的概率依赖关系。
2. kFOIL公司(Landwehr,Pasrini,De Raedt& Frasconi,2010)将FOIL的规则学习算法和核⽅法结合起来,从关系表⽰中导
出⼀组特征。因此,FOIL搜索可以作为内核⽅法中的特征的相关⼦句。
3. Nakashole,Sozio,Suchanek,and Theobald(2012)提出了⼀种结合软推理规则和硬规则的不确定RDF知识库的查询时间⼀
阶推理⽅法。软规则⽤于派⽣新事实,⽽硬规则⽤于强制实现⼀致性。
KG和推断事实之间的约束。Galárraga,Teflioudi,Ho,and Suchanek(2013)提出了在知识图上挖掘Horn规则的AMIE系统。将这些规则应⽤到知识库系统中,可以得到新的事实,⽤于知识图的补充和错误的检测。
传统的FOIL算法在⼩规模知识库上具有较⾼的推理精度。此外,实验结果表明,实体-关系关联模型具有较强的推理能⼒。然⽽,由于⼤规模知识图中实体和关系的复杂性和多样性,很难穷尽所有的推理模式。另外,穷举算法的⾼复杂度和低效率使得原FOIL算法不适合于⼤规模图的推理。
幸福的人生 为了解决这个问题,Galárraga,Teflioudi,Ho,和 Suchanek(2015)通过⼀系列修剪和查询重写技术将AMIE扩展到
AMIE+,以挖掘更⼤的知识库。此外,AMIE+通过考虑类型信息和使⽤联合推理提⾼了预测精度。demeter、Rocktäschel和
矜持拼音Riedel(2016b)提出了⼀种可伸缩的⽅法,将⼀阶蕴涵引⼊关系表⽰中,以改进⼤规模KG推理。
同时,Wang和Li(2015)提出了⼀种新的规则学习⽅法RDF2Rules。RDF2Rules挖掘频繁谓词循环(FPC)来并⾏化此过程。由于适当的修剪策略,处理⼤规模KBs⽐AMIE+更有效。为了有效地形式化语义⽹和推理,⼀些研究者提出了⼀种可处理的语⾔,称为描述逻辑(DL)。描述逻辑是在命题逻
辑和⼀阶谓词逻辑的基础上发展起来的本体推理的重要基础。描述逻辑的⽬标是平衡表⽰能⼒和推理复杂度。它能够为知识图提供定义良好的语义和强⼤的推理⼯具,满⾜本体构建、集成和演化的需要。因此,它是⼀种理想的本体语⾔。使⽤DL表⽰的知识库由术语公理(TBox)和断⾔公理(ABox)组成(Lee,Lewicki,Girolami,&Sejnowski,1999)。TBox由⼀组声明概念和⾓⾊的⼀般属性的包含断⾔组成。例如,断⾔是指说明⼀个概念表⽰另⼀个概念的专门化。ABox包含对单个对象的断⾔。知识库的⼀致性是知识图推理的基本问题。通过TBox和ABox将知识图中的复杂实体或关系推理转化为⼀致性检测问题,从⽽细化和实现知识推理。 Halaschek-Wiener,Parsia,Sirin,and Kalyanpur(2006)提出了⼀种描述逻辑推理算法⽤于在ABoxes断⾔的添加和删除下对知识图进⾏补充。它提供了对波动/流数据进⾏推理的关键步骤。Calvane,De Giacomo,Lembo,Lenzerini,and Rosati(2006)提出了⼀种基于认知的⼀阶查询语⾔EQL,该语⾔能够解释查询描述逻辑的不完整性知识图表。为了扩展具有模糊能⼒的经典描述逻辑,提出了⼤量的模糊描述逻辑。Li,Xu,Lu,and Kang(2006)提出了⼀种新的离散tableau算法来解决FSHI知识库与⼀般TBoxes的可满⾜性问题,为模糊DLs中实现⼀般TBoxes推理提供了⼀种新的途径。此外,Stoilos、Stamou、Pan、Tzouvaras和Horrocks(2007)利⽤模糊集理论对DL进⾏了扩展,以表⽰知识和执⾏推理任务。为了装备描述逻辑来处理元知识,Krötzsch、Marx、Ozaki和
Thost(2018)⽤有限的属性值对集合(称为属性描述逻辑)来丰富DL概念和⾓⾊,⽤于知识图推理。
现有的DL推理机不为⽤户提供解释服务。为了解决这⼀问题,Bienvenu、Bourgaux和Goasdoué(2019)提出了⼀个框架,使推理系统在不⼀致容忍语义下具有解释能⼒。
基于规则的知识推理
基于规则的知识推理模型的基本思想是利⽤简单的规则或统计特征进⾏推理。
NELLs语⾔学习系统(NELLs)的推理组件(Mitchell等⼈,2015)学习概率规则,然后在⼈⼯筛选后实例化规则,最后从其他学习到的关系实例中推断出⼀个新的关系实例。
SpassYAGO通过将三元组抽象为等效规则类。Paulheim和Bizer(2014)提出SDType和SDValidate,利⽤属性和类型的统计分布来完成类型和错误检测。SDType使⽤属性的头实体和尾部实体位置中类型的统计分布来预测实体的类型。SDValidate计算每个语句的相对谓词频率(RPF),RPF值低表⽰不正确。
Jang和Megawati(2015)提出了⼀种评估质量的新⽅法知识图。他们在分析数据模式后,选择出现频率较⾼的模式作为⽣成的测试模式来评估知识图的质量。
Wang,Mazaitis,and Cohen(2013)和Wang,Mazaitis,Lao,and Cohen(2015)提出了使⽤个性化
PageRank(ProPPR)进⾏知识图推理的编程。ProPPR的推理是基于⼀个个性化的PageRank过程,⽽不是由SLD解析定理证明器构造的证明。
Catherine和Cohen(2016)指出,ProPPR可⽤于执⾏知识图建议。他们把问题描述成⼀个概率推理和学习任务。Cohen(2016)提出张量对数,其中推理使⽤可微过程。受TensorLog的启发,Yang,Yang,and Cohen(2017)描述了⼀个框架,即神经逻辑程序设计,其中将逻辑规则的结构和参数学习结合在⼀个端到端可微模型中。
基于规则的推理⽅法还可以将⼈⼯定义的逻辑规则与各种概率图模型相结合,在构建的逻辑⽹络基础上进⾏知识推理,从⽽获得新的事实。
例如,Jiang、Lowd和Dou(2012)提出了⼀种基于马尔可夫逻辑的NELL清洗系统。这使得知识库能够利⽤联合概率推理,或者将马尔可夫逻辑⽹络(MLN)(Richardson&Domingos,2006)应⽤于web规模的问题。它只使⽤初始系统的本体论约束和置信度,以及标记的数据。
Chen和Wang(2014)提出了⼀种概率知识库(ProbKB),它允许⼀种⾼效的基于SQL的推理算法来完成知识,并批量应⽤MLN推理规则。Kuželka and Davis(2019)从理论上研究了马尔可夫逻辑权值学习的适⽤性在缺少数据的情况下从⼀个KB的⽹络。在学习权值后,MLN可以⽤来推断额外的事实来完成知识图。然⽽,由于逻辑规则中的⼦句值必须是布尔变量,所以在MLN中引⼊⼦句置信度⽐
较困难。此外,布尔变量赋值的各种组合使得学习和推理难以优化。
为了解决这个问题,概率软逻辑(PSL)(Kimmig、Bach、Broecheler、Huang和Getoor,2012年)。PSL使⽤FOIL规则作为模板语⾔,在区间[0,1]范围内具有软真值的随机变量图形模型。在这种情况下,推理被认为是⼀个连续的优化任务,可以有效地处理。
为此,Pujara、Miao、Getoor和Cohen(2013a)使⽤PSL来共同推理候选事实及其相关的提取可信度,识别共同参照实体,并结合本体论约束。此外,他们还提出了⼀种分区技术(Pujara,Miao,Getoor,&Cohen,2013b)在考虑推理速度和精度的前提下,对⼤规模知识图进⾏推理。该⽅法⾸先⽣成以实体和关系为节点,本体约束为边的知识图。然后利⽤聚类技术中的边缘最⼩割对关系和标签进⾏划分。最后,利⽤PSL在知识图上定义⼀个联合概率分布来完成集合推理。Bach、Broecheler、Huang和Getoor(2017)提出了铰链损失马尔可夫随机场(HL-MRF),它可以利⽤布尔逻辑捕捉松弛的概率推理和模糊逻辑的精确概率推理,使它们成为离散和连续数据的有⽤模型。他们还引⼊了PSL,使HL MRF易于定义和⽤于⼤型KG。
基于本体的知识推理
知识图上的知识推理与本体密切相关,它与资源描述框架模式(RDFS)、Web本体语⾔(OWL)等本体语⾔有着密切的联系。知识图可以看作是知识存储的⼀种数据结构。尽管它没有形式语义,但
它可以通过应⽤RDFS或OWL来推理规则为⼀公⽄。Pujara等⼈。(2013b)证明了OWL-EL表⽰的本体适合于转换为KG并对其进⾏有效的推理。基于本体的推理⽅法主要是利⽤更抽象的频繁模式、约束或路径进⾏推理。当通过本体概念层进⾏推理时,OWL能够提供丰富的语句和知识表⽰能⼒。
Zou,Finin,and Chen(2004)提出了⼀个推理引擎F-OWL,它使⽤基于框架的系统对OWL本体进⾏推理。F-OWL⽀持知识库的⼀致性检查,通过解析提取隐藏的知识,并通过导⼊规则⽀持进⼀步的复杂推理。Sirin、Parsia、Grau、Kalyanpur和Katz(2007)提出了OWL-DL reasoner弹丸来⽀持基于动态知识图的增量式推理,通过重⽤前⼀步的推理结果,对过程进⾏增量更新。
hen,Goldberg,Wang,and Johri(2016)提出了本体论寻路(OP)算法,该算法通过⼀系列优化和并⾏化技术将其推⼴到web规模的知识库:轮流使⽤推理规则的关系知识库模型,将挖掘任务划分为更⼩的单⼦任务的新规则挖掘算法,以及⼀个修剪策略在使⽤这些规则之前,会产⽣噪⾳和资源消耗。
Wei,Luo,and Xie(2016a)提出并实现了⼀个基于owl2rl推理规则的分布式知识图推理系统(KGRL)。由于更具表达性的规则,KGRL具有更强⼤的推理能⼒。它可以消除冗余数据并进⾏推理,通过优化,结果更加紧凑。此外,它还可以发现知识图中不⼀致的数据。
基于⼤规模本体论的可扩展推理⽅法是基于⼤规模知识的⾼效推理⽅法。周等。(2006)提出了⼀
个⽤于⼤规模OWL本体的存储和推理系统Minerva。Minerva结合了DL推理机和规则引擎进⾏本体推理,以提⾼效率。为了提⾼推理的可扩展性和性能,Soma和
Prasanna(2008)提出了两种OWL知识库推理过程的并⾏化⽅法。在数据划分⽅法,对知识图进⾏划分,并将完整的规则库应⽤于知识库的每个⼦集。在规则库划分⽅法中,对规则库进⾏分区,并⾏系统的每个节点将⼀个⼦集规则应⽤于原始KG。
Chen,Chen,Zhang,Chen,and Wu(2013b)提出了⼀个⼤规模复杂⽣物医学知识图的OWL推理框架,该框架利⽤MapReduce算法和OWL属性链推理⽅法。最近,Marx、Krötzsch和Thost(2017)提出了⼀个更简单、基于规则的多属性谓词逻辑⽚段,可⽤于⼤型知识图上的本体论推理
基于随机游⾛算法的知识推理
⼤量的研究表明,将路径规则引⼊知识推理可以提⾼推理性能。受此启发,许多研究者将路径规则注⼊知识推理任务中。
路径排序算法(PRA)(Lao&Cohen,2010)是⼀种在图中执⾏推理的通⽤技术。为了学习知识库中某个特定边缘类型的推理模
型,PRA会找到经常链接节点的边缘类型序列,这些节点是被预测的边缘类型的实例。然后PRA将这
些类型作为logistic回归模型中的特征来预测图中的缺失边。典型的PRA模型由三个部分组成:特征提取、特征计算和特定关系分类。
第⼀步是找到⼀组潜在的有价值的路径类型来链接实体对。为此,PRA在图上执⾏路径约束随机游⾛,以记录从h开始到t的有限长度。
第⼆步是通过计算随机游⾛概率来计算特征矩阵中的值。给定⼀个节点对(h,t)和⼀个路径π,PRA将特征值计算为随机⾏⾛概率p(t | h,π),即当给定从h开始的随机值时到达t的可能性,以及π中包含的关系。计算如下
最后⼀步是利⽤logistic回归算法对每个关系进⾏训练,得到路径特征的权重。
PRA模型不仅精度⾼,⽽且⼤⼤提⾼了计算效率,为解决⼤规模知识图的推理问题提供了⼀种有效的解决⽅案。Lao,Mitchell,and ohen(2011)已经证明了⼀种基于约束和,加权的随机游⾛可以⽤来可靠地预测知识库的新信念。它们描述了⼀种数据驱动的寻路⽅法,⽽原始的PRA算法通过枚举⽣成路径。为了使PRA适⽤于⼤规模KGs上的推理,他们修改了PRA中的路径⽣成过程,使其只⽣成对任务可能有⽤的路径。具体地说,它们要求PRA模型中包含⼀条路径,前提是它⾄少检索到训练集中的⼀个⽬标实体,并且长度⼩于l,因为少量可能的关系路径有利于推理。最后,两个实体之间所有路径的加权概率和分数是两个实体之间存在关系的可能性的度量。
此外,Lao、Subramanya、Pereira和Cohen(2012)也证明了这⼀点.路径约束随机游⾛模型可以有效地预测新的信念,利⽤⼤规模⽂本分析语料库和背景知识相结合的优势。实验结果表明,该模型结合了⽂本中的句法模式和背景知识中的语义模式,能够⾼精度地推断出新的信念。
尽管PRA⽅法具有很好的可解释性,但随机游⾛推理的⼀个主要问题是特征稀疏性。为了解决这个问题,Gardner、Talukdar、Krishnamurthy和Mitchell(2014)将向量相似性引⼊KGs上的随机⾏⾛推理中,以减少使⽤表⾯⽂本的固有特征稀疏性。也就是说,当在随机游动中跟随⼀系列的边类型时,它们允许游动跟随与给定边类型在语义上和谐的边,这是由边缘类型的向量空间嵌⼊定义的。这种⽅法结合了分布相似性和符号逻辑推理的概念,降低了PRA构造的特征空间的稀疏性。⼀⽅⾯,对整个知识图进⾏推理⽐较耗时,⽽且推理通常与局部信息有关,因此可以在KG上进⾏局部推理。另⼀⽅⾯,全局信息的规模较粗,与细粒度的局部信息相结合,可以提⾼推理的准确性。基于以上两个原因,Gardner和Mitchell(2015)定义了⼀种更简单、更有效的算法,称为⼦图特征提取(SFE)。SFE只是PRA的第⼀步。当给定⼀些节点对时,它们⾸先执⾏局部搜索来刻画实体节点周围的图。然后,他们在这些局部⼦图上运⾏⼀组特征抽取器,以获得每个实体对的特征向量。它不仅在时间复杂度上,⽽且在推理性能上都⼤⼤优于PRA。
Liu,Han,Jiang,Liu,and Geng(2017b)研究了现有随机⾏⾛模型所采⽤的基本假设的两个潜在问题。⾸先,该算法通过随机抽样的⽅式提取关系路径特征,提⾼了计算效率,同时牺牲了KG中已有
超级时空穿梭之门寓言故事道理信息的利⽤率。第⼆,采⽤监督学习⽅法建⽴关系推理模型,模型的有效性取决于训练数据,尤其是受数据稀疏性影响的数据。在此基础上,提出了双向语义假设和关系图推理假设,设计并实现了两层随机⾏⾛算法(TRWA)。模型如图1所⽰。
将局部特征建模和局部特征提取两种⽅法相结合进⾏局部特征提取。最后,对全局模块和局部模块进⾏加权合并,得到完整的逻辑规则推理算法。
没有引导的纯随机游动在寻找有⽤公式时效率很低,甚⾄可能由于引⼊噪声⽽误导推理。虽然有⼈提出了⼀些启发式规则来引导随机游动,但由于公式的多样性,这些规则的性能仍然不理想。为了解决这个问题,Wei,Zhao,and Liu(2016b)提出了⼀种新的⾯向⽬标的推理算法,在每⼀步都以特定的推理⽬标为⽅向在随机⾏⾛的过程中。具体地说,为了实现这种⽬标引导机制,该算法在随机⾏⾛的每⼀步动态估计每个邻居的电位。因此,该算法更倾向于遍历有助于推断⽬标和防⽌转移到噪声结构的结构。以往关于PRA的研究往往忽略了某些关系之间有意义的联系,⽆法为不太频繁的关系获得⾜够的训练数据。Wang,Liu,Luo,Wang,and
Lin(2016)提出了⼀种新的多任务学习框架,称为耦合PRA(CPRA)。CPRA使⽤多任务机制执⾏推理。它由关系聚类和关系耦合两个模块组成。前者⽤于⾃动发现⾼度相关的关系,后者⽤于耦合这
些关系的学习。通过进⼀步耦合这些关系,CPRA在推理性能⽅⾯明显优于PRA。
总的来说,基于逻辑的知识推理的发展趋势规则是逐步抛弃⼈⼯规则,利⽤模式识别技术,利⽤机器学习的⽅法,对训练模型进⾏规则或特征的⾃动挖掘。该模型将知识图表⽰为⼀个复杂的异构⽹络,可以通过转移概率、最短路径和⼴度优先搜索算法来完成推理任务。
然⽽,这种表⽰⽅法还存在缺陷。⾸先,基于逻辑规则的推理⽅法计算复杂度仍然较⾼,可扩展性较差。其次,知识图中的节点往往服从长尾分布,即只有少数实体和关系的出现频率较⾼,⽽⼤多数实体和关系出现的频率较低。因此,稀疏性严重影响推理性能。另外,如何处理多跳推理问题仍然是逻辑模型⾯临的⼀个更⼤的挑战。因此,Lin等⼈。(2015a)和Das,Neelakantan,Belanger,and McCallum(2017)将路径长度限制为最多3步,以反映不同对象之间的逻辑联系。因此,学者们主要关注的是基于数据稀疏性的扩展性推理⽅法
基于表⽰学习的推理
由于缺乏并⾏语料库,以往的挖掘和发现未知知识的⼯作都依赖于逻辑规则和随机遍历图。近年来,基于嵌⼊的⽅法在⾃然语⾔处理中得到了⼴泛的关注。如图2所⽰,这些模型将语义⽹络中的实体、关系和属性投影到连续向量空间中,以获得分布式表⽰。研究⼈员提出了⼤量基于分布表⽰的推理⽅法,包括张量分解、距离模型和语义匹配模型。
基伍树蝰