扩展知识图谱上的实体关系检索
作者:王秋月 覃雄派 曹巍 富爸爸覃飙
来源:《计算机应用》2016年第04期
nowornever摘要:现有文本数据集上的实体搜索和自然语言查询方法无法处理需要将分散在不同文档中的信息碎片链接起来以满足有复杂实体关系的查询,而知识库上的查询虽然可以表示实体间的复杂关系,但由于知识库的异构性和不完全性,通常查全率较低。针对这些问题,提出使用文本数据集对知识库进行扩展,并设计相应的含文本短语的三元组模式查询以支持对知识库和文本数据的统一查询。在此基础上,设计并实现了查询放松机制和对结果元组的评分模型,并给出了高效的查询处理方法。使用六级英语成绩查询时间2021YAGO、ClueWeb09和其上的daleyFACC1数据集,在三个不同的查询测试集(实体检索、实体关系检索和复杂的实体关系查询)上与两个典型相关工作作了比较。实验结果显示,扩展知识图谱上使用查询放松规则的实体关系检索系统的检索效果大大超出了其他系统,具体地在三个查询测试集上,其平均正确率均值(MAP)比其他系统分别提升了27%、37%和64%以上。
关键词:知识图谱;实体关系检索;实体搜索;三元组模式查询;查询放松
中图分类号:TP391.3 文献标志码:A
0引言
近年来,随着从文本中提取结构化数据的信息抽取技术[1]日益成熟,大规模知识库的构建得到了迅猛发展,产生了许多形形色色的知识库,如DBpedia、Freeba、cycleYAGO、Wikidata、NELLunique是什么意思、Proba、Google KGwagaga和freunde什么意思Microsoft Satori等[2]www gopep cn。这些机器可读的知识大多被表示成三元组形式的资源描述框架(Resource Description Framework, RDF)数据,描述实体、实体分类以及实体和实体之间的各种关系等,被广泛应用在文本分析、自然语言理解、机器阅读、语义搜索、自然语言问答等各类智能型的应用中。例如,Google、百度、Bing等搜索引擎正积极构建大型知识图谱,并利用知识图谱改善其搜索效果,如生成结构化的结果摘要(rich snippets)、实体推荐、实体搜索和自然语言问答等。
>因为有你英文