中文短文本语法语义相似度算法-文档资料

更新时间:2023-04-20 02:10:42 阅读: 评论:0


2023年4月20日发(公务员职级 作者:应有格物致知精神)

中文短文本语法语义相似度算法

短文本相似度计算在文章查重、信息检索、图像检索、智能

机器问答、词义消歧和搜索引擎等多个领域什么是洗盘 有着非常广泛的应用

[马球 1],并在英文处理方面取得了许多实质性的成果,如机器人语

音对话系统等.但是在中文信息处理中存在一些困难跳绳腿会粗吗 ,例如未登

录词识别问题、语法结构复杂和一词多义等[2].为此本文主要研

究中文短文本(语句)相似度计算方法,并提高计算结果的精确

.

短文本相似度表示的是多个短文本(语句)之间的相似程度,

属于一种月亮水瓶座男生 度量参数,相似度值越高花瓣的瓣怎么组词 ,则表明文本间越相似,反之

越不相似[3]安装内存 .文本相似度包括语义和语法等方面,但是在实际中

主要考虑语义层次的相似性,往往忽略了文本的语法结构对文本

相似度的重要影响.

大量的研究证明短文本的语法结构对相似性的影响是非常

重要的[4],但是当前基于HowNet[5]的中文短文本相似度计算

大都是分析文本的语义层次的相似运动单词 性,这样就会导致计算结果的

精确度和召回率都不高,为了提高相似度计算的精确度和召回

率,本文以HowNet为语料库和Stanford[6]为语法解析工具,

在中文短文本的语义信息基础上加入了文本的语法结构信息来

研究短文本相似度计算.

1语句相似度计算

HowNet主要揭示了概念间关系及概念的属性间的关系,有

HowNet详细介绍可见


本文发布于:2023-04-20 02:10:42,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/505233.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:hownet
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图