文本预处理——词形还原

更新时间:2023-05-27 15:43:20 阅读: 评论:0

⽂本预处理——词形还原
简单说来,词形还原(Lemmatization)就是去掉单词的词缀,提取单词的主⼲部分:在的nltk模块中,使⽤WordNet为我们提供了稳健的词形还原的函数。
夸自己的句子
from nltk.stem import WordNetLemmatizer
新课标大语文
wnl = WordNetLemmatizer()鲁迅的父亲
# lemmatize nouns鲤鱼越龙门
print(wnl.lemmatize('cars', 'n'))
农历是阴历
print(wnl.lemmatize('men', 'n'))
水的光解# lemmatize verbs
print(wnl.lemmatize('running', 'v'))
print(wnl.lemmatize('ate', 'v'))
# lemmatize adjectives
print(wnl.lemmatize('saddest', 'a'))荆州旅游
仔姜兔的做法
print(wnl.lemmatize('fancier', 'a'))
wnl.lemmatize()函数可以进⾏词形还原,第⼀个参数为单词,第⼆个参数为该单词的词性,如名词,动词,形容词等,返回的结果为输⼊单词的词形还原后的结果。

本文发布于:2023-05-27 15:43:20,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/793207.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:单词   词形   还原   形容词
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图