自然语音处理之信息抽取
目录
揪痧日记
第一章概述 (4)
1.1包含知识 (4)
1.1.1网页抓取 (4)
1.1.2自然语言处理 (4)
1.1.3命名实体识别 (4)
1.1.4机器学习 (4)
1.1.5深度学习 (4)
1.1.6知识图谱 (4)
1.2用处 (4)
1.2.1处理非结构化数据 (4)
1.2.2量化投资 (4)
1.2.3垂直搜索 (4)
1.3流程 (4)
1.4扩展阅读 (5)
第二章信息抽取发展历史 (7)
2.1扩展阅读 (7)
烤生蚝图片第三章信息抽取技术详解 (8)
3.1网页抓取 (8)
3.1.1无头浏览器框架 (8)苹果备份
3.1.2DOM解析 (8)
3.2Web网页数据抽取 (8)
深圳买房资格
3.2.1包装器归纳 (8)竹林木屋
3.2.2自动抽取 (9)
3.2.3参考文献 (10)
3.3信息抽取 (10)
3.3.1抽取概述 (10)
3.3.2分词 (10)
3.3.3命名实体识别 (11)
3.3.4HTML的抽取 (13)
3.3.5关系抽取 (13)
3.3.6进阶之路 (14)
3.3.7机器阅读理解 (15)
3.3.8现成关系抽取工具 (15)
第四章语料资源 (15)
第五章相关比赛 (15)
5.1Kaggle (15)
第六章参考资料 (16)
第一章概述
1.1包含知识
1.1.1网页抓取
1.1.2自然语言处理
1.1.3命名实体识别时怎么组词
1.1.4机器学习
我要制作相册
1.1.5深度学习
1.1.6知识图谱
1.2用处
1.2.1处理非结构化数据
1.2.2量化投资
1.2.3垂直搜索
1.3流程
网页抓取->信息抽取->信息入库
1.4扩展阅读
信息抽取相关的会议/数据集有MUC、ACE、KBP、SemEval 等。其中,ACE(Automated Content Ex
traction) 对MUC 定义的任务进行了融合、分类和细化,KBP(Knowledge Ba Population) 对ACE 定义的任务进一步修订,分了四个独立任务和一个整合任务,包括赛车折纸
⚫Cold Start KB (CSKB)
端到端的冷启动知识构建
⚫Entity Discovery and Linking (EDL)
实体发现与链接
⚫Slot Filling (SF)
槽填充
⚫Event
事件抽取
⚫Belief/Sentiment (BeSt)
信念和情感
至于SemEval主要是词义消歧评测,目的是增加人们对词义、多义现象的理解。