amr语料库法律
AMR(AbstractMeaningRepresentation,抽象语义表示)是一
种新型的句子语义表示方式,由美国宾夕法尼亚大学的语言数据联盟
(LDC)、南加州大学、科罗拉多大学等科研机构的多位学者共同提出。
与传统的基于树的句法语义表示方法不同,AMR使用单根有向无环图。
[1]来表示一个句子的语义。这种表示方法相比树结构拥有较大
的优势:首先,单根结构保持了句子的树形主干;其次,有向无环图
使用图结构可以较好地描写一个名词由多个谓词支配所形成的论元
共享(argumentsharing)等现象;第三,AMR还允许补充出句中隐
含或省略的成分,以还原出较为完整的句子语义。这三大优点,使得
AMR一经公布,就引起了国际上的重视,涌现了从跨语言翻译价值角
度进行的讨论。
[2]自动分析技术。
[3]转化应用。
[4]等多方面的研究论文。AMR配套发布了包括《小王子》在
内的2万多句英文语料库,2016年的SemEval语义评测也举办了英
文AMR的自动分析竞赛项目英文《小王子》语料中带有图结构的句子
比例高达42%,带有补充概念节点的句子比例也在10%以上,说明了
AMR使用图结构和补充概念节点的有效性和合理性,也使得学术界对
于句子的结构有了新的认识。另一方面,汉语的句法语义自动分析研
究,也开始从句法树走向了语义图Ding等。
[5]加工了汉语语义依存图库,其中带有图结构的句子仅10%
左右。虽然句子的标注体系不同,也没有增添概念节点的机制,但相
比英文《小王子》带有图结构的句子比例42%,仍有较大差异。这促
使我们试图分析英文的图结构到底由哪些因素造成,汉语中图结构的
情况又如何。为了使中英文数据能够在可比较的语料库上进行分析,
我们根据英文AMR的标注规范
[6]设计了中文AMR标注规范,标注了和英文《小王子》句对齐
的中文《小王子》1562句。由两位语言学研究生分别独立标注,
标注一致性的Smatch值为0.83。统计结果显示,中文《小王子》
含有图的句子比例也高达36%左右,且与英语具有很高的一致性。
而英汉双语的补充的概念节点的数量却存在较大差异,体现出语
言结构的差异。
本文发布于:2022-07-21 02:37:44,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/falv/fa/82/26428.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |