amr语料库 法律

更新时间:2024-11-06 23:35:16 阅读: 评论:0


2022年7月21日发
(作者:出租车拒载)

amr语料库法律

AMR(AbstractMeaningRepresentation,抽象语义表示)是一

种新型的句子语义表示方式,由美国宾夕法尼亚大学的语言数据联盟

(LDC)、南加州大学、科罗拉多大学等科研机构的多位学者共同提出。

与传统的基于树的句法语义表示方法不同,AMR使用单根有向无环图。

[1]来表示一个句子的语义。这种表示方法相比树结构拥有较大

的优势:首先,单根结构保持了句子的树形主干;其次,有向无环图

使用图结构可以较好地描写一个名词由多个谓词支配所形成的论元

共享(argumentsharing)等现象;第三,AMR还允许补充出句中隐

含或省略的成分,以还原出较为完整的句子语义。这三大优点,使得

AMR一经公布,就引起了国际上的重视,涌现了从跨语言翻译价值角

度进行的讨论。

[2]自动分析技术。

[3]转化应用。

[4]等多方面的研究论文。AMR配套发布了包括《小王子》在

内的2万多句英文语料库,2016年的SemEval语义评测也举办了英

文AMR的自动分析竞赛项目英文《小王子》语料中带有图结构的句子

比例高达42%,带有补充概念节点的句子比例也在10%以上,说明了

AMR使用图结构和补充概念节点的有效性和合理性,也使得学术界对

于句子的结构有了新的认识。另一方面,汉语的句法语义自动分析研

究,也开始从句法树走向了语义图Ding等。

[5]加工了汉语语义依存图库,其中带有图结构的句子仅10%

左右。虽然句子的标注体系不同,也没有增添概念节点的机制,但相

比英文《小王子》带有图结构的句子比例42%,仍有较大差异。这促

使我们试图分析英文的图结构到底由哪些因素造成,汉语中图结构的

情况又如何。为了使中英文数据能够在可比较的语料库上进行分析,

我们根据英文AMR的标注规范

[6]设计了中文AMR标注规范,标注了和英文《小王子》句对齐

的中文《小王子》1562句。由两位语言学研究生分别独立标注,

标注一致性的Smatch值为0.83。统计结果显示,中文《小王子》

含有图的句子比例也高达36%左右,且与英语具有很高的一致性。

而英汉双语的补充的概念节点的数量却存在较大差异,体现出语

言结构的差异。


本文发布于:2022-07-21 02:37:44,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/falv/fa/82/26428.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26