语料库语言学术语汇编A glossary of corpus linguistics

更新时间:2023-07-22 05:14:41 阅读：31 评论：0

语料库语言学术语汇编(V2.0)

Last updated 2012-10-08 by 许家金

哪里的英文

Aboutness	所言之事
Absolute frequency	绝对频数
Alignment (of parallel texts)	（平行或对应）语料的对齐
Alphanumeric	字母数字构成的
Annotate	标注（动词）
Annotated text/corpus	标注文本/语料库、赋码文本/语料库
Annotation	标注（名词）
Annotation scheme	标注方案
ANSI/American National Standards Institute	美国国家标准学会
ASCII/American Standard Code for Information Exchange	美国信息交换标准码
Associates (of keywords)	（主题词的）联想词
AWL/academic word list	学术词表
Balanced corpus	平衡语料库
Ba list/balist	底表、基础词表
Bigram	二元组、二元序列、二元结构
Bi-text/bitext	双语合并文本、双语分行对齐文本（一句源语一句目标语对齐后的文本）
Bi-hapax	两次词
Bilingual corpus	双语语料库
Bootcamp debate/discour/discussion	（新手）训练营大辩论/话语/大探讨
CA/Contrastive Analysis	对比分析
Ca-nsitive/ca nsitivity	大小写敏感、区分大小写
Category-bad approach	基于类（范畴）的方法
Chi-square test/χ2	卡方检验
Chunk	词块
CIA/Contrastive Interlanguage Analysis	中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System	CLAWS词性赋码系统
Clean text policy	干净文本原则商业报道
Cluster	词簇、词丛
Colligation	类联接、类连接、类联结
devil什么意思Collocate n./v.	搭配词；搭配
Collocability	搭配强度、搭配力
Collocation	搭配、词语搭配
Collocational strength	搭配强度
Collocational framework/frame	搭配框架
Collocational profile	搭配概貌
Collocational network	搭配网络
Comparable corpora	类比语料库、可比语料库
Computational Linguistics	计算语言学
ConcGram/concgram	同现词列、框合结构
Concord	索引（行）（简略形式）
Concordance (line)	索引（行）
Concordance plot	（索引）词图
Concordancer	索引工具
Concordancing	索引分析
Context	语境、上下文
Context word	语境词
Contextual prosody	语境韵律
Contingency table	连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring	共现、同现
Corpus Linguistics	语料库语言学
Corpus, pl. corpora	语料库
Corpus-bad	基于语料库的
Corpus-bad translation studies	基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven	语料库驱动的dinner什么意思
Corpus-informed	语料库指导下的、参考了语料库的
Corpus size	库容
Corpus stylistics	语料库文体学
Co-lect/co-lection/co-lectiveness	共选（机制）
Co-text	礼仪培训课程共文
Data mining	数据挖掘
DDL/Data Driven Learning	数据驱动学习
Dependency	（句法）依存关系
Dice coefficient	Dice系数
Disambiguation	消歧
Diachronic corpus	历时语料库
Discour	话语、语篇
Discour prosody	话语韵律
Documentation	文检报告、备检文件、说明文档
EAGLES/Expert Advisory Groups on Language Engineering Standards	empty EAGLES文本规格
Empirical linguistics	实证语言学
Empiricism	经验主义
Encoding	字符编码
Error-tagging	错误标注、错误赋码
Explicitation	显化
Extended unit of meaning	扩展意义单位
File-bad arch/concordancing	批量检索
Firthian (linguistics)	弗斯（语言学）、弗斯学派的（语言学）
Formulaic quence	程式化序列、套语
Frequency	频数、频率
Frequency list	词频表
General (purpo) corpus	通用语料库
Genre	语体、体裁
Grammatical patterning	语法型式
Granularity	颗粒度
Hapax legomenon/hapax	一次词
Header/corpus head	文本头、头标、头文件
Hidden Markov model (HMM)	隐马尔科夫模型、隐马模型
Idiom principle	习语原则、成语原则
Idiomaticity	习语性、地道程度
Implicitation	隐化
Index/indexing	（建）索引
In-line annotation	文内标注、行内标注
Interlanguage	中介语、过渡语
Inter-coder agreement/reliability	标注者间一致性/信度
Introspection/introspective	内省（式）（的）
Intuition	father的含义直觉
Key keywords	关键主题词
Keyness	主体性、关键性
Keywords	主题词
KWIC/Key Word in Context	语境中的关键词、语境共现（方式）
KWIC sort	语境共现排序、索引行排序
Learner corpus	学习者语料库
Lemma, pl. lemmata/lemmas	词目、原形词、词元
Lemmatization	词形还原、词元化
Lemmatizer	词形还原工具、词元化工具
Lexical bundle	词束
Lexical density	词汇密度
Lexical frequency profile	词频概貌
Lexical grammar	词汇语法
Lexical item	词项、词语项目
Lexical patterning	词语型式、词汇型式
Lexical priming	词汇触发理论、词汇启动理论
Lexical profile	词汇分布概貌
Lexical richness	词汇丰富度
Lexico-grammar	词汇语法
Lexis	词语、词项、词语学
Log-likelihood ratio	对数似然比、对数似然率
Longitudinal/developmental corpus	跟踪语料库、发展语料库、历时语料库
Machine-readable	机读的
Machine translation	机器翻译
Manual annotation	手工标注
Markup/mark-up	标记、置标
MDA (Multi-dimensional analysis/approach)	多维度分析法
Metadata	元信息
Meta-metadata	元元信息
MF/MD approach/multi-feature/multi-dimensional analysis	多特征/多维度分析法
Misu	误用
Monitor corpus	（动态）监察语料库
Monolingual corpus	单语语料库
Multilingual corpus	多语语料库
Multimodal corpus	多模态语料库
MWU/multiword unit	多词单位
MWE/multiword expression	多词表达
MI/mutual information	互信息、互现信息
N-gram	N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth (school)	新弗斯学派
Neo-Firthian	新弗斯学派的
NLP/Natural Language Processing	自然语言处理
Node (word)	节点（词）
Normalization	标准化、（翻译）规范化、泛化
Normalized frequency	标准化频率、标称频率、归一频率
Obrved corpus	观察语料库
Ontology	知识本体、本体
Open choice principle	开放选择原则
Orthographic
Orthography	正字法
Overu	过多使用、超用、使用过度、过度使用
Paradigmatic	纵聚合（关系）的
Parallel corpus	平行语料库、对应语料库
Parole linguistics	言语语言学
Pard corpus	句法标注的语料库、树库
Parr	句法分析器
Parsing	句法标注、句法分析
Pattern/patterning	型式、模式
Pattern grammar	型式语法
Pattern matching	模式匹配
Pedagogic corpus	教学语料库
Phraology	短语、短语学
Phraological unit/quence	短语单位/序列
Plain text	纯文本
POSgram	赋码序列、码串
POS quence	赋码序列、码串
POS tagging/Part-of-Speech tagging	词性赋码、词性标注、词性附码
POS tagger	词性赋码器、词性赋码工具
Prefab	预制语块
Probabilistic	（基于）概率的、概率性的、盖然的
Probabilistic grammar	概率语法、概率性语法、盖然语法
Probability	概率
Query	查询、检索
Range	分布（范围）、跨度
Rationalism	理性主义
Raw frequency	原始频数、生频数
Raw text/corpus	生文本/生语料
Reference corpus	参照语料库
Regex/RE/RegExp/regular expressions	正则表达式、正则式
Register variation	语域变异
Relative frequency	相对频率
Reprentative/reprentativeness	代表性（的）
Rule-bad	基于规则的
S-universalshamburger	源语型共性（特征）
Sample n./v.	样本；取样、采样、抽样
Sampling	取样、采样、抽样
Sanitization	净化
Search term	检索项
Search word	检索词
Segmentation	veronica ballestrini切分、分词
Semantic association	语义联想
Semantic preference	语义倾向、语义趋向
Semantic prosody	语义韵
Sentence alignment	句对齐、句级对齐
SGML/Standard Generalized Markup Language	标准通用标记语言
Simplification	简化
Skipgram	跨词序列、跨词结构
Span	跨距
Specialized corpus	专用语料库、专门用途语料库、专题语料库
Standardized type/token ratio	标准化类符/形符比、标准化类/形比、标准化型次比
Standardized TTR/STTR	标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation	分离式标注
Stochastic	随机的
Stop list	停用词表、过滤词表
Stop word	停用词、过滤词
Synchronic corpus	共时语料库
Syntagmatic	横组合（关系）的
T score	T值
T-universals	目标语型共性（特征）
Tag	南加州大学赋码、标记、附码
Tagger	赋码器、赋码工具、标注工具
Tagging	赋码、标注、附码
Tag quence	赋码序列、码串
Tagt	赋码集、码集
Tertium comparationis	对比中立项、对比基础
Text	文本
Text type	文体、文类
Text category	文体、文类
Text mining	文本挖掘
TEI/Text Encoding Initiative	TEI文本编码计划
The Lexical Approach	词汇中心教学法
The Lexical Syllabus	词汇大纲
Token	形符、词次
Token definition/word definition	形符界定、单词界定
Tokenization	分词
Tokenizer	分词工具
Transcription	转写
Translation memory	翻译记忆（库）
Translation norms	翻译规范
Translation universals/Universal features of translation	翻译共性、翻译普遍特征
Translational corpus	翻译语料库
Translatione	翻译体、翻译腔
Treebank	树库
Trigram	三元组、三元序列、三元结构
T-score	T值
Type	类符、词种、词型
TTR	类符/形符比、类/形比、型次比
Type/token ratio	类符/形符比、类/形比、型次比
Underu	少用、使用不足
Unicode	通用码
Unicodify	按通用码编码、转换为通用码
Unit of meaning	意义单位
WaC/Web as Corpus	网络语料库、网库
Wildcard	通配符
Word alignment	词对齐、词级对齐
Word form	词形
Word family	词族
Word list	词表
Word sketch	词语素描
WSD/Word-n disambiguation	词义消歧
XML/Extensible Markup Language	可扩展标记语言
Zipf’s Law/Zipfian Law	齐夫定律
Z score	Z值

本文发布于:2023-07-22 05:14:41，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/78/1110217.html

上一篇：Bybee (2006) From usage to grammar the mind’s respon to repetition

下一篇：电影观后感英语作文(精彩8篇)

标签：语料库标注赋码词汇

留言与评论（共有 0 条评论）