Aboutness | 所言之事 |
Absolute frequency | 绝对频数 |
Alignment (of parallel texts) | (平行或对应)语料的对齐 |
Alphanumeric | 字母数字构成的 |
Annotate | 标注(动词) |
Annotated text/corpus | 标注文本/语料库、赋码文本/语料库 |
Annotation | 标注(名词) |
Annotation scheme | 标注方案 |
ANSI/American National Standards Institute | 美国国家标准学会 |
ASCII/American Standard Code for Information Exchange | 美国信息交换标准码 |
Associates (of keywords) | (主题词的)联想词 |
AWL/academic word list | 学术词表 |
Balanced corpus | 平衡语料库 |
Ba list/balist | 底表、基础词表 |
Bigram | 二元组、二元序列、二元结构 |
Bi-text/bitext | 双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本) |
Bi-hapax | 两次词 |
Bilingual corpus | 双语语料库 |
Bootcamp debate/discour/discussion | (新手)训练营大辩论/话语/大探讨 |
CA/Contrastive Analysis | 对比分析 |
Ca-nsitive/ca nsitivity | 大小写敏感、区分大小写 |
Category-bad approach | 基于类(范畴)的方法 |
Chi-square test/χ2 | 卡方检验 |
Chunk | 词块 |
CIA/Contrastive Interlanguage Analysis | 中介语对比分析 |
CLAWS/Constituent Likelihood Automatic Word-tagging System | CLAWS词性赋码系统 |
Clean text policy | 干净文本原则商业报道 |
Cluster | 词簇、词丛 |
Colligation | 类联接、类连接、类联结 |
devil什么意思Collocate n./v. | 搭配词;搭配 |
Collocability | 搭配强度、搭配力 |
Collocation | 搭配、词语搭配 |
Collocational strength | 搭配强度 |
Collocational framework/frame | 搭配框架 |
Collocational profile | 搭配概貌 |
Collocational network | 搭配网络 |
Comparable corpora | 类比语料库、可比语料库 |
Computational Linguistics | 计算语言学 |
ConcGram/concgram | 同现词列、框合结构 |
Concord | 索引(行)(简略形式) |
Concordance (line) | 索引(行) |
Concordance plot | (索引)词图 |
Concordancer | 索引工具 |
Concordancing | 索引分析 |
Context | 语境、上下文 |
Context word | 语境词 |
Contextual prosody | 语境韵律 |
Contingency table | 连列表、联列表、列连表、列联表 |
Co-occurrence/Co-occurring | 共现、同现 |
Corpus Linguistics | 语料库语言学 |
Corpus, pl. corpora | 语料库 |
Corpus-bad | 基于语料库的 |
Corpus-bad translation studies | 基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究 |
Corpus-driven | 语料库驱动的dinner什么意思 |
Corpus-informed | 语料库指导下的、参考了语料库的 |
Corpus size | 库容 |
Corpus stylistics | 语料库文体学 |
Co-lect/co-lection/co-lectiveness | 共选(机制) |
Co-text | 礼仪培训课程 共文 |
Data mining | 数据挖掘 |
DDL/Data Driven Learning | 数据驱动学习 |
Dependency | (句法)依存关系 |
Dice coefficient | Dice系数 |
Disambiguation | 消歧 |
Diachronic corpus | 历时语料库 |
Discour | 话语、语篇 |
Discour prosody | 话语韵律 |
Documentation | 文检报告、备检文件、说明文档 |
EAGLES/Expert Advisory Groups on Language Engineering Standards | empty EAGLES文本规格 |
Empirical linguistics | 实证语言学 |
Empiricism | 经验主义 |
Encoding | 字符编码 |
Error-tagging | 错误标注、错误赋码 |
Explicitation | 显化 |
Extended unit of meaning | 扩展意义单位 |
File-bad arch/concordancing | 批量检索 |
Firthian (linguistics) | 弗斯(语言学)、弗斯学派的(语言学) |
Formulaic quence | 程式化序列、套语 |
Frequency | 频数、频率 |
Frequency list | 词频表 |
General (purpo) corpus | 通用语料库 |
Genre | 语体、体裁 |
Grammatical patterning | 语法型式 |
Granularity | 颗粒度 |
Hapax legomenon/hapax | 一次词 |
Header/corpus head | 文本头、头标、头文件 |
Hidden Markov model (HMM) | 隐马尔科夫模型、隐马模型 |
Idiom principle | 习语原则、成语原则 |
Idiomaticity | 习语性、地道程度 |
Implicitation | 隐化 |
Index/indexing | (建)索引 |
In-line annotation | 文内标注、行内标注 |
Interlanguage | 中介语、过渡语 |
Inter-coder agreement/reliability | 标注者间一致性/信度 |
Introspection/introspective | 内省(式)(的) |
Intuition | father的含义直觉 |
Key keywords | 关键主题词 |
Keyness | 主体性、关键性 |
Keywords | 主题词 |
KWIC/Key Word in Context | 语境中的关键词、语境共现(方式) |
KWIC sort | 语境共现排序、索引行排序 |
Learner corpus | 学习者语料库 |
Lemma, pl. lemmata/lemmas | 词目、原形词、词元 |
Lemmatization | 词形还原、词元化 |
Lemmatizer | 词形还原工具、词元化工具 |
Lexical bundle | 词束 |
Lexical density | 词汇密度 |
Lexical frequency profile | 词频概貌 |
Lexical grammar | 词汇语法 |
Lexical item | 词项、词语项目 |
Lexical patterning | 词语型式、词汇型式 |
Lexical priming | 词汇触发理论、词汇启动理论 |
Lexical profile | 词汇分布概貌 |
Lexical richness | 词汇丰富度 |
Lexico-grammar | 词汇语法 |
Lexis | 词语、词项、词语学 |
Log-likelihood ratio | 对数似然比、对数似然率 |
Longitudinal/developmental corpus | 跟踪语料库、发展语料库、历时语料库 |
Machine-readable | 机读的 |
Machine translation | 机器翻译 |
Manual annotation | 手工标注 |
Markup/mark-up | 标记、置标 |
MDA (Multi-dimensional analysis/approach) | 多维度分析法 |
Metadata | 元信息 |
Meta-metadata | 元元信息 |
MF/MD approach/multi-feature/multi-dimensional analysis | 多特征/多维度分析法 |
Misu | 误用 |
Monitor corpus | (动态)监察语料库 |
Monolingual corpus | 单语语料库 |
Multilingual corpus | 多语语料库 |
Multimodal corpus | 多模态语料库 |
MWU/multiword unit | 多词单位 |
MWE/multiword expression | 多词表达 |
MI/mutual information | 互信息、互现信息 |
N-gram | N元组、N元序列、N元结构、N元词、多词序列 |
Neo-Firth (school) | 新弗斯学派 |
Neo-Firthian | 新弗斯学派的 |
NLP/Natural Language Processing | 自然语言处理 |
Node (word) | 节点(词) |
Normalization | 标准化、(翻译)规范化、泛化 |
Normalized frequency | 标准化频率、标称频率、归一频率 |
Obrved corpus | 观察语料库 |
Ontology | 知识本体、本体 |
Open choice principle | 开放选择原则 |
Orthographic | |
Orthography | 正字法 |
Overu | 过多使用、超用、使用过度、过度使用 |
Paradigmatic | 纵聚合(关系)的 |
Parallel corpus | 平行语料库、对应语料库 |
Parole linguistics | 言语语言学 |
Pard corpus | 句法标注的语料库、树库 |
Parr | 句法分析器 |
Parsing | 句法标注、句法分析 |
Pattern/patterning | 型式、模式 |
Pattern grammar | 型式语法 |
Pattern matching | 模式匹配 |
Pedagogic corpus | 教学语料库 |
Phraology | 短语、短语学 |
Phraological unit/quence | 短语单位/序列 |
Plain text | 纯文本 |
POSgram | 赋码序列、码串 |
POS quence | 赋码序列、码串 |
POS tagging/Part-of-Speech tagging | 词性赋码、词性标注、词性附码 |
POS tagger | 词性赋码器、词性赋码工具 |
Prefab | 预制语块 |
Probabilistic | (基于)概率的、概率性的、盖然的 |
Probabilistic grammar | 概率语法、概率性语法、盖然语法 |
Probability | 概率 |
Query | 查询、检索 |
Range | 分布(范围)、跨度 |
Rationalism | 理性主义 |
Raw frequency | 原始频数、生频数 |
Raw text/corpus | 生文本/生语料 |
Reference corpus | 参照语料库 |
Regex/RE/RegExp/regular expressions | 正则表达式、正则式 |
Register variation | 语域变异 |
Relative frequency | 相对频率 |
Reprentative/reprentativeness | 代表性(的) |
Rule-bad | 基于规则的 |
S-universalshamburger | 源语型共性(特征) |
Sample n./v. | 样本;取样、采样、抽样 |
Sampling | 取样、采样、抽样 |
Sanitization | 净化 |
Search term | 检索项 |
Search word | 检索词 |
Segmentation | veronica ballestrini切分、分词 |
Semantic association | 语义联想 |
Semantic preference | 语义倾向、语义趋向 |
Semantic prosody | 语义韵 |
Sentence alignment | 句对齐、句级对齐 |
SGML/Standard Generalized Markup Language | 标准通用标记语言 |
Simplification | 简化 |
Skipgram | 跨词序列、跨词结构 |
Span | 跨距 |
Specialized corpus | 专用语料库、专门用途语料库、专题语料库 |
Standardized type/token ratio | 标准化类符/形符比、标准化类/形比、标准化型次比 |
Standardized TTR/STTR | 标准化类符/形符比、标准化类/形比、标准化型次比 |
Stand-off annotation | 分离式标注 |
Stochastic | 随机的 |
Stop list | 停用词表、过滤词表 |
Stop word | 停用词、过滤词 |
Synchronic corpus | 共时语料库 |
Syntagmatic | 横组合(关系)的 |
T score | T值 |
T-universals | 目标语型共性(特征) |
Tag | 南加州大学赋码、标记、附码 |
Tagger | 赋码器、赋码工具、标注工具 |
Tagging | 赋码、标注、附码 |
Tag quence | 赋码序列、码串 |
Tagt | 赋码集、码集 |
Tertium comparationis | 对比中立项、对比基础 |
Text | 文本 |
Text type | 文体、文类 |
Text category | 文体、文类 |
Text mining | 文本挖掘 |
TEI/Text Encoding Initiative | TEI文本编码计划 |
The Lexical Approach | 词汇中心教学法 |
The Lexical Syllabus | 词汇大纲 |
Token | 形符、词次 |
Token definition/word definition | 形符界定、单词界定 |
Tokenization | 分词 |
Tokenizer | 分词工具 |
Transcription | 转写 |
Translation memory | 翻译记忆(库) |
Translation norms | 翻译规范 |
Translation universals/Universal features of translation | 翻译共性、翻译普遍特征 |
Translational corpus | 翻译语料库 |
Translatione | 翻译体、翻译腔 |
Treebank | 树库 |
Trigram | 三元组、三元序列、三元结构 |
T-score | T值 |
Type | 类符、词种、词型 |
TTR | 类符/形符比、类/形比、型次比 |
Type/token ratio | 类符/形符比、类/形比、型次比 |
Underu | 少用、使用不足 |
Unicode | 通用码 |
Unicodify | 按通用码编码、转换为通用码 |
Unit of meaning | 意义单位 |
WaC/Web as Corpus | 网络语料库、网库 |
Wildcard | 通配符 |
Word alignment | 词对齐、词级对齐 |
Word form | 词形 |
Word family | 词族 |
Word list | 词表 |
Word sketch | 词语素描 |
WSD/Word-n disambiguation | 词义消歧 |
XML/Extensible Markup Language | 可扩展标记语言 |
Zipf’s Law/Zipfian Law | 齐夫定律 |
Z score | Z值 |
本文发布于:2023-07-22 05:14:41,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/78/1110217.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |