语料库语言学术语汇编A glossary of corpus linguistics

更新时间:2023-07-22 05:14:41 阅读: 评论:0

语料库语言学术语汇编(V2.0)
Last updated 2012-10-08 by 许家金
哪里的英文
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)
Annotated text/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)
Annotation scheme
标注方案
ANSI/American National Standards Institute
美国国家标准学会
ASCII/American Standard Code for Information Exchange
美国信息交换标准码
Associates (of keywords)
(主题词的)联想词
AWL/academic word list
学术词表
Balanced corpus
平衡语料库
Ba list/balist
底表、基础词表
Bigram
二元组、二元序列、二元结构
Bi-text/bitext
双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)
Bi-hapax
两次词
Bilingual corpus
双语语料库
Bootcamp debate/discour/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Ca-nsitive/ca nsitivity
大小写敏感、区分大小写
Category-bad approach
基于类(范畴)的方法
Chi-square test/χ2
卡方检验
Chunk
词块
CIA/Contrastive Interlanguage Analysis
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
CLAWS词性赋码系统
Clean text policy
干净文本原则商业报道
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
devil什么意思Collocate n./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
Collocational framework/frame
搭配框架
Collocational profile
搭配概貌
Collocational network
搭配网络
Comparable corpora
类比语料库、可比语料库
Computational Linguistics
计算语言学
ConcGram/concgram
同现词列、框合结构
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
语境韵律
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
Corpus Linguistics
语料库语言学
Corpus, pl. corpora
语料库
Corpus-bad
基于语料库的
Corpus-bad translation studies
基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的dinner什么意思
Corpus-informed
语料库指导下的、参考了语料库的
Corpus size
库容
Corpus stylistics
语料库文体学
Co-lect/co-lection/co-lectiveness
共选(机制)
Co-text
礼仪培训课程
共文
Data mining
数据挖掘
DDL/Data Driven Learning
数据驱动学习
Dependency
(句法)依存关系
Dice coefficient
Dice系数
Disambiguation
消歧
Diachronic corpus
历时语料库
Discour
话语、语篇
Discour prosody
话语韵律
Documentation
文检报告、备检文件、说明文档
EAGLES/Expert Advisory Groups on Language Engineering Standards
empty
EAGLES文本规格
Empirical linguistics
实证语言学
Empiricism
经验主义
Encoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extended unit of meaning
扩展意义单位
File-bad arch/concordancing
批量检索
Firthian (linguistics)
弗斯(语言学)、弗斯学派的(语言学)
Formulaic quence
程式化序列、套语
Frequency
频数、频率
Frequency list
词频表
General (purpo) corpus
通用语料库
Genre
语体、体裁
Grammatical patterning
语法型式
Granularity
颗粒度
Hapax legomenon/hapax
一次词
Header/corpus head
文本头、头标、头文件
Hidden Markov model (HMM)
隐马尔科夫模型、隐马模型
Idiom principle
习语原则、成语原则
Idiomaticity
习语性、地道程度
Implicitation
隐化
Index/indexing
(建)索引
In-line annotation
文内标注、行内标注
Interlanguage
中介语、过渡语
Inter-coder agreement/reliability
标注者间一致性/信度
Introspection/introspective
内省(式)(的)
Intuition
father的含义直觉
Key keywords
关键主题词
Keyness
主体性、关键性
Keywords
主题词
KWIC/Key Word in Context
语境中的关键词、语境共现(方式)
KWIC sort
语境共现排序、索引行排序
Learner corpus
学习者语料库
Lemma, pl. lemmata/lemmas
词目、原形词、词元
Lemmatization
词形还原、词元化
Lemmatizer
词形还原工具、词元化工具
Lexical bundle
词束
Lexical density
词汇密度
Lexical frequency profile
词频概貌
Lexical grammar
词汇语法
Lexical item
词项、词语项目
Lexical patterning
词语型式、词汇型式
Lexical priming
词汇触发理论、词汇启动理论
Lexical profile
词汇分布概貌
Lexical richness
词汇丰富度
Lexico-grammar
词汇语法
Lexis
词语、词项、词语学
Log-likelihood ratio
对数似然比、对数似然率
Longitudinal/developmental corpus
跟踪语料库、发展语料库、历时语料库
Machine-readable
机读的
Machine translation
机器翻译
Manual annotation
手工标注
Markup/mark-up
标记、置标
MDA (Multi-dimensional analysis/approach)
多维度分析法
Metadata
元信息
Meta-metadata
元元信息
MF/MD approach/multi-feature/multi-dimensional analysis
多特征/多维度分析法
Misu
误用
Monitor corpus
(动态)监察语料库
Monolingual corpus
单语语料库
Multilingual corpus
多语语料库
Multimodal corpus
多模态语料库
MWU/multiword unit
多词单位
MWE/multiword expression
多词表达
MI/mutual information
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth (school)
新弗斯学派
Neo-Firthian
新弗斯学派的
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化、泛化
Normalized frequency
标准化频率、标称频率、归一频率
Obrved corpus
观察语料库
Ontology
知识本体、本体
Open choice principle
开放选择原则
Orthographic
Orthography
正字法
Overu
过多使用、超用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallel corpus
平行语料库、对应语料库
Parole linguistics
言语语言学
Pard corpus
句法标注的语料库、树库
Parr
句法分析器
Parsing
句法标注、句法分析
Pattern/patterning
型式、模式
Pattern grammar
型式语法
Pattern matching
模式匹配
Pedagogic corpus
教学语料库
Phraology
短语、短语学
Phraological unit/quence
短语单位/序列
Plain text
纯文本
POSgram
赋码序列、码串
POS quence
赋码序列、码串
POS tagging/Part-of-Speech tagging
词性赋码、词性标注、词性附码
POS tagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
Probabilistic grammar
概率语法、概率性语法、盖然语法
Probability
概率
Query
查询、检索
Range
分布(范围)、跨度
Rationalism
理性主义
Raw frequency
原始频数、生频数
Raw text/corpus
生文本/生语料
Reference corpus
参照语料库
Regex/RE/RegExp/regular expressions
正则表达式、正则式
Register variation
语域变异
Relative frequency
相对频率
Reprentative/reprentativeness
代表性(的)
Rule-bad
基于规则的
S-universalshamburger
源语型共性(特征)
Sample n./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Sanitization
净化
Search term
检索项
Search word
检索词
Segmentation
veronica ballestrini切分、分词
Semantic association
语义联想
Semantic preference
语义倾向、语义趋向
Semantic prosody
语义韵
Sentence alignment
句对齐、句级对齐
SGML/Standard Generalized Markup Language
标准通用标记语言
Simplification
简化
Skipgram
跨词序列、跨词结构
Span
跨距
Specialized corpus
专用语料库、专门用途语料库、专题语料库
Standardized type/token ratio
标准化类符/形符比、标准化类/形比、标准化型次比
Standardized TTR/STTR
标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation
分离式标注
Stochastic
随机的
Stop list
停用词表、过滤词表
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
T score
T值
T-universals
目标语型共性(特征)
Tag
南加州大学赋码、标记、附码
Tagger
赋码器、赋码工具、标注工具
Tagging
赋码、标注、附码
Tag quence
赋码序列、码串
Tagt
赋码集、码集
Tertium comparationis
对比中立项、对比基础
Text
文本
Text type
文体、文类
Text category
文体、文类
Text mining
文本挖掘
TEI/Text Encoding Initiative
TEI文本编码计划
The Lexical Approach
词汇中心教学法
The Lexical Syllabus
词汇大纲
Token
形符、词次
Token definition/word definition
形符界定、单词界定
Tokenization
分词
Tokenizer
分词工具
Transcription
转写
Translation memory
翻译记忆(库)
Translation norms
翻译规范
Translation universals/Universal features of translation
翻译共性、翻译普遍特征
Translational corpus
翻译语料库
Translatione
翻译体、翻译腔
Treebank
树库
Trigram
三元组、三元序列、三元结构
T-score
T值
Type
类符、词种、词型
TTR
类符/形符比、类/形比、型次比
Type/token ratio
类符/形符比、类/形比、型次比
Underu
少用、使用不足
Unicode
通用码
Unicodify
按通用码编码、转换为通用码
Unit of meaning
意义单位
WaC/Web as Corpus
网络语料库、网库
Wildcard
通配符
Word alignment
词对齐、词级对齐
Word form
词形
Word family
词族
Word list
词表
Word sketch
词语素描
WSD/Word-n disambiguation
词义消歧
XML/Extensible Markup Language
可扩展标记语言
Zipf’s Law/Zipfian Law
齐夫定律
Z score
Z值

本文发布于:2023-07-22 05:14:41,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/1110217.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语料库   标注   赋码   词汇
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图