【概念】等位基因相关概念辨析

更新时间:2023-06-10 07:13:27 阅读: 评论:0

【概念】等位基因相关概念辨析
【概念】等位基因相关概念辨析
Minor/alternative/effect/risk allele这些名词很容易混淆,早期的遗传统计学软件,例如plink并没有很重视allele概念上的明确区分,但近年新出的软件或旧软件的新版本为保证统⼀性已经开始注意此问题。
⼀些常见allele相关名词的辨析如下:
等位基因1(A1)等位基因2(A2)解释1major allele minor allele根据某⼀特定群体的等位基因频率来定义
2reference (ref) allele alternative (alt)
allele
猫贫血
根据与参考基因组的等位碱基的异同进⾏定义
3reference (non-risk / non-effect / other)
allele
risk / effect allele
关联检验中常⽤的名词,注:效应等位≠风险等位,有时可能为保护效
4A1A2plink1.9 软件的.bim⽂件,A1为 minor allele,A2为 major allele 5REF ALT plink2 软件,REF 为 reference allele,ALT为 alternative allele 6A1A2METAL 软件,A1为 tested allele,A2为 other allele
注:Minor allele/major allele 和 ref allele/alt allele真的半⽑钱关系都没有。前者指在特定⼈群/样本下,频率低的就定义为minor,⽽后者完全不关⼼频率,只看参考基因组定义哪个是ref,所以minor和major都可以是ref或者alt。
1. major 与 minor allele
Major allele 与 minor allele 通常是针对某⼀⼤⼩确定的特定群体⽽⾔,频率最⾼的allele为该群体的major allele, 频率次⾼的为 minor allele,对于最常见的 bi-allelic SNP来说,两个allele频率⼀⾼⼀低,就是这个群体中这个SNP的major和minor allele,对于tri- 或者quad-allelic SNP (位点有三种或四种碱基的SNP)⽽⾔,minor allele则是频率第⼆⾼的那个allele。
注意:
(1) 区分major与minor的依据:某⼀⼤⼩确定特定群体的 allele 频率;
(2) plink1.9⽬前采⽤的是major与minor allele的概念,软件会⾃动计算频率,对原始数据进⾏操作时会⾃动改变allele的排序,如果使⽤plink1.9 的--frq选项计算频率,输出⽂件中的MAF (minor allele frequency),不会⾼于0.5。
plink1.9 中,A1为minor,A2为major allele,故 MAF (minor allele frequency) 是指A1 (minor allele) 的频率。
CHR    SNP    A1  A2          MAF  NCHROBS
苦丁茶1      SNP1    T    C      0.125810000
1      SNP
2    A    G      0.125810000
天秤座的守护神2. reference与 alternative allele
Reference allele 在这⾥是指某⼀参考基因组上该位点的allele,该位点上其他的allele则称为alternative allele。注意,这⾥reference 与alternative allele与频率⽆关,唯⼀的决定因素是所选的参考基因组。参考基因组上的allele多为major allele,但这只是巧合,不能以此为依据将major和 reference allele划上等号,也有部分reference allele在该群体中为minor allele。
与plink1.9不同,plink2使⽤的概念则是reference 与 alternative allele,进⾏操作时不会⾃动依据频率⽽改变ref与alt的排序,使⽤plink2 的--frq选项计算频率,输出⽂件中的是alternative allele frequency (不是MAF),取值范围为[0,1]。
#CHROM  ID  REF ALT ALT_FREQS  OBS_CT
1  SNP1    T  C  0.874210000
反省自己的句子1  SNP
2    G  A  0.125810000
plink2 中则明确区分了reference 与 alternative allele的概念,例如上述的两个SNP,根据参考基因组⽐对后,SNP1在参考基因组中的ref为T,那么alt就为C,这⾥计算的alt的频率为0.8742,按概念来说在该群体中,SNP1的T为ref allele,但却⼜是minor allele , ⽽C 为alt,却⼜是major。 对于SNP2来说ref 则为 major,alt 为minor。
# 将⾃⼰⼿头数据的ref与alt allele与对应参考基因组⽐对
plink2 \
--bfile testfile \国际生物多样性日
--ref-from-fa -fa hg19.fasta \# 从参考基因组的fasta⽂件来决定plink⽂件中的ref
--make-bed \关于勇气的诗句
--out testfile_fa
3. reference 与 risk/effect allele
数学谜语大全
同样是reference allele,在与 risk/effect allele并列时,则指的是GWAS关联检测中的reference allele
服务号申请(other、non-risk 或者 non-effect allele),也就是估计效应量beta(或odds ratio)时的参考组,概念上与上述ref与alt的组合⽆关,但为了保持统⼀性,近年来研究中关联检验的reference 也会与 reference genome保持⼀致,以避免混淆(注意:早期多以minor allele为关联检验的ref allele,这也是容易产⽣混淆的点)。
Risk allele 则是对疾病发⽣有贡献的allele (OR>1)。在复杂疾病的研究中,⼀般情况下risk allele常为minor allele,但也会有例外。Effect allele的概念类似,是对疾病或表型产⽣效应的allele,关联检验结果中effect⼀栏指的就是effect allele的效应,既可能是保护效应也可能是危险效应。
参考阅读:

本文发布于:2023-06-10 07:13:27,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/917609.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:概念   参考   频率   基因组   效应   关联   软件   计算
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图