2021.04.09⼁使⽤featurecount进⾏定量处理
摘要
接到⼀个个性化分析,客户发了⼀个⽂档,明确了分析流程以及使⽤⼯具。其中定量环节要求使⽤featurecount⼯具。平时我都是使⽤htq-count进⾏定量,因此,在这⾥记录⼀下新⼯具的使⽤步骤和遇到的⼀些⼩问题。
软件版本
featureCounts(subread) v2.0.1女生说不合适
使⽤说明
安装featureCounts
电脑蓝屏代码大全该⼯具属于Subread软件中的定量⼯具,另外subread还可以进⾏⽐对和寻找SNP位点,在这⾥就不详述了。我们要做的就是安装Subread
conda install subread
阅读分享会ppt
安装成功后即可使⽤featureCounts命令进⾏定量,关于featurecount⼯具的参数说明,这⾥推荐⼀⽂,讲得⾮常详细了。我这⾥主要说两个重点参数。
-t:指定feature的类型,默认是exon,当然熟悉gtf格式的⼩伙伴知道⼀般还有gene、CDS或者直接以feature命名的分类⽅式。
-f:该参数设置后统计的是feature层⾯(默认就是exon)的参数,如果不设置则是直接统计meta-feature参数(及⼀个gene中的多个exon)
为了让⼤家理解更透彻,我做了三种统计⽅式(由于参考基因组和注释⽂件不是⼀个版本,因此count都是0,⼤家可以忽略不计)
第⼀种:-t exon -f
这种设置将⼀个基因的每个exon单独列出
第⼆种:-t exon
共同抗疫
此时仍然按exon分类进⾏统计,但是由于没有设置-f,在同⼀个gene内的exon会被统计成⼀个meta-feature,但是每个exon仍然会被显⽰出来,遇到⼀个gene有多个exon的时候看着就很乱(这⾥选择的5个以内exon的gene进⾏截图)
我在使⽤htq-count时,根据默认算法,会将exon直接合并到gene中进⾏统计。前两种统计格式其实不太⽅便我们进⾏后续的差异分析。因此,我直接将-t参数修改了
第三种:-t gene -f
这样就看着⽅便多了。
批量处理使⽤代码(单端测序)家风家训是什么
for i in `ls *.bam`
反应反映do衣服英语
i=${i%.bam}
featureCounts -T 16 -f -t gene -g gene_id -a ../path/f -o ${i}.count ${i}.bam
done
望野总结
第⼀次使⽤这个⼯具,肯定还是有很多参数需要摸索的,根据不同的项⽬,参数也要进⾏适当的调整。之后会和htq-count打得算法再做⼀个对⽐。