> 以下是使⽤dada2进⾏数据去噪,本教程先跳过该步,之后有专门教程介绍dada2使⽤4、对数据进⾏剪切
双端:
qiime dada2 denoi-paired \
--i-demultiplexed-qs demux-paired-end.qza \
--p-trim-left-f 13 \
--p-trim-left-r 13 \
--p-trunc-len-f 150 \
-
-p-trunc-len-r 150 \
--o-table table.qza \
--o-reprentative-quences rep-qs.qza \
--o-denoising-stats denoising-stats.qza
去美国旅游单端:
qiime dada2 denoi-single \
--i-demultiplexed-qs demux-joinded.qza \ #输⼊应该也是序列,不能是joined对象
--p-trim-left 13 \
--p-trunc-len 150 \
--o-table table.qza \
--o-reprentative-quences rep-qs-merged.qza \
-
-o-denoising-stats denoising-stats-merged.qza
以下参考:
5、序列质控
qiime quality-filter q-score-joined \
--i-demux demux-joinded.qza \
--o-filtered-quences demux-joined-filtered.qza \
--o-filter-stats demux-joined-filter-stats.qza
输出结果:
demux-joined-filter-stats.qza: 统计结果
demux-joined-filtered.qza: 数据过滤后结果
6、⽤deblur去冗余,并⽣成特征表(相当于QIIME1的OTU Table)
qiime deblur denoi-16S \
--i-demultiplexed-qs demux-joined-filtered.qza \
--p-trim-length 250 \
--p-sample-stats \
--o-reprentative-quences rep-qs.qza \
--o-table table.qza \
--o-stats deblur-stats.qza
输出结果:
火腿的吃法rep-qs.qza: 代表序列
deblur-stats.qza: 统计过程
英语转换table.qza: 特征表
备注:
由于DADA2和Deblur产⽣的“OTU”是通过对唯⼀序列进⾏分组⽽创建的,因此这些OTU相当于来⾃QIIME 1的100%相似度的OTU,通常称为序列变体。在QIIME 2中,这些OTU⽐QIIME 1默认的97%相似度聚类的OTU具有更⾼的分辨率,并且它们具有更⾼的质量,因为这些质量控制步骤⽐QIIME 1中实现更好。因此,与QIIME 1相⽐,可以对样本的多样性和分类组成进⾏更准确的估计。
7、查看deblur去冗余后的特征表
qiime feature-table summarize \
--i-table table.qza \
--o-visualization table.qzv
--m-sample-metadata-file sample-metadata.tsv
qiime feature-table tabulate-qs \
--i-data rep-qs.qza \
-
-o-visualization rep-qs.qzv
qiime tools view table.qzv
8、统计每个样品包含的序列数
qiime deblur visualize-stats \
--i-deblur-stats deblur-stats.qza \
--o-visualization deblur-stats.qzv
qiime tools view deblur-stats.qzv
9、构建进化树⽤于多样性分析
qiime phylogeny align-to-tree-mafft-fasttree \
--i-quences rep-qs.qza \尽快的英文
--o-alignment aligned-rep-qs.qza \
-
-o-masked-alignment masked-aligned-rep-qs.qza \
肺经经络图--o-tree unrooted-tree.qza \
--o-rooted-tree rooted-tree.qza
11、计算核⼼多样性
qiime diversity core-metrics-phylogenetic \
--i-phylogeny rooted-tree.qza \
--i-table table.qza \
--p-sampling-depth 500 \
--m-metadata-file sample-metadata.tsv \
--output-dir core-metrics-results
分析结果包含:
α多样性
⾹农(Shannon’s)多样性指数(群落丰富度的定量度量,即包括丰富度richness和均匀度evenness两个层⾯)
Obrved OTUs(群落丰富度的定性度量,只包括丰富度)
Faith’s系统发育多样性(包含特征之间的系统发育关系的群落丰富度的定性度量)
均匀度(或 Pielou’s均匀度;群落均匀度的度量)
β多样性
Jaccard距离(群落差异的定性度量,即只考虑种类,不考虑丰度)
Bray-Curtis距离(群落差异的定量度量)
⾮加权UniFrac距离(包含特征之间的系统发育关系的群落差异定性度量)
加权UniFrac距离(包含特征之间的系统发育关系的群落差异定量度量)
β多样性分析结果-PCoA:
12、Alpha多样性组间显著性分析和可视化
qiime diversity alpha-group-significance \
--i-alpha-diversity core-metrics-results/faith_pd_vector.qza \
--m-metadata-file sample-metadata.tsv \
--o-visualization core-metrics-results/faith-pd-group-significance.qzv
qiime diversity alpha-group-significance \
--i-alpha-diversity core-metrics-results/evenness_vector.qza \
--m-metadata-file sample-metadata.tsv \
--o-visualization core-metrics-results/evenness-group-significance.qzv
13、绘制稀疏曲线
qiime diversity alpha-rarefaction \
-
-i-table table.qza \
--i-phylogeny rooted-tree.qza \
--p-max-depth 1000 \
--m-metadata-file sample-metadata.tsv \
--o-visualization alpha-rarefaction.qzv
福建东山县--p-max-depth参数的值应该通过查看上⾯创建的table.qzv⽂件中呈现的“每个样本的测序量”信息来确定。⼀般来说,选择⼀个在中位数附近的值似乎很好⽤。
14、物种组成分析
下载物种注释数据库制作的分类器:
wget \
-O "gg-13-8-99-515-806-nb-classifier.qza" \
描写老师的名言"data.qiime2/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"
物种注释和可视化
qiime feature-classifier classify-sklearn \
黄色的食物--i-classifier gg-13-8-99-515-806-nb-classifier.qza \
--i-reads rep-qs.qza \
--o-classification taxonomy.qza
qiime metadata tabulate \
--m-input-file taxonomy.qza \
--o-visualization taxonomy.qzv
⽣成物种组成柱状图:
qiime taxa barplot \
--i-table table.qza \
-
-i-taxonomy taxonomy.qza \
--m-metadata-file sample-metadata.tsv \ --o-visualization taxa-bar-plots.qzv