首页 > 美文鉴赏

QIIME2使用方法

更新时间:2023-06-14 18:49:43 阅读：评论：0

QIIME2使⽤⽅法

激活qiime2的执⾏环境：source activate qiime2-2019.4

如何查看conda已有的环境：conda info -e

以下分析流程参考：docs.qiime2/2019.4/tutorials/qiime2-for-experienced-microbiome-rearchers/

1、数据准备

现在我们常⽤的就是这种格式的数据，每个样品⼀对数据⽂件

wget \

-O "casava-18-paired-end-demultiplexed.zip" \

"data.qiime2/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

下载解压后，⽂件夹中⽂件如下：

2、将数据转换为qza格式（qiime新定义的⾃⼰的格式类型，有点编程中对象的含义）

qiime tools import \

--type 'SampleData[PairedEndSequencesWithQuality]' \

--input-path casava-18-paired-end-demultiplexed \

--input-format CasavaOneEightSingleLanePerSampleDirFmt \

--output-path demux-paired-end.qza

3、查看数据质量

qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv

⽤以下命令查看结果：

qiime tools view demux-summary-1.qzv

4、双端序列合并成单端

qiime varch join-pairs --i-demultiplexed-qs demux-paired-end.qza --o-joined-quences demux-joinded.qza

5、查看对merge后的数据质量情况

qiime demux summarize --i-data demux-joinded.qza --o-visualization demux-summary-merged.qzv

qiime tools view demux-summary-merged.qzv

> 以下是使⽤dada2进⾏数据去噪，本教程先跳过该步，之后有专门教程介绍dada2使⽤

4、对数据进⾏剪切

双端：

qiime dada2 denoi-paired \

--i-demultiplexed-qs demux-paired-end.qza \

--p-trim-left-f 13 \

--p-trim-left-r 13 \

--p-trunc-len-f 150 \

-p-trunc-len-r 150 \

--o-table table.qza \

--o-reprentative-quences rep-qs.qza \

--o-denoising-stats denoising-stats.qza

去美国旅游单端：

qiime dada2 denoi-single \

--i-demultiplexed-qs demux-joinded.qza \ #输⼊应该也是序列，不能是joined对象

--p-trim-left 13 \

--p-trunc-len 150 \

--o-table table.qza \

--o-reprentative-quences rep-qs-merged.qza \

-o-denoising-stats denoising-stats-merged.qza

以下参考：

5、序列质控

qiime quality-filter q-score-joined \

--i-demux demux-joinded.qza \

--o-filtered-quences demux-joined-filtered.qza \

--o-filter-stats demux-joined-filter-stats.qza

输出结果:

demux-joined-filter-stats.qza: 统计结果

demux-joined-filtered.qza: 数据过滤后结果

6、⽤deblur去冗余，并⽣成特征表（相当于QIIME1的OTU Table）

qiime deblur denoi-16S \

--i-demultiplexed-qs demux-joined-filtered.qza \

--p-trim-length 250 \

--p-sample-stats \

--o-reprentative-quences rep-qs.qza \

--o-table table.qza \

--o-stats deblur-stats.qza

输出结果:

火腿的吃法rep-qs.qza: 代表序列

deblur-stats.qza: 统计过程

英语转换table.qza: 特征表

备注：

由于DADA2和Deblur产⽣的“OTU”是通过对唯⼀序列进⾏分组⽽创建的，因此这些OTU相当于来⾃QIIME 1的100%相似度的OTU，通常称为序列变体。在QIIME 2中，这些OTU⽐QIIME 1默认的97%相似度聚类的OTU具有更⾼的分辨率，并且它们具有更⾼的质量，因为这些质量控制步骤⽐QIIME 1中实现更好。因此，与QIIME 1相⽐，可以对样本的多样性和分类组成进⾏更准确的估计。

7、查看deblur去冗余后的特征表

qiime feature-table summarize \

--i-table table.qza \

--o-visualization table.qzv

--m-sample-metadata-file sample-metadata.tsv

qiime feature-table tabulate-qs \

--i-data rep-qs.qza \

-o-visualization rep-qs.qzv

qiime tools view table.qzv

8、统计每个样品包含的序列数

qiime deblur visualize-stats \

--i-deblur-stats deblur-stats.qza \

--o-visualization deblur-stats.qzv

qiime tools view deblur-stats.qzv

9、构建进化树⽤于多样性分析

qiime phylogeny align-to-tree-mafft-fasttree \

--i-quences rep-qs.qza \尽快的英文

--o-alignment aligned-rep-qs.qza \

-o-masked-alignment masked-aligned-rep-qs.qza \

肺经经络图--o-tree unrooted-tree.qza \

--o-rooted-tree rooted-tree.qza

11、计算核⼼多样性

qiime diversity core-metrics-phylogenetic \

--i-phylogeny rooted-tree.qza \

--i-table table.qza \

--p-sampling-depth 500 \

--m-metadata-file sample-metadata.tsv \

--output-dir core-metrics-results

分析结果包含：

α多样性

⾹农(Shannon’s)多样性指数（群落丰富度的定量度量，即包括丰富度richness和均匀度evenness两个层⾯）

Obrved OTUs（群落丰富度的定性度量，只包括丰富度）

Faith’s系统发育多样性（包含特征之间的系统发育关系的群落丰富度的定性度量）

均匀度（或 Pielou’s均匀度；群落均匀度的度量）

β多样性

Jaccard距离（群落差异的定性度量，即只考虑种类，不考虑丰度）

Bray-Curtis距离（群落差异的定量度量）

⾮加权UniFrac距离（包含特征之间的系统发育关系的群落差异定性度量）

加权UniFrac距离（包含特征之间的系统发育关系的群落差异定量度量）

β多样性分析结果-PCoA：

12、Alpha多样性组间显著性分析和可视化

qiime diversity alpha-group-significance \

--i-alpha-diversity core-metrics-results/faith_pd_vector.qza \

--m-metadata-file sample-metadata.tsv \

--o-visualization core-metrics-results/faith-pd-group-significance.qzv

qiime diversity alpha-group-significance \

--i-alpha-diversity core-metrics-results/evenness_vector.qza \

--m-metadata-file sample-metadata.tsv \

--o-visualization core-metrics-results/evenness-group-significance.qzv

13、绘制稀疏曲线

qiime diversity alpha-rarefaction \

-i-table table.qza \

--i-phylogeny rooted-tree.qza \

--p-max-depth 1000 \

--m-metadata-file sample-metadata.tsv \

--o-visualization alpha-rarefaction.qzv

福建东山县--p-max-depth参数的值应该通过查看上⾯创建的table.qzv⽂件中呈现的“每个样本的测序量”信息来确定。⼀般来说，选择⼀个在中位数附近的值似乎很好⽤。

14、物种组成分析

下载物种注释数据库制作的分类器：

wget \

-O "gg-13-8-99-515-806-nb-classifier.qza" \

描写老师的名言"data.qiime2/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"

物种注释和可视化

qiime feature-classifier classify-sklearn \

黄色的食物--i-classifier gg-13-8-99-515-806-nb-classifier.qza \

--i-reads rep-qs.qza \

--o-classification taxonomy.qza

qiime metadata tabulate \

--m-input-file taxonomy.qza \

--o-visualization taxonomy.qzv

⽣成物种组成柱状图：

qiime taxa barplot \

--i-table table.qza \

-i-taxonomy taxonomy.qza \

--m-metadata-file sample-metadata.tsv \ --o-visualization taxa-bar-plots.qzv

本文发布于:2023-06-14 18:49:43，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/89/1038470.html

上一篇：北方浓香型白酒发酵微生物多样性分布模式解析

下一篇：Editor-in-Chief

标签：数据序列分析群落质量

留言与评论（共有 0 条评论）