基于测序的微生物多样性分析总结

更新时间:2023-08-06 20:11:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

基于二代高通量测序的环境微生物多样性分析

一般认为土壤、海洋、肠道等生态系统中的微生物数量繁多、

种类多样。传统的培养方法只限于对环境样品中极少部分

(0.1%-1%)可培养的微生物类群的研究,而变性梯度凝胶电泳(DGGE、克隆文库等常规的分子生物学方法也因操作复杂、成本高、痕量菌发现困难等因素无法达到深入分析环境微生物多样性的目的。高通量测序技术的出现,极大的促进了对环境中不可培养微生物以及痕量菌的研究,为环境微生物多样性的研究开启了新的研究热潮。

微生物群落中物种的多样性依然是目前研究的重点。对群

落结构的研究,将有助于了解种群结构的稳定性,进而了解种群

内物种间的相互依赖、相互制约的内在联系,为将来构建功能性种群服务。鉴于微生物群落是一个多物种的集合体,其中高达95% 以上的微生物物种无法分离也不能独立培养,拼装出每个独立个

体的基因组现在也无法实现,细菌16S或真菌ITS测序分析依

然是现阶段微生物群落多样性和多态性分析的基石。

一、高通量测序背景介绍

高通量测序技术,可以一次对几十万到几百万条DNA分子进行序列测定,使得对PCR扩增产物直接进行序列测定成为可能。极大的促进了对环境中不可培养微生物以及痕量菌的研究,为环境微

基于二代高通量测序的环境微生物多样性分析

生物多样性的研究开启了新的研究热潮。目前高通量测序的主要

平台代表有Illumina 公司的Solexa 基因组分析仪( Illumina

GenomeAnalyzer )、罗氏公司(Roche)的454 测序仪(Roch GSFLX sequencer )和ABI 的SOLiD 测序仪(ABI SOLiD sequencer )。微生物多样性分析中,以Illumina 及454测序平台应用最为广泛。

二、工作流程

1 PCR引物的设计

2 PCR 扩增条件摸索

3琼脂糖凝胶电泳检测结果

4 全部样品进行PCR

5 PCR产物的凝胶回收及检测

6 PCR产物精确定量(Qubit 2.0 )

将纯化后的PCF产物采用微量荧光核酸定量仪进行精确定量(精

确到0.1ng/ul )

7.将定量后混匀的DNA羊本再次进行磁珠法纯化后,进行高通量测序

三、可分析项目

1) 有效序列数据统计

在测序实验中,通常采用多个羊品平行测序的方法,即多个羊品混合测序。为了能区分羊品,各羊品中的序列均引入了一段标示其羊本来源信息的barcode 标签序列。若所测序列中不含有barcode 标签

序列,则无法确定其羊本来源,进而导致后续生物

信息错误或意义不明。因此,仅当原始序列中含有完整的barcode

标签序列时,该条序列才被认可为有效序列。

2)优化序列数据统计

通常情况下,有效序列可以直接用于后续生物信息学分析。在实验过程中,测序产物可能含有非特异性扩增片段,利用特异性引物信息可以将其去除;序列中可能含有模糊碱基(ambiguous)、单碱基高重复区(homologous )以,长度过短的序列(序列长度小于200bp),及PCR过程中产生的一些嵌合体,将这些序列纳入分析范围会降低分析质量,因此修剪、去除(trim )此部分序列,可得到供精准分析的优化序列。在数据去除(trim )时,把maxambig=Q axhomop=8 maxlength=200,及其嵌合体序歹U 去掉,并对数据进行统计,得到优化序列的百分率。

3) OTU 生成

根据序列的相似性,将序列归为多个OTU(操作分类单元),以

便后续分析。OTU (Operational Taxonomic Units )是在系统

发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌。要了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作(cluster )。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU根据客户

指定的相似度(96% 97減者98%,对所有序列进行OTU划分

并进行生物信息统计分析。

OTU 分析主要步骤

(1)提取非重复序列,碱基完全一致序列为重复序列;

(2)与silva 库中的aligned(16S/18S, SSU) 核糖体序列比对;

(3)Chimeric 序列检测与去除

(4)距离计算与OTU聚类。

4) 多样性分析 ( Alpha-diversity ) 计算菌群丰度( Community richness )的指数有:

(1)Chao:是用chaol 算法估计群落中含OTU数目的指数,chao1 在生态学中常用来估计物种总数,由Chao (1984) 最早提出。

(2) Ace:用来估计群落中含有OTU数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao I 的算法不同。计算菌群多样性( Community diversity )的指数有:

(1)Simpson:用来估算样品中微生物的多样性指数之一,由Edward Hugh Simpson (1949) 提出,在生态学中常用来定量的描述一个区域的生物多样性。Simpson 指数值越大,说明群落多样性越低。

(2)Shannon:用来估算样品中微生物的多样性指数之一。它与Simpson 多样性指数均为常用的反映alpha 多样性的指数。Shannon 值越大,说明群落多样性越高。

测序深度指数有:

Coverage :是指各样品文库的覆盖率,其数值越高,则样本中序列没有被测出的概率越低。该指数实际反映了本次测序结果是否代表样本的真实情况。

使用软件: mothur 及BioLinker 自编程序。

5) 稀释性曲线( Rarefaction curve )

稀释性曲线: 一般是从样本中随机抽取一定数量的个体,统计出这些个体所代表物种数目,并以个体数与物种数来构建曲线。它可以用来比较测序数量不同的样本物种的丰富度,也可以用来说明样本的取样大小是否合理。分析采用对优化序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建稀释性曲线。稀释性曲线图中,当曲线趋向平坦时,说明取样的数量合理,更多的取样只会产生少量新的OTU反之则表明继续取样还可能产生较多新的OTU因此,通过作稀释性曲线,可以得出样品的取样深度情况。

稀释性曲线分析结果默认是在97%相似性水平下划分OUT并制作各样品的稀疏曲线。

6) 分类学分析( Taxonomy)

在之前的分析步骤中,已经将序列按照其自身的碱基组成的相似性,分归到各OTU 中。在进行分类学分析时,首先,将每一条优质序列都与SILVA (最新版)数据库进行比对,找出其最相近且可信度达80%以上的种属信息。之后,将每一个OTU 中的所有序列进行类比,找出同一OTU 中的不同序列的最近祖先的种属信息。最后,将

得到的结果记录在表格文件中。这样做,可以在保留最可能多的信息量的情况下,确保得出信息的准确性。

7)样本间比较各样品群落结构分析柱状图或者饼状图在某一分类地位上根据各样品中的微生物组成绘制饼图或者柱状图。

8)全样品相似度分析树状图

比较多个样品中OTU组成的差异及各OTU中含有序列的丰度,计算这些样品的相似性,并绘制相似性图谱。

9)样品OTU分布比较-VENN图

统计多个样品中所共有的OTU 数目可以反映环境样品的相似性及重叠情况。

10)Heatmap 热图分析

Heatmap 可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。常根据需要将数据进行聚类,将聚类后的数据表示在heatmap 的相似性和差异性。如在属水平上对样品和OTU 类型(样品所含菌属)进行聚类(依据是不同样品中各OTU 所含序列数越相近,即所含菌属数量越相近,样品间相似性越高),对聚类后各样品中不同OTU (不同菌属)所含序列的丰度作heatmap图,能够反映出在菌属水平上各样品菌落结构的相似性和差异性。将指定种属水平上的分类信息分别按照样品和分类进行聚类后作出Heatmap 图,能够反映出所有样品在各分类水平上表现的相似性或者差异性。

11) 组间显著性差异分析( metastats 分析) 分析多个样品时,如果这

本文来源:https://www.bwwdw.com/article/59cj.html

Top