DNA测序常见问题及其分析 - 图文

更新时间:2024-03-17 11:00:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

测序常见问题及其分析 Collected by RobertoRun,12.10.2008

(From: http://biology.aweb.com.cn/news/2007/9/5/14270898.shtml)

HTUTU

UUTTH

1、PCR产物测序时出现重叠峰

问题图1(模板中有碱基缺失,往往是单一位点(1-1)或两个位点(1-2)碱基缺失导致测序结果移码)

图1-1

图1-2

解决方法:将PCR产物克隆到质粒(如T载体)中挑单克隆测序,或将PCR产物进行PAGE纯化(至少琼脂糖充分电泳后切胶纯化)后再进行测序。

问题图2(PCR产物不纯,含部分序列一致的两种以上的片段,长度不一)

图2

解决方法:主要原因是PCR产物没有纯化,含有部分序列一致的两种以上长度不一的片段,将PCR产物进行PAGE纯化(至少琼脂糖充分电泳后切胶纯化)后再进行测序,便可解决。

问题图3(测序引物有碱基缺失)

测序引物有碱基缺失(一般是引物的5'端缺失),和模板的碱基缺失即图1有些类似,所不同的是模板碱基缺失一般是在一段正常测序序列后才出现移码,而引物碱基缺失的话,则从测序一开始就出现移码,表面在图形上便是一开始就是严重的峰形重叠。

解决方法:重新合成引物,或将引物进行PAGE纯化 2、克隆测序时出现峰形重叠

原因:所挑选的重组子不是单克隆,所提供的测序用质粒中含有两种以上插入片段不同的质粒;或是是送测序的菌液污染

解决方法:重新挑单克隆的菌落(划线分离单菌落),提质粒或送菌液再次测序。 3、样品有杂合/突变位点

模板中有杂合型突变,也就说模板本身在这个位点出现突变;或者是从基因组中扩增出来的杂合位点。如果模板有杂合(突变或缺失),那么测序图形中其他的位點一般都是單一的峰形,然后突然在某一個位點出現重叠峰(如图中箭頭所示)。

解决方法:建议将DNA片段克隆到载体再测序。 4、polyA/T和C/Gcluster导致的套峰和测序信号衰减

图4-1

图4-3

图4-4

RACE测序时经常遇到图4-1和图4-4的情形,解决方法:从另一端测序;但如果这样的序列出现在中间,呵呵,目前还没有很好的解决方法,要看测序公司的本事了。

C/Gcluster在PrV基因组测序时遇到过。后来还是让TaKaRa公司给解决了,虽然不喜欢鬼子,但有时候却不得不用它们的产品和服务。 5、基因中含有重复序列

可能的原因:样品中含有重復序列导致的测序结果和PolyA/T的结果一样,会导致Frame滑动,较短的重復序列会导致测序结果出现移码;而较长的重復序列会使定序信号衰减。

解决办法:反向测序有时能够顺利的通过重復序列区域(但不是一定都能够),通过多次的测序结果比对,拼接可以得到全序列结果。

TT

测序结果常见的几个问题

TT

(From: http://www.shinegene.org.cn/service/serv003.html )

HTUTU

UUTTH

1 、 为什么开始一段序列的信号很杂乱,几乎难以辨别?

这主要是因为残存的染料单体造成的干扰峰所致,该干扰峰和正常序列峰重叠在一起;另外,测序电泳开始阶段电压有一个稳定期,所以经常有20-50 bp 的紧接着引物的片段读不清楚,有时甚至更长。 2 、 为什么在序列的末端容易产生 N 值,峰图较杂?

由于测序反应的信号是逐渐减弱的,所以序列末端的信号会很弱,峰图自然就会杂乱,加上测序胶的分辨率问题,如果碱基分不开,就会产生 N 值,正常情况下ABI377测序仪能正确读出500个碱基的有效序列。 3 、 测序结果怎么找不到我的引物序列?

如果找不到测序所用的引物序列。这是正常的,因为引物本身是不被标记的,所以在测序报告中是找不到的;如果找不到克隆片段中的扩增引物,可能是您克隆的酶切位点距离您的测序引物太近,开始一段序列很杂,几乎难以辨别,有可能看不清或看不到扩增引物;另外插入片段的插入方向如果是反的,此时需找引物的互补序列。 4 、 测序结果怎么看不到我克隆的酶切位点?

可能的原因同上,您克隆的酶切位点距离您的测序引物太近,开始一段序列很杂,几乎难以辨别,有可能看不清或看不到酶切位点。通常我们会尽量选择距离酶切位点远点的引物,当然,若是样品出现意外原因,如空载、载体自连等,克隆的酶切位点也是看不到的。

5 、 你测出的结果与我预想的不一致,给我的结果与我需要的序列有差距,这是怎么回事?

首先,我们会核实给您的测序结果是否对应您的样品编号,如果对应的是您的样品,由于不知您的实验背景,测得的序列是否与您预想的结果一致我们无法判断,我们能做到的是检查发送给您的测序结果和您提供来的样品是否一致。 6 、 序列图为什么会有背景噪音(杂带)?是否会影响测序结果?

序列图的背景杂带是由荧光染料引起,如果太强会影响测序结果,要看信噪比,我们给的结果信噪比大都在98%以上。 7 、测序 结果为什么与标准序列有差别?

原因可能有: 样品个体之间的差别、测序准确率的问题,自动测序仪分析序列的准确并非100%,建议至少测一次双向,通过双向测序可以最大限度减少测序的错误。当然尽管我们有时做了最大努力,但还是保证不了和文献序列完全一致,但我们测序报告是客户样品序列的真实结果。 8 、 PCR 产物测序与克隆后测序序列为什么有差别?

PCR 产物克隆到载体中进行测序,有两个方面可能序列有变化:首先, PCR 扩增过程中可能产生错配。将片段克隆到载体中也有可能发生突变;其次,测序的准确率并非100%。 9 、 有杂合位点,但你们的报告上看不到杂合的信号!

如果在您认为应该出现杂合信号的位置上只出现单一的信号,那么可能是您样品突变的模板与正常的模板的比例没达到可以测出的浓度。测序反应的信号强度直接与模板的量有关,如果突变的模板所占的比例很低,仪器会自动将它作为背景信号了,很难检测出来。只有当测序反应体系中正常的和突变的模板量比较接近时,才能较可靠地检测到突变体的存在。其次,在同一位置,不同碱基的信号强度一般是不一样的,这样即使突变的模板所占的比例较高时,也不一定能准确检测到突变的存在,因为,测序仪是主要用来测序正常的碱基序列的,软件分析结果时,会尽量提高主峰而将背景信号尽量压低,以得到尽可能好的结果。尊重结果,我们是不会人为将出现单一的信号修改为杂合位点的。 10 、 DNA 测序样品用 TE 溶液溶解好不好?

由于 EDTA 是 Taq 聚合酶的一种潜在的抑制物, DNA 的测序反应也是 Taq 酶的聚合反应,需要一个最佳的酶反应条件,因此 DNA 测序样品溶解时,最好用灭菌水溶解。 11 、 我送什么形式的菌体样品好?

菌体的一般形态有、菌液,平板培养菌、穿刺培养菌,甘油保存菌等。我们建议客户所送的形态以方便且不易受污染为准则,推荐穿刺培养菌。 上海客户用过夜培养好的菌液2 ml 。 12 、 为什么你们给我的序列是反的?

测出来的结果与您预期的方向并不一致,可能是片断插入方向是非定向的,这在 PCR 产物 T/A 克隆中较常见。有时,

客户要求的测序引物离克隆位点较近,如果反向引物相对克隆位点较远,为得到更好的结果,我们会选择反向引物测序,若是这种情况,用看图软件 Chromas 可以把图反转过来,就可得到正向序列。 13 、 Template mixed 为何种情况?

测序结果表现为套峰,测序反应信号很好,测序结果杂乱,即同一个位置有二个峰。

原因可能有:样品并非单一模板、 PCR 产物中有杂带、质粒为双克隆产物、引物特异性不高,有两个结合点, PCR 产物电泳时看不出,但测序结果能清楚地说明这点。 14 、 polyT 或 polyA 后峰图杂,怎么也要收费?

这种情况一般表现为 A 、 T 连续结构后面的测序结果出现套峰,是样品的内在原因。这类问题我们应该同正常测序一样,给客户报告,反应按正常收费。

15 、 我的引物做 PCR 条带很好,但为什么测不出序来?

并不是能做 PCR 反应的引物都能测序,测序所用引物要求较高,必须与模板完全匹配(有时 5' 端可以有个别碱基的简并),引物长度一般为20个碱基左右、 GC 含量适中,而且用于测序的引物一定要足够纯。 16 、如果 我的菌种培养得很好,测序应该不会有问题吧?

对于宿主菌,提倡使用宿主菌 DH5 α, DH1 、 和 C600 E.coli 菌株也可, XL1-Blue E.coli 菌株也不错,但其生长过慢。 JM 系列、 TG1 系列和 HB101 系列 E.coli 菌株等由于产生大量的碳水化合物(即糖),而应当尽量避免使用;其它宿主菌可能会对测序造成影响。

17 、 为什么 G/C rich 的样品没结果或结果不好,照常收费?

由于 G/C 连续结构有时会造成反应中途无法正常进行,如果结构在引物下游近处,反应只有一小段的信号,有时甚至反应根本没信号。对于这种情况,本身就潜在不确定性的测序,有很大的失败因素。 18 、 PCR 产物150 bp 以下的为什么不适于直接测序?

PCR 产物 150bp 以下的纯化和定量都有一定困难,用于测序的 PCR 产物一般不低于150 bp 长度。一个150 bp 的 PCR 产物用于测序,去掉两个引物的序列大约40到50 bp , 再加上测序起始端的一些读不好的碱基,真正能够得到的有用序列不过几十碱基。这只是最理想的假设,这么短片断测序失败的几率非常大,因此只能克隆后再进行测序。 19 、 我的质粒样品很好,测序结果怎不好?

由于原因不明的复杂结构如发卡和回文结构,有时会出现突然信号减弱或消失;有时测序根本不能进行下去, DNA 碱基排列并无特别异常,可能是 DNA 整体出现复杂结构,反应无法进行。 20 、 我的样品还保留了吗?我想现在反向再测一个反应。

出于保密原则我们测序样品只保留一个月,所以若要再测序,请抓紧时间,否则只有重新送样。 21 、 已经测通了样品,但重叠的地方有错配,是为什么?

测通的全序列是拼接后的结果,由于拼接处一般是在一次测序的末端和次个反应开始一段,通常会有一定的杂带,以序列信号好的为主,次的为参考,但也不绝对。

常见峰图及原因说明

(From: http://www.jinsite.com.cn/sequencing_peak.html )

1.PCR产物电泳检测条带单一,为什么测序结果说模板杂? 2. 什么是碱基缺失? 3. 什么是引物不纯?

4. 重复结构对测序有哪些影响? 5. 什么是模板不单一?

6. Poly结构的测序结果是怎样的?

7. 含有回文结构的模板测序结果是怎样的? 8. 测序峰图为前双峰的结果是什么样的? 9. 测序峰图为后双峰是什么样的?

10. 无信号的结果:信号值(ATGC的平均值)皆小于100

11. 飘峰:这是由于用3.0特殊试剂盒时碱基产生替代而出现碱基位移 12. 没有任何干扰的结果

Q-1.PCR产物电泳检测条带单一,为什么测序结果说模板杂? A-1.PCR产物电泳检测的结果只是一个粗略的定性结果。对于与目的片段条带大小只相差几个碱基的非特异性PCR扩增产物是无法用肉眼区分开的。但是DNA测序反应敏感而客观,可以直接反应出模板本身的情况。需要强调的是,高质量的PCR产物才可能得到高质量的测序结果,如果您对PCR产物的纯度不很确定,希望您可以将PCR产物进行克隆处理,以确保得到好的测序结果。以下图为例:该反应的背景信号较高,不利于碱基的判读。

HTUTU

UUTTH

解决办法:改变PCR条件,重新扩增。或者可以将该PCR产物克隆到质粒中,初步筛选后进行单克隆测序。 Q-2.什么是碱基缺失? A-2.以下图为例:

碱基缺失常见在PCR产物中,特别是从基因组中扩增得到的PCR片段,上图的186位缺失两个连续的T 解决方法:

(1) 使用反向引物继续测序,以矫正缺失位点并达到测通的目的。或者将该PCR产物克隆到质粒中,挑取单克隆测序。

(2) 如果可以确定该PCR片段中不应该有缺失的位点,那么可以改变PCR反应条件,重新扩增。

Q-3.什么是引物不纯? A-3.以下图为例:

引物不纯造成移码现象,该种现象与模板杂在峰图都表现为背景峰较杂,但是引物不纯在峰图上表现的更有规律,一般在每一个主峰前或者后都有一个同一碱基的小峰。 解决办法:重新合成引物,或者将引物进行PAGE纯化后再进行测序。

Q-4.重复结构对测序有哪些影响? A-4.以下图为例:

重复结构将导致测序复制框的滑移,重复结构之后峰型混乱。

解决办法:使用反向引物对模板进行测序,测到该重复结构处,即可完成模板全长的拼接。

Q-5.什么是模板不单一? A-5.以下图为例: (1) 菌液为非单克隆:

下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰(插入后双峰),即模板中含有两个或两个以上的相同载体,但是插入片段不同。

解决办法:重新挑取单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定仅能证明该克隆含有插入片段,并不足以证明模板的单一。

(2) PCR产物不纯,如下图所示:

在197bp前测序峰表现为杂或有明显套峰,且在197bp位置有一个高高的A峰,这个A峰标志着此PCR产物中有一个片段大小为200bp左右的小片段。 注:PCR产物测序都是以A高峰终止。

解决方法:对PCR产物切胶纯化,再进行测序。

Q-6.Poly结构的测序结果是怎样的? A-6.以下图为例:

以polyT为例,在polyA/T结构之后往往出现移码、双峰、套峰现象,而在polyG/C之后会往往导致测序信号的衰减或者直接中断。

解决办法:使用反向引物对模板进行测序,测到该poly结构处,即可完成模板全长的拼接。如果是较长的PloyG/C,建议客户使用3.0试剂盒进行测序。

Q-7.含有回文结构的模板测序结果是怎样的? A-7.以下图为例:

位点94至137是一个回文结构,该结构导致后面的信号衰减,出现错误的判读。

解决方法:使用反向引物对模板进行测序,测到该回文结构处,即可完成模板全长的拼接。

A-8.测序峰图为前双峰的结果是什么样的?

A-8. (1) 产物中含有小片段PCR产物;(2) 引物有两个结合位点,其中一个结果中断

解决方法:换引物反向测序。

Q-9.测序峰图为后双峰是什么样的?

A-9.原因和解决方法同回文结构及插入后双峰。

引物不纯造成移码现象,该种现象与模板杂在峰图都表现为背景峰较杂,但是引物不纯在峰图上表现的更有规律,一般在每一个主峰前或者后都有一个同一碱基的小峰。 解决方法:重新合成引物,或者将引物进行PAGE纯化后再进行测序。

Q12.重复结构对测序有哪些影响? 答:以下图为例:

重复结构将导致测序复制框的滑移,重复结构之后峰型混乱。

解决办法:使用反向引物对模板进行测序,测到该重复结构处,即可完成模板全长的拼接。

Q13.什么是模板不单一?

答:以下图为例,下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰,即模板中含有两个或两个以上的相同载体,但是插入片段不同。

解决办法:重新挑取单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定仅能证明该克隆含有插入片段,并不足以证明模板的单一。

对于PCR产物也同样有模板不单一的情况,如下图所示:

在197bp前测序峰表现为杂或有明显套峰,且在197bp位置有一个高高的A峰,这个A峰标志着此PCR产物中有一个片段大小为200bp左右的小片段。 解决方法:对PCR产物切胶纯化,再进行测序。

Q14. poly结构的测序结果是怎样的? 答:以下图为例:

以polyT为例,在polyA/T结构之后往往出现移码现象,而在polyG/C之后会往往导致测序信号的衰减。

解决办法:使用反向引物对模板进行测序,测到该poly结构处,即可完成模板全长的拼接。

Q15.含有回文结构的模板测序结果是怎样的? 答:以下图为例:

位点94至137是一个回文结构,该结构导致后面的信号衰减,出现错误的判读。

解决方法:使用反向引物对模板进行测序,测到该回文结构处,即可完成模板全长的拼接。

手把手教您看测序图

(From: http://www.qylj.cn/bbs/dispbbs.asp?boardID=14&ID=257&page=1 )

一般来说,我们只需把测序序列结果和原有的目的序列结果进行比对(Blast)就行了,如果序列百分之百吻合,或者所需要的突变点(片段)成功突变或插入片段成功插入,就OVER了。

关键是测序结果有时候模怜两可,需要我们自己来把握,或者说,为我们自己争取不付费的权利。

测序看图文件有吧?没有就下载这个:点击浏览该文件

里面有个补丁,打一下,就可以永久使用了。测序结果文件一般有两个,一个是序列文件,一个是图谱文件,图谱文件用上面的程序可以打开(*.abi.或 *.scf)。序列文件打不开?那您能随便装个什么DNAstar,DNAman或者俺最喜欢用的Genetool,或者装个edit(这玩意好啊,一般人没用过,呵呵)

1.安装好看图软件后,双击峰图文件就可以打开,没有序列文件?那下一个吧:点击浏览该文件

打开峰图文件,依据图形初步判定测序质量,这个图一般般,头峰杂度比较大,至少前50bp序列不可信。

HTUTU

UUTTH

2. 既然峰形不错由此初步判定测序结果可信,那就来比比测序结果与我们预期的有什么差异吧.....

当我们打开图形文件的时候,我们也可以输出测出来的序列,就是export啦,如下图,port后能得到文本形式的序列结果

不过俺一般习惯了用ultra-edit,直接双击测序公司提供的序列文件,它是这样显示的:

我说,您还是别用了,俺当初是用ultra-edit处理一些其它数据(当然是word/notebook等无法胜任的数据)时,发现它还可以打开*.seq文件,于是就一直用过来了

3.关于序列比对,没有太多好说的吧。假设原有序列为A文件,测序结果为B文件,例如,在DNA工具软件genetool中打开B,

通过调用工具(上图),进入Blast程序(说这个是Blast程序有点牵强,其实是同源性比较,其实质不就是Blast的嘛,哈哈)。

加上原序列文件A

之后,就直接按align all button啦

这个就是比对结果:

4、峰图头尾测序结果的不可靠性:

头尾的问题,很多测序公司都明确标出了头尾各80-100bp序列的不可靠性,这是测序起始信号与终止信号不稳定的体现,就如同一个跑步一样,发力起跑与力衰止跑之时,速度是不稳定的,无法用来衡量其跑步速度.....但俺见识过一家测序公司的测序结果,既使是头尾区,其结果也是可信的,但总体测序长度不够长,可能是用其它软件进行了掐头去尾之后移花接木的处理吧!

这里要强调一点的是,有时候测序公司给出的是反向测序结果,简单的align得不到匹配结果,这时,你千万不要急着骂测序公司,试试把测序结果reverse 或reverse complement一下再进行align,也许会有预期的结果(见过不少这样的朋友,其实仍然只能怪我们自己^_^) 5.干扰峰与结果判读

这个峰是作出来的,线条有点粗,将就说事。

第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组DNA,就很好地说明了样品为杂合子,该位点可能存在SNP现象(T/G)。如果判读为干扰峰,我们只需认定样品此处碱基为T为行了。

第二个峰,错位干扰。如果不判读为干扰峰,则说明样本可能比预期多一个碱基(G),如果判读为干扰峰,我们仍只需认定样品此处碱基为T为行了。

所谓干扰,前提前件是主峰要清晰、连续,但峰图中莫名其妙多出一条类似或接近于主峰清晰程度的峰线,但这种峰线往往是不平滑、不连续的,这是干扰峰判读的重点!

6、SNP的判读

做SNP的人不少,AFLP仍然是一种经济、适用的方法之一。AFLP的结果多需要用测序来进行验证,但似乎以测序来验证结果的人并不多,或者说验证一二个样本就完了,其实这样并不科学,还是多验证几个吧,证据多了,没人会说我们少了,但证据少了,我们自己说话都没底气,何苦自己给自己添乱呢?

前面说了干扰峰的判读,其特征是峰线不平滑、不连续,而SNP峰图跟主峰图一样,是连续的平滑峰线,且不存在错位!

见下图:

6、双峰、杂峰与乱峰、高GC片段测序:

双峰,图形上接近于SNP峰形,但碱基无法正确判读,通常以一连串N代表,仅有个别位置能正确判读出碱基。对于出现双峰的情况,坚决不付费,理由如下:

如果是PCR产物,测序前要对PCR产物纯化,我们一般都是让测序公司纯化,此时都指明了产物大小,此时如果出现双峰,是测序公司的责任,要么是它没纯化好,要么是它测序前进行的单链扩增质量不过关,而后者的可能性最大,因此,一旦出现双峰,公司应该及时终止实验(除非你说明要的就是双峰)并告之客户。

如果测序样品是质粒,抛开我们自己质粒抽提不纯的原因不管,测序过程出现双峰,公司同样应该终止实验。

公司不终止实验而让我们交纳由他们懒惰导致的材料消耗而收我们的费用,我们理应不给费用......

关于杂峰与乱峰,这个没太多说法,看着不顺眼的dd,说它是杂峰就是杂峰说它是乱峰就是乱峰,反正就是主峰不清晰,测序之序列结果不明确或不肯定,结果没法用。见识过杂峰仍要收费的角儿!希望下次你们不要碰上!

而对于GC高片段测序,一般测序公司有明确指出,测序结果低于300bp不收费,但俺见过测了100多bp也要收费的,俺也见过能测出500bp长高GC含量片段的,下次撞到了,据理立争!

7.测序引物找寻与目的片段确认

有时候,测序结果与预期目的序列毫不相干,是测序公司的错误还是我们自己样品的错误呢?那就从测序结果中查找测序引物吧,如果连测序引物都找不到,我们当然把责任归结于测序公司,如果找到了测序引物尤其是拿自己合成的引物来进行测序的引物,兄弟们,还是乖乖掏钱并立马重作实验吧......

8.测序中常见的怪异:

(1)寄给公司的细菌提不出质粒:这种现象不多但一个月也能撞上那么一次啦!公司用的是批量化操作,以许就那么霉,轮到俺这儿加样枪或其它什么出了点问题没挨到俺的细菌,三天后要求公司重抽吧,一般都能抽出来。

(2)测序没信号:就俺目前的经验而言,与公司技术水平、操作流程有关,有点和第(3)点类似,但要和第(4)点严格区分。

(3) 能测出头(尾)却测不出尾(头):这种现象不少一个月至少撞上一次。好在自己还没遇到个N个公司都测不通的样品,这个公司不行,总有一个公司行!A公司测不来B公司却能测出来,能说明什么?反正不是我们样品的错。没经验的时候,把样品送到另外一个公司重测,现在不了,把样品送到其他公司后只测没测出来的那一端,两方面的结果一拼,同样可以确定测序结果。

(4)特殊样品的测序:如RNA干扰载体、病毒载体,这样的样品,测不出来不要怪公司,

只能找更好的公司去测。而对于有的样品,是需要自己特殊处理才能测出来的,记得有位朋友一个样本测了4个月才测出来,而另外一位朋友的样本,现在测出来没有也不清楚,至少有三个月了吧....

本文来源:https://www.bwwdw.com/article/o7h8.html

Top