ContigExpress拼接程序使用说明

更新时间:2023-09-01 04:16:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

ContigExpress拼接程序使用说明

ContigExpress的序列拼接应用程序

1. 解压缩下载的压缩文件contig.zip文件,保证文件CExpress.exe,Gexudat.def在同一个目录下,打开Cexpress.exe应用程序,进入ContigExpress操作界面,如图1。

图1

2. 点击菜单上的“Project”选择“Add Fragments”,一般我们发给您的是SCF文件,如果您有其它格式的文件,也可以选择,在这里我们选择SCF文件,以其为例,如图2。

图2

3. 选择您存放SCF文件(即我们Email给您的测序结果的彩图文件)的目录,选择文件并打开,从而添加进ContigExpress软件。在此以A、B两个序列为例,如果有多个序列的也可以同时添加进入。

ContigExpress拼接程序使用说明

图3

4. 选中要拼接的序列,再选菜单中的“Assemble”下的“Assemble Selected Fragments”命令,或用工具栏上的按钮,如图3。若两个结果能够拼接起来的,会得到一个Assemble1下的contig1的结果,如图4。

图4

5. 双击contig1,打开拼接后的结果,如图5。此时可能会因为两条序列的测序结果误差,会有不同的地方,在拼接图片框中的绿色竖杠就表示了这些不同的地方,如图所示。接着可点击绿色竖杠找到有误差的地方,进行修改。

6. 在修改过程中,遇到有误差的地方,可以根据峰形来判断是多读还是漏读来进行修改,此时电脑认为是漏读碱基的地方会以点来表示,如图5,此处很明显是A序列上多读了一个G碱基,可将其删除。(注:因为软件本身的问题,只有在拼接过程中是正向的序列才能进行修改操作,若在反向上修改碱基,保存时会产生错误而直接关闭程序。所以若要修改反向序列上的碱基,可先保存后,把原有的Assemble1的结果拆开,点序列图标上的“Name”,如图3,所选中的序列上的一个“name”横栏,使序列按Name的升降次序来排列,把要作为正向的序列放到要作为反向序列上面即可。以此序列为例,将其改变方向后可实现反向拼接,如图6。此时反向拼接中,电脑也会将整条序列自动进行反向互补。若有多条序列

ContigExpress拼接程序使用说明

只要让反向序列在正向序列上即可。建议最好是修改一个碱基后就保存一下,然后拆开了再拼接,这样可以最大程度地避免误差。)

5

图6

7. 全部修改完成后,所有的绿色竖杠就消失了,但电脑对那些个别碱基不同,即没有多读或漏读的现象,不会用绿色竖杠标出,这样也就是说,在整个序列中还有误差存在,所以这时我们就需要用到工具栏上的另一个按钮“find next ambiguous”,如图7,来找序列中因两条序列碱基不同而出现的N值,需要记住此时也只能在正链上进行修改。如图,此处依据峰形可确定A链上的C应该为A,把它校正即可。

ContigExpress拼接程序使用说明

图7

8. 经过校正和修改之后,两条序列的重叠部分已经完全一致,序列已经拼通,可以把整个拼接结果保存下来,若想拷贝并保存整条序列,可以右击contig1选取“Select All”,再选“Copy sequence from bp to bp”,如图8。然后打开可存放文本的应用程序,如记事本,把整个序列粘贴进去,保存即可。

图8

本文来源:https://www.bwwdw.com/article/xooi.html

Top