DNASTAR中文使用说明

更新时间:2024-06-17 03:05:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

DNAstar

中文使用说明书

目录

DNAStar的安装与升级??????????????????.?.6 EditSeq的使用方法?????????????????????.7 打开已有序列

寻找开放读框 DNA序列翻译 遗传密码选择使用 遗传密码修改 序列的反向互补及反向转换 BLAST检索 序列信息查看 序列校读 序列的保存与输出

GeneQuest的使用方法????????????????????12 打开已有分析文件 GeneQuest的DNA分析方法 用分析方法操作 方法参数改变 结果展示优化 Feature注释 BLAST检索 Entrez Database检索 GeneQuest的其他特点 保存分析文件

1

MapDraw的使用方法?????????????????????18 新酶切图制作 过泸器类型 应用频率过泸器 应用手动过泸器 使用过泸器一览表 使用Must Cut Here/Don’t Cut Here调色板工具 酶信息显示 环形展示 ORF图 显示择选 保存,退出

MegAlign的使用方法????????????????????.23 创建队列文件 序列设置 Pairwise Alignment 使用 Dot Plot Method 多序列比较 Phylogenetic Tree查看 查看队列报告 Decorations/Consensi MegAlign文件保存

PrimerSelect的使用方法?????????.?.???????.28 创建PrimerSelect文件 定义引物特点 查找引物对 浏览其他的引物信息 按特征对引物分类 引物长度改变 在引物中引入突变 设计新引物 使用寡核苷酸订购表格 保存PrimerSelect文件

Protean的使用方法????????????????..????34 创建蛋白质分析文件 Protean’s蛋白质分析方法 应用分析方法 方法参数改变 优化结果显示 使用蛋白酶消化与SDS PAGE Feature注释 BLAST检索 二级结构模拟 展示滴定曲线

2

保存分析文件

SeqManII的使用方法????????????????.????39 输入序列片段 Pre-Assembly Options操作 检查修整的数据 序列装配 查看范围和构建结果 去除矛盾碱基和缺口 手动修改序列末端 文件保存与序列输出

3

EditSeq的使用方法 EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的一部分里是评论,底部是序列的注释。

EditSeq能读取大部分的序列格式——包括FASTA,GenBank,ABI、GCG和ASCII格式。你可以使用菜单命令或拖拽方式输入序列文件。另外, 序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。经Entrez或BLAST检索得到的序列可以直接从因特网或企业内部互联网服务器下载。

序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。另外, EditSeq能以GenBank,FASTA和GCG格式输出序列。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经http://www.dnastar.com.

打开已有序列

我们从用苹果计算机打开“TETHIS21MA”和用Windows打开“tethis21.seq”开始。

假设序列的末尾有载体序列污染。我们在用EditSeq打开序列的同时,用Set Ends命令去除5’和3’污染序列。

? 从文件菜单(FILE MENU),选择Open。

? 打开文件夹“Demo Sequences”单击选定序列“TETHIS21”。

? 单击位于对话框右下角的Set Ends按钮。Set Ends被打开(如右)。 ? 在5’框和3’框中键入50和850,点击OK。

单击Open打开序列。 当EditSeq窗口打开时,序列长度显示在右上角。通过“setting ends,”现在你只有最初序列中的801 bp的片段。Set Ends选择在全部Lasergene应用程序中都可以使用。

4

寻找开放读框

在这入门的一部分中,我们将确定序列中最大的ORF,并翻译它。

? 从SEARCH MENU找到ORF,点击打

开会出现右边的对话框。 ? 单击Find Next寻找第一个ORF的

位置。

? 继续点击Find Next直到你把ORF的位置选定在位置183-455。ORF的坐标

会出现在EditSeq窗口的顶端附近。

DNA序列翻译

这一节中我们介绍如何翻译我们的ORF,不过任何序列中的读框内部分都可以用下面的方法进行翻译。如果你的选择是在三联码的读框内,三联码指示棒显示为实心黑线(如左图)。如果你的选择是不在三联码的读框内,左边的箭头和右面的箭头显示向左或向右移动一个bp,以使所选序列成为三的倍

数。

? 选定ORF,从GOODIES MENU菜单中选择翻译

(Translate)。

? 翻译的蛋白质序列出现在一个新的未命名窗

口中(如右图)。它是使用标准的遗传密码翻译的。

使用其它遗传密码 根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。在这节中,我们将标准的遗传密码转换成Ciliate Macronuclear密码 。

5

? 从GOODIES MENU菜单选择Genetic Codes打开,子菜单显示如下。

? 单击“Ciliate Macronuclear”就实现了遗传密码的转换,EditSeq现在使

用的就是Ciliate Macronuclear的遗传密码。 ? 同样可以将遗传密码转换为其它类型。

遗传密码的编辑

这一节中我们修改Ciliate Macronuclear的遗传密码。

? 从GOODIES MENU菜单选择Edit Selected Code。这将打开右面的窗口,窗

口显示遗传密码是怎样翻译DNA和RNA序列的。 ? 如以DNA形式展示密码,点击DNA按钮。

? 编辑时,单击任何要编辑的密码,从其目前的位置拖到新氨基酸对应的位置

则可。

? 如使用不同的启始密码子,单击Set Starts按钮。第二的遗传密码窗就会

被打开,可以进行起始密码子选择。 ? 单击任何氨基酸(或者codon位置),该密码子就会变成绿色,而且旁边出

现一个箭头,它就被设定为起始密码子了。如要去除,只需单击它即可。如不保存,则单击取消;如要保存,单击保存为。

序列的反向互补及反向转换

下面的步骤可以用于反向测定的序列的正确输入。 ? 选定序列。

? 从GOODIES MENU菜单,选反向互补序列(Reverse Complement),或者把序

列颠倒过来(Reverse Sequence)命令,则被选定的序列就被翻转互补或翻转过来了。

BLAST检索

下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。注意为了进行BLAST查找必须保证因特网的连接。如果你没有连接因特网,跳过这部分,继续下一部分。

? 选定序,或者从EDIT菜单中选择Select All。 ? 从网络检索菜单(NET SEARCH

6

? ? ?

?

MENU),选择BLAST查找。BLAST对话框就会出现。

程序默认为blastn,数据库默认是nr,参数转换请参照帮助。 单击OK开始查找。

寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。有关“score”和“expectation”的详细的信息在NCBI’s网点——http://www.ncbi.nlm.nih.gov/BLAST.——可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。

BLAST结果窗最上边的3钮被用来打开,或者保存检索到的序列,或者让你了解更多的有关信息。

下面我们从用“Create Document”钮来打开评分最高的5序列开始: ? 单击Create Document。一个小的对

话框出现。

? 在左上角有一个下拉菜单显示默认(default)。单击下拉菜单,选顶端(Top)。

并在右面的文本框中写入5。

? 单击OK,EditSeq自动查对多余序列。如果EditSeq提示至少2序列是同一

个,请点击OK。EditSeq将从因特网数据库下在单一的序列,并分别打开一个单独的EditSeq窗口。

下面我们用“Batch Save”钮将3-10序列保存为EditSeq文件:

? 选定从顶端起第3个序列。单击Batch Save。小的灰色的对话框出现。 ? 单击下拉菜单,选Next。并在右面的文本框中写入8。 ? 点击Set Location,显示文件夹对话框。

? 选定你要保存序列的位置。单击OK回到灰色的对话框。 ? 单击OK保存序列,文件扩展为“.seq”。在下载过程期间,EditSeq自动查

对重复的序列。如果EditSeq提示至少2序列是同一个,请点击OK。 ? 除非你收到错误信息,否则可以认为你的序列已经成功下载。

最后我们可以使用“Launch Browser”钮查看序列的详细信息 ? 选定序列。 ? 选择Launch

Browser。

? 你的网络浏览器将

7

打开右面的窗口。

序列信息查看

现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的信息。 ? 选定序列的一部分。如果你倒是希望全选序列,从EDIT MENU菜单,选择

Select All。

? 从GOODIES MENU菜单,选DNA

Statistics。就会出现右面的窗口,显示序列信息。

序列校读

在我们学习保存和输出序列之前,下熟悉一下EditSeq的校读功能

这功能能帮助你校正测序胶中的错读。 ? 选定序列。

? 单击校对发音图标(序列窗口底部张

开的嘴),或者从SPEECH MENU,选Proof-Read Sequence。

? 电子的音声就会开始朗读所选的序列。(注:如果你听不见任何声音,检查

你的计算机的喇叭是否已经打开。) ? 要改变音声read-back的速度,从SPEECH MENU菜单,选择Faster or Slower。 ? 要停止校读,点击图标(手),或者从SPEECH MENU菜单,选择Proof-Read

Sequence。

序列的保存与输出

首先创建一个用于保存的序列。从文件菜单,选New中的New DNA,或者New Protein。

? 将序列写入出现的窗口。

? 如果你输入非法字符,计算机会发出警告。 然后,我们将序列保存为EditSeq文件: ? 从文件菜单,选Save。 ? 选定保存位置。 ? 给序列命名。 ? 单击保存则可。

以GenBank或GCG格式保存序列: ? 从文件菜单,选Export。 ? 选定保存位置。

? 为sequence(s)选格式。 ? 给sequence(s)命名。 ? 单击保存则可。 以FASTA格式保存序列:

? 从文件菜单,选Export(1个序列),或者Export All As One(多个序列)。

当使用Export All As One的时候,如果DNA和蛋白质文件同时存在,激活窗口的序列类型与你保存的类型是一致的。EditSeq仅仅将写入的序列保存为FASTA格式。

8

? ? ? ? 选定保存位置。 选FASTA格式。

给sequence(s)命名。 单击保存则可。

9

GeneQuest的使用方法 GeneQuest可以帮助你发现和注释DNA序列中的基因,并帮助您操作生物学所关心的DNA的其他feature:包括ORFS、拼接点连接,转录因子结合为点、重复序列、限制性内且酶酶切位点等。通过应用“methods”到序列,序列的feature可以以图形的形式展示出来。你可以在序列上注释任何你发现的feature。和其它的Lasergene应用程序一样,GeneQuest也提供整合的BLAST和Entrez寻找功能。

GeneQuest能直接打开DNASTAR,ABI和GenBank文件。其他格式的序列文件也可以使用EditSeq改为DNASTAR格式。如果你知道Genbank序列的登录号或名称,你可以直接打开序列。另外,你还可以在Entrez数据库进行序列查找和输入。

如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经http://www.dnastar.com.

打开已有分析文件 在这一节中,我们将对已有的GeneQuest文件(也叫做GeneQuest分析)“Nematode R01H10.”进行操作。

? 从文件菜单,选择Open打开一个和右边相似的窗口。 ? 在苹果计算机上,从Show菜单中选择GeneQuestDocument文件。在Windows上,

从文件类型菜单(Files of Type)的中选择GeneQuest Documents。

? 用文件管理系统打开名为“Demo Sequences.”的文件夹。双击Nematode

R01H10,就可以打开下面的窗口。

GeneQuest的DNA分析方法

10

打开GeneQuest文件后,下一步是选择应用方法。应用方法后,结果的图形显示可以帮助你了解序列上感兴趣的features。打开序列后,你会发现只有几种方法应用后的结果展示在窗口内。在下一部分中,我们将学习如何把其它方法用于我们序列的分析。

? Title——给文件取名。

? Ruler——在文件中加入标尺。 ? Sequence——显示文件中的序列。

? Patterns-Matrix——方法的运算参数。

? Patterns-Signal——转录因子结合位点数据库。

? Patterns-Type-In Patterns——使用键盘输入运算所需的Pattern参数。 ? Repeats-Inverted Repeats——寻找反向重复序列。

? Repeats-Dyad Repeats——寻找Dyad重复和palindromes。 ? Repeats-Direct Repeats——寻找正向重复序列。

? Gene Finding - DNA Finder————在打开的DNA序列中寻找指定DNA序列。

分别显示正义连和反义连的寻找结果。

? Gene Finding - Protein Finder——在打开的蛋白质序列中寻找指定DNA序

列的翻译序列。显示结果为全部6个读框。

? Enzymes-Restriction Map——用DNASTAR酶目录中的酶分析打开的序列,并

以图形方式展示。

? Coding Prediction - Borodovsky——用Borodovsky’s Markov方法来识别

潜在的基因编码区,并以图形方式展示。

? Coding Prediction - Starts Stops ORFs——根据指定的ORFs的最小长度,

寻找可能的开放读框,可以选择是否需要起始密码子。读框的启始和中止点分别展示。

? Coding Prediction—Local Compositional Complexity——根据Shannon信

息学原理寻找有基因编码提示信息的区域。

? Base Contents-Base Distribution——序列上4种碱基、A+T和G+C的频率、

分布,以及AT和gc分布区域。

? Bent DNA - Bending Index——DNA折叠预测。 用分析方法操作

调用新的GeneQuest方法的步骤是:从More Methods中选择方法,加入方法帘(method curtain),待方法运行完毕后,选择性的拖取结果放入分析界面(assay surface)即可(见右图)。在本节中,我们使用Bent DNA - Bending Index方法进行分析。 ? 从ANALYSIS

MENU选择Show Available Methods可以打开方法帘,也可以通过拖动分析界面左上角的小环的打开方法帘。方法帘中包括已经用

11

?

?

? ?

于分析的全部方法。

你将注意到方法帘没有Bent DNA - Bending Index method。在方法帘的顶端,点击More Methods打开一个下拉菜单,其中尤可以用于分析的所有方法,点击Bent DNA - Bending Index method,该方法就进入了方法帘。

若查看方法帘中的方法是否已经被应用,点击其右边的三角形。如果图标前有数字表明该方法已经使用,数字表示应用的次数。因为我们还没有应用Bent DNA - Bending Index,所以点击三角形,会发现图标前没有数字。 点击白颜色的位置去除对图标的选择。

单击选定“Bend Region,”,将其拖到分析界面,释放鼠标。序列中可能会折叠的区域就会以小盒子的形式显示出来。

方法参数改变

下面我们改变方法的参数,然后将分析结果与参数改变前的结果进行比较。 ? 重复前面的操作,在方法帘中加入一个新的Bent

DNA - Bending Index,并把它拖如分析界面。现在你应该有2个完全一样的折叠区分析结果。

? 双击方法帘中任何一个结果,将打开一个参数对话框。

? 改变弧长度参数为30,单击OK。分析界面上就会出现根据此参数计算得到的

结果。

(注:如果你再次拖入新的方法时,参数的改变会自动应用到新的方法上)。

结果展示优化

? 组合或移动展示的结果:单击位于GeneQuest窗口左侧的调色板工具中的的

选择器(手图标),在分析界面中可以随意拖动任何展示的结果到任何位置。 ? 改变方法格式:单击目的选择器(手图标),可以选择分析界面上的任何方

法。从OPTIONS MENU菜单选择Line Color,打开彩色选择子菜单。选定颜色后,方法题目和结果显示都将变成那个颜色。另外,你可以用类似的指令进行操作:Line Weight、 Fill Color and Fill Pattern。

? 去除方法:单击选择方法帘中显示的方法,用退位或删除键去除应用的方法

即可。

注意任何你除掉的方法都是能从Methods menu菜单再一次被使用。 注释Features

当你用Genbank输入序列时,序列中标注的Features会自动转换为图形命令显示在方法帘中。这些Features 可以象任何别的方法那样拖到分析界面上显示。 GeneQuest也允许你为你的DNA序列制作新Features:

? 单击位于GeneQuest窗口的左侧的调色板工具(箭图标)。 ? 然后点击选定2641-4257的

Informative Region。

? 点击调色板工具(铅笔图标),

或者从SITES & FEATURES MENU选择New Featur,打开一个

12

Feature Editor对话框(如右图)

? 你打开Feature Editor时,首先进入Location设定。点击“Info region”

进入Title box,点击“Segment A”进入Segment Name box,接着,在对话框的底部选择标题和区段名字的位置。

? 点击Description按钮进入新的Feature Editor窗口。如果你愿意,可以在

note中对Feature做标注,在key种选择Feature的种类。

? 点击Style按钮进入最后的Feature Editor窗口,选择字型,大小和颜色,

以及你喜欢图型用于新建的feature。

? 点击OK关闭Feature Editor窗口。一个图形化展示的“Info region”就会

出现在分析窗口的底部。

下面我们把新建的feature与另外一个feature整合起来。

? 单击调色板工具(箭图标)。选定你刚做好的feature,单击工具调色板工

具上的(链图标)。

? 然后点击名为“R01H10.4——CDS.”的feature,再点击连接(链图标)。 ? 这样你的“Info region”featur将继续作为没有联系的方法而存在,但是,

它的拷贝将作为R01H10.4featur的一部分出现。

BLAST检索

GeneQuest为你的序列在因特网或企业内部互联网数据库上进行相似性检索提供2不同的方法。BLAST Selection指令允许你使用序列的任何一部分进行检索。BLAST ORF需要你首先选择序列的ORF,然后他就可以自动翻译,在蛋白质数据库中进行检索。在这一节中,我们用BLAST在NCBI上检索与Nematode R01H10相似的序列。

注意必须保证您的计算机与因特网相连。否则,跳过这一部分。 ? 单击范围选择器调色板工具(箭图标)。

? 如同在右边被显示的那样,单击任何“R01H10.5”的feature。注意此时选

定的仅仅是外显子部分(exons),内含子部分被自动去除。

? 从网络检索菜单,选BLAST Selection。会出现左面的BLAST对话框。

? 不做参数改变,这样,程序是

blastn,数据库是nr。 ? 单击同意开始查找。

寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示

上面部分选定序列与提交序列(上边序列)比较的具体结果。有关\和\的详细的信息在NCBI's网点

--http://www.ncbi.nlm.nih.gov/BLAST.--可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。BLAST结果窗最上边的4钮被用来打开,

或者保存检索到的序列,或者让你了解更多的有关信息。“Put In Document”按钮相当于Gene Finding - DNA Finder,在打开序列中寻找检索到的序列。(如果我们使用

13

blastp或blastx,则相当于Gene Finding-Protein Finder) ? 在BLAST结果窗口中选择一个检索结果。 ? 单击Put In Document。保存对话窗将打开。 ? 选定保存位置,并命名。单击保存。

? 你选的序列将象应用方法那样以短的垂直的竖线自动出现在分析界面的底

部。垂直的竖线显示BLAST结果的位置。

? 可以选择Zoom in/OUT来放大或缩小视野。直到你能清楚地查看序列。 ? 其他按钮与EditSeq中介绍的功能相同。

Entrez Database检索

GeneQuest允许你在因特网或企业内部互联网的Entez数据库上进行检索。检索到的结果可以输入GeneQuest(或者EditSeq),或者保存为序列文件。在这一节中,我们将检索与狨视觉色素(visual pigment in marmosets)序列有关的序列,然后学习GeneQuest或EditSeq是如何打开其中的一个序列的。

? 从网络检索菜单(NET SEARCH MENU),选择新正文查找(New Text Search)

来打开Entrez Query窗口(如右)。 ? 在文本框中敲入

“visual

pigment.”。 ? 从默认为“All

Fields”的下拉菜单中选择“Text Word.”。

? 用鼠标从右面再拖

入一个检索框(New Term)。

? 在文本框中敲入“Callithrix”,从“New Fields”菜单中选“Organism”。 ? 单击查找。查找结果出现于Entrez Results窗口(如下)。

? 双击任何Entrez Results窗口里的序列,就可以查看其详细信息。

如果你想在GeneQuest或EditSeq里打开其中的一个序列: ? 从Entrez Results窗,单击你想打开的序列。

? 从网络检索菜单,选择用GeneQuest或者EditSeq打开(Open with

GeneQuest/Open with EditSeq)。

? 选定文件保存的位置,并给文件取名。单击同意(视窗),或者保存(苹果

计算机)。

如果你选择以GeneQuest打开文件,GeneQuest将打开文件并且将其默认的方法自动应用到序列上。如果你做选择以EditSeq打开文件,Entrez序列将在主窗口中显示。

14

GeneQuest的其他特点

以RNA折叠形式查看序列的一部分:

? 选定目的序列,在ANALYSIS MENURNA菜单中选择Fold as RNA命令。 序列酶切,模仿agarose凝胶电泳判定大小: ? 打开方法帘(method curtain)。

? 从More Methods中选择Enzymes - Restriction Map 加入方法帘。

? 单击图标左边的蓝色三角形,打开内切酶一览表。注意方法帘仅仅显示那些

最少切割一次DNA序列的酶。刚打开酶一览表时,所有的酶都被选中了,在空白处单击一下去除选定。

? 选定特定的酶,拖入分析界面,即可以看

见该酶的酶切位点在序列上的位置。 ? 从SITES & FEATURES MENU菜单选泽

Agarose Gel Simulation。 ? 新窗口即显示酶切片段在

electrophoretic的分离情况(如图)。

保存分析文件

? 从文件菜单,选保存。

? 选定文件的保存位置。给文件命名。 ? 单击保存。

? 你所应用和展示的所有信息都会被保存。

15

MapDraw的使用方法 根据实验设计,分析和实验结果的展示需要的不同,MapDraw可以制作6种类的酶切图。从简单的线性图到有注释的环形图,在展示限制性酶切位点的同时,还可以同时展示序列的feature,六个读框及其翻译结果。MapDraw也以自动展示从GenBank输入序列的features。

你可以按照位置、酶切频率等来排列你的酶切位点。另外, 你可以用手工选任何酶切位点的结合。酶切位点过泸器(filters)也可以使用Boolean operators联合使用。

MapDraw工具能使你规划酶切位点和克隆实验,产生详细,充分地结果概括。和全部Lasergene应用程序一样,MapDraw也提供整合的BLAST查找功能。

新酶切图制作

我们以组氨酸DNA序列“TETHIS21MA”(苹果计算机)和“tethis21.seq”(视窗)为例。首先我们寻找能够切割组氨酸DNA序列的酶切位点。 ? 从文件菜单选择New打开右边的对话框。 ? 打开“Demo Sequences.”文件夹。 ? 双击打开TETHIS21(见下)。

16

过滤器类型

过泸器(filter)是你定义的可以使用的酶切位点的集合。在你自定义过泸器之前,所有酶切位点都会用于序列分析。你可以用和/或来组合过泸器。 MapDraw内置的过泸器如下:

? Overhang过泸器是根据一套你定义的Overhang准则归类的酶切位点。这些准

则包括3’和5’端突出,与别的酶切位点互补以及兼并的末端突出。克隆试验中,可以使用这个过滤器寻找互补末端。

? 频率(Frequency)过泸器是指根据出现于指定的范围序列上的频率归类的

酶切位点。我们将在本节的下一部分中使用这个过泸器型。

? 种类和复杂性过泸器(Class & Complexity)是根据酶切位点种类归类的酶

切位点。这些种类包括:I型(随机)把II型(明确),或者I型+II型。这过泸器也可以根据位点复杂性、价钱和来源进行归类。

? 手动选择过泸器(Manual Pick)允许你按需要选定酶切位点。在随后的一

部分中,我们学习使用手动选择过泸器的方法。

? Must Cut Here/Don’t Cut Here调色板工具也是一种过滤器,随后进行阐

述。

频率过泸器应用

首先让我们用频率过泸器来删除任何可以两次切割我们序列的酶。 ? 从ENZYME MENU,选New Filter,然后Frequency打开参数对话框。

? 在Min和Max对应的框中输入数字1和2,其他的参数不变。这个设定将我们序

列中切割多于两次的位点自动删除。

? 在过泸器名字框中,输入“Two-cuts-max.”。

? 单击Apply将过泸器用于序列分析——然后OK退出参数对话框。你将注意到

在图上酶切位点的数目现在大大地减少了。

应用手动过泸器

虽然减少了大约3分之2的位点,但是还有100以上的酶存在。我们还可以设定一些更严紧的命令进行限制。看一看我们的酶是否能整齐地用来切割TETHIS21序列的编码区。

? 从MAP MENU选Linear Minimapp。打开的窗口显示每个限制酶切割位点的位

置。

? 滚动窗口,直到你看到大的向右的箭头,上写“histone”。“Histone”是

在最初的Genbank入口被注释的序列特点。当我们打开它的时候,这个特点和序列一起输入。 ? 单击选定它。 ? 在屏幕的左上

单击种类调色板工具(Sort),接着选择Sort by Cuts Close to Selection。酶切位点即刻分类,这样,距

17

特点最近而且超出选定范围的酶切位点将会排在最上面。

? 滚动到窗口的最顶端。你将注意到,在histone基因的左和右有2酶切位点:

Acs I和Apo I。两个酶切位点对我们来说都是理想的。

现在我们将制作仅仅包括Apo I酶切位点的Manual Pick filter。

? 从ENZYME MENU,选New Filter——然后Manual

Pick。打开酶切位点过泸器编辑器。

? 把Apo I从右边的窗口拖进左边的窗口。给过泸

器取名。在这我们把过泸器叫做“Apo I.”。 ? 点击Apply——然后OK,就保存并应用“Apo I.”

过泸器了。

? 注意到现在线性的minimap仅仅由Apo I酶切位点

和histone特点构成。

使用过泸器一览表

现在我们已经应用了2个过泸器:一个叫做“Two-cuts-max”的频率过泸器和叫做“Apo I.”的手动过滤器,MapDraw会自动把两个过泸器的结果用“AND,”联合起来应用,这样,展示的结果需要满足两个标准:切割一或两次,用Apo I切割。我们手动过滤器包括频率过泸器的单一切点的内容,所以他自动的覆盖了频率过泸器的结果。下述过泸器一览表允许我们随意编辑、组合各个过泸器。

? 从Map Document,单击过泸

器调色板工具(在窗左上的漏斗图标)打开过泸器一览表(如下)。当前应用的所有过泸器都出现于窗口的左边。

? 为了除掉Apo I过滤器,点

击选中它,从左窗口拖到右

边的窗口,单击应用即可。现在由于只有Two-cuts-max过泸器被应用,所以序列上的酶切位点数目立即增加了。

? 把Apo I过滤器拖回,放在And旁,单击Apply再次应用Apo I过滤器,序列上

的酶切位点数目又立即减少了。(如果把Apo I过滤器拖回,放在Or旁,单击Apply再次应用Apo I过滤器,序列上的酶切位点数目不会改变,因为Apo I过滤器是Two-cuts-max过泸器的一部分)。 ? 按上面的方法把两个过滤器都去除。

使用Must Cut Here / Don’t Cut Here调色板工具

Must Cut Here / Don’t Cut Here工具是另一种酶切位点过滤限制方法。我们将用这个方法再次重复上面的操作。 ? 从MAP MENU,选Site & Sequence。

? 向下滚动,直到你看在大的向右指的箭头,上写“histone”。

单击选中。点击Don’t Cut Here调色板工具(红色园圈起的剪刀样图标),去除所有切割选定区的酶切位点。(点击Must Cut Here工具——剪刀样图标——序列上将展示所有切割选定区的酶切位点。) 这样,仅仅剩下那些不切割选定区的位点。

18

显示酶信息

内切酶编辑器(Enzyme Editor)使你能够查看内切酶的各种相关信息,包括其名字,识别序列,isoschisomers,种类,价格,销售公司和有效性等详细的信息。你对这些信息可以进行添加或删除操作。

? 打开酶编辑窗(如左),双击任意一个酶的

名字。

? 箭头显示酶识别序列和切割位点。

? 你可以按照“GeneQuest”上的方法在序列

上添加新Feature,并作注释。

环形展示

你可以以环形图展示环形或线性序列,但是,如果序列是线性的,MapDraw会提示你。如果你

想在环形序列上进行酶切位点限制,那末,我们前面提到的Don’t Cut Here filter完全可以做到这一点。

? 通过点击过滤器调色板工具检查当前是否只有Don’t Cut Here过泸器应用。

如果已经应用,则Don’t Cut Here过泸器应该在过泸器一览表的左边的窗

口里,而其他的过滤器在右边。如果这不是这样,请进行调整。

? 从MAP MENU,选择Circular

Illustration,打开左边的窗口。(如果此时有太多的酶切位点,你可以加入其他的过泸器)。

? 通过OPTIONS MENU的Drawing

Size调整图画的大小。2条红线相会的角是你可以做的最小图画的范围。在窗口内点击任何位置,图形大小将显示为那末大。

? 单击同意。

ORF图

? 从MAP MENU,选ORF Map打开右边显示的六读框的开放读框窗口。默认的终

止和开始

codons可以使用指定的遗传密码。方法见EditSeq。 ? 从OPTIONS

MENU中选择ORF Criteria可以设定参数。你能

19

调整最小的ORF长度,定义上游启动子和距上游启动子的距离,选定后单击同意即可。

? 放大ORF以查看翻译的序列。方法是点击调色板工具中Zoom In

(有+的图标),接着,单击分析界面。重复这些2步直到你能看翻译。

显示选择

MapDraw’s OPTIONS MENU提供各种指令允许你做下面的事情: ? 选择1个或3个字母的编码。

? 显示不同的读框组合(Reading Frames 或 Line Layout)。

? 编辑用于翻译的遗传密码(Genetic Codes and Edit Selected Code)。酶

显示可以选择垂直或者水平展示。

? 线性化环形序列(Linearize Sequence)。 ? 显示不确定位点。

保存退出

? 从编辑菜单(EDIT MENU),选保存地图(Save Map)。 ? 选择保存位置,命名。

? 单击保存(苹果计算机)或同意(视窗)。

? 从文件菜单(FILE MEN),选择放弃(苹果计算机)或者退出(视窗),电

脑提示保存或放弃;选择保存,则你操作的所有结果都会保存起来,否则结果会全部丢失。

20

MegAlign的使用方法 MegAlign提供6列队(aligment)方法,进行DNA和蛋白质序列的配对和多序列比较(multiple aligment)。多序列比较(multiple aligment)可以在MegAlign 的worktable进行查看和编辑。可以根据队列(aligment)的结果制作进化树(Phylogenetic trees),并且,有关序列距离的数据和残基替代可以容易地作成表格。一般多序列比较(multiple aligment)的结果展示于队列(aligment)窗口,相似性和差异用彩色的直方图展示。和全部Lasergene的应用程序一样,MegAlign也提供整合的BLAST查找功能。

创建队列文件

MegAlign提供两种基本的队列方法:配对比较和多序列比较。配对比较可以比较任何2个选定的序列的相似性,而多序列比较对在Worktable中所有序列进行比较。在我们入门的第一个部分中,我们将介绍使用2不同的种类的配对比较方法。我们将从创建一个MegAlign文件,输入两个histone序列开始。 ? 从文件菜单,选Enter

Sequences打开Enter Sequences对话框。 ? 从你DNASTAR文件夹中的“Demo

MegAlign,”文件夹,双击打开“Histone Sequences.”文件夹,左上两个序列是我们选用的序列。

? 单击TETHIS21,点击Add钮。单击TETHIS22,点击Add钮。现在2序列将出现

于右面的窗口。

? 单击Done把序列输入Worktable。

? 从OPTIONS MENU,使用Size 命令增加Worktable的字形大小直到可以看清楚。

序列设置

21

下面我们练习subranging输入的histone序列。设置序列的末端在我们这个例子中并不重要,但是当两个序列匹的全序列匹配不太好,或是蛋白质和DNA的混合序列时就变得非常重要了。后者要求每个DNA序列都必须是给出正确的翻译读框。序列设置可以通过给定末端位置手动操作设置,也可以通过特定标注的feature进行。这里,我们将使用histone H2B-1的CDS进行操作。 ? 点击选中(TETHIS21)。 ? 从OPTIONS MENU,选Set

Sequence Limits,接着,从Feature Table打开右面的序列末端设置窗口。

? 顶端的histone H2B-1-- CDS

feature已经选定。下面显示的是选定序列的特点名字和范围。

? 单击Change the Rest用相同

的feature设置第二histone序列。你将自动回到Worktable,这时,设置后的序列就出现了。

配对比较(Pairwise Alignment)

MegAlign提供各种配对比较方法。我们序列是DNA,我们可以用的方法是

Wilbur-Lipman,Martinez-Needleman-Wunsch和Dotplot。在这入门中,我们在使用Wilbur-Lipman的方法。 ? 同时选中两个序列。 ? 从ALIGN MENU中的One

Pair选择Wilbur-Lipman方法。

? 使用默认参数进行比较,

点击OK。

? MegAlign计算队列,然后在另一个窗口显示比较结果。

窗标题展示相似指数(所右匹配残基的百分比),缺口数目,全的缺口长度和一致序列长度。我们可以改变标志颜色来区别匹配和不匹配的序列。

? 单击队列调色板工具(有“x”方框图标),打开下面的队列颜色编辑读化

框。

? 单击深蓝色的方框,接着点击Match Color右面的黑色

方框,他就变蓝了。所有和一直序列一样的碱基都立即变成深蓝色。如此重复可以改变不匹配的序列的颜色。 ? 另外,还可以通过选定或不选彩色选择方框下面的方框

查看队列窗口中队列的变化。如你单击Vertical Bars,则匹配序列间的碱基变成了垂直的棒。 使用点划分方法(Dot Plot Method)

点划分方法是先把要比较的序列叠加起来,然后计算匹配不当的数目。

22

? 同时选定两个序列。

? 从ALIGN MENU中的One Pairl里选择Dot Plot打开右面的窗口。

? 单击OK用默认的参数进行比较。MegAlign计算结果会在另一个窗口显示出

来。

每个匹配都与特定的一组残基有特定的相似性(两个都设计在参数对话框中),Dot Plot窗口中展示为蓝色。从左侧末端开始的红色斜线,表示两个序列比较的位置。

? 双击任意一条蓝色的线会打开左面的窗口,其中显示所选定的序列的比较结

果。

多序列比较

为了在MegAlign中进行多序列比较,我们选择一个含有十四个相关的钙调蛋白序列的文件进行操作。使用这个大的数据库我们可以制作进化树,了解MegAlign的其他特性。 首先,我们要创建一个包括14

calmodulin序列的新文件:

? 从文件菜单,选Open打开DNASTAR文件夹的“Demo MegAlign”的文件夹。 ? 双击打开“Calmodulin Alignment”。

? 从OPTIONS MENU,使用Size命令增加字体大小到看得清楚为止。 现在我们需要选MegAlign’s的两个多序列比较方法中的一个进行操作:Clustal或者Jotun Hein。如果已知序列有一定的同源性,我们推荐使用Jotun Hein,并且,如果有关序列相关性的背景未知,可以选择Clustal。我们使用的序列已知全部是calmodulins,所以,我们使用Jotun Hein方法。

在我们实行队列之前,我们应该选择一个权重表。MegAlign’s残基权重表用于对多序列比较进行评分,这样那些虽然残基不匹配,但残基化学性质相似的序列的评分要比化学性质不相似的序列的评分要高。我们的序列是蛋白质,并且我们将使用Jotun Hein方法,所以“Structural”表是最好的选择。

? 从ALIGN MENU选择Set Residue Weight

Table打开左面的窗口。

? 从上面的下拉菜单选择Structural。单击同意。 现在我们可以比较我们的calmodulin序列了。 ? 从ALIGN MENU选择Jotun Hein Method。 ? 队列进程窗显示比较完成的百分比。

? 当队列完毕,Worktable会显示队列的结果。

? 通过VIEW MENU中的Sequence Distanc

查看序列的差别和相似性(如左)。 ? 通过VIEW MENU中的Residue

Substitutions查看残基的替代数目(如右)。

23

? 为了继续,关上Residue Substitutions and Sequence Distances窗口。

Phylogenetic Tree查看

? 通过VIEW MENU中的Phylogenetic

Tree打开下面的窗口。默认为Balanced Branches调色板(从顶端第3)。在phenogram中,距离长度近似。

? 为了用cladogram查看结果,单击Unbalanced Branches调色板工具(从顶端

第4)。在cladogram中,枝长度(branch length)是与祖先的节差异的评估。

? 为了继续这入门,关上Phylogenetic Tree窗口。

查看队列报告

队列报告以序列显示比较的结果。 ? 通过VIEW MENU中的队列报告命

令(Alignment Report)打开报告窗口。

? MegAlign允许你改变队列报告

的外观。从OPTIONS MENU中选择Alignment Report Contents打开右面的窗口,选定第3-7和第9个方框,其它不变。 ? 单击同意,更新报告。

创建Decorations和Consensi

另外,我们可以通过加入“decorations”和“consensi.”来优化展示的效果。Decorations包括加框、加阴影和隐藏。在这节中,我们将给那些与一致序列不一致的氨基酸加阴影。

? 从OPTIONS MENU选择New Decoration来打开在左边显示的对话框。

? 在题目框中,输入类似

“Shade disagreements with consensus.”的名字。 ? 下一个排包括3下拉的菜

单。选择第一个下拉菜单中

的“Shade“,中间菜单的“residues differing from”。第3个菜单不变,默认为Consensus。选择第一个下拉菜单中的“Shade“后,会激活其下面的另外两个下拉式菜单。

? 从上边的菜单选择颜色,从下面的菜单选择阴影的样式。

24

? 距离单位框不变,为“0.”。

? 单击同意,现在队列报告中所有与一致序列不一样的残基全都被加上了阴影

(如下)。

Consensi是一致序列的另外一种图形展示方法,可以用来标志ambiguous残基。另外,序列中一致和不一致的残疾可以用直方图在队列报告中展示。当在某个位

置上,任何一个序列的残基与其他序列不一样时,一致序列就会以星号表示。并且用直方图的长短显示其中一致残基的多少。 ? 从OPTIONS MENU,选择New Consensus

打开右边的对话框。

? 在题目框中,输入诸如“All

sequences matching potato.”的名字。

? 下面有4个下拉菜单。在第一个菜单

选择Potato Calmodulin。其他的菜单不变:When all match; the

template residue 和 show the template residue。

? 在右边框“otherwise show,”

中输入星号(*)。 ? 选定“Strength.”框。 ? 单击同意,就把新的一致性设

定应用于打开的队列报告了。 ? 最终的报告如左图显示。彩色

直方图可以显示新的一致序列

的强度。

保存MegAlign文件

? 从文件菜单,选保存。 ? 确定文件夹的保存位置。

? 在文件名框(视窗)或名字框(苹果计算机)中给序列命名。 ? 单击保存(苹果计算机)或同意(视窗)。 ? 对队列和队列报告的变化都被保存了。

25

PrimerSelect的使用方法 PrimerSelect能够帮助你设计PCR,测序和交杂实验所使用的引物和探针。输入你的DNA,RNA或反向翻译的蛋白质模板序列后,PrimerSelect就可以在pentamer窗口计算序列的融解温度,自由能和末端自由能。您可以通过控制包括引物浓度、盐分和.G计算温度等参数来限定计算结果。

在模板处理后,PrimerSelect按照用户定义的参数确定引物的位置,并给引物评分,然后筛选出模板序列上的最佳引物序列。引物“workbenches”允许你修改你的引物,检查参数编辑对翻译读框,二级结构,错误的引物位置和限制性酶切位点的影响。如果你选择并优化了你的引物,PrimerSelect可以让你建立有关模板,引物,扩增的文件。和全部Lasergene的应用程序一样,PrimerSelect也提供整合的BLAST查找功能。

创建PrimerSelect文件 我们将以克隆载体pBR322为模板DNA序列。在这一节中,我们选择引物,用来扩增位于2013-2169位的H-strand Y effector。首先我们从打开模板序列开始。

? 从文件菜单选择New创建

一个PrimerSelect文件。 ? 从文件菜单,选择输入序

列(Enter Sequence)。打开下面的对话框。 ? 从“Demo Sequences”选中pbr322.seq(视窗口)的文件,或者PBR322(苹

果计算机),单击Add添加序列到右面的窗口。然后点击Done打开序列。

26

定义引物特点和位置

下面我们开始确定引物的类型。

? 从条件菜单(CONDITIONS MENU),选择Primer Characteristics打开左面

的对话框。这对话框可以用来设定各种参数诸如:引物长度、最大的3’

pentamer稳定性和可接受的重叠。注意默认的引物长度为17-24 bp,并且1或2 bp的二聚体和发卡样重叠示可以接受的。

? 不改变默认设定和单击Cancel退

出。

? 从条件菜单,选择Primer

Locations打开右边对话框。这个对话框允许我们根据给的序列的长度来限制引物的位置。

? 从下拉菜单的Restrict

Locations中选择Upper and Lower

Primer Ranges。当在全序列中设计编码区的PCR引物时,这是最好的选择。

? 在Upper Primer Locations右面的

方框中输入1700和1950。在Lower Primer Locations右面的方框中输入2250和2500。

? 单击同意,会出现左面的窗口。成

对的绿色和红色的三角形分别标记所设定的正向和反向引物的范

27

围。

寻找引物对

现在我们已经指定什么种类的引物对是可接受的,剩下的工作就是让PrimerSelect为我们寻找理想的引物对。 ? 从LOCATE MENU选择PCR Primer Pairs。打开一个二分窗口,

上面窗口中显示计算机寻找到的28对理想引物对,引物对按照评分值依次排列。因为调色板工具中的Alternate Pairs被默认激活 (在窗口左面工具中),所以底部窗口显示的

是上面窗口选定的引物对的替代引物对一览表。

? 通过拖动在窗口的右侧上的小环拉开建议窗口,可以查看PrimerSelect对

选定引物的建议。

注意现在的“Best choice.”是PrimerSelect根据在最初的条件中设定的参数计算得到的。看下面的窗口,PrimerSelect列出了“Best choice”引物对的25替代选择。这些替代的引物对扩增的区域和上面选定的引物一样,所不同的是他们的序列有些不一样。

? 选择调色板工具中的Alternate Products(左侧工具底部),下面窗口显示

引物的位置和可能错配的位置,以及相应的产物长度。左面的那个单一的粗黑棒提示用我们“Best choice”引物进行反应,会有大量产物被扩增出来。如果没有多个5’或者3’引物箭头也提示这一对引物没有错配点。 ? 单击上面窗口里引物对,观察下

面窗口里的产品棒变得越来越细表示预期的扩增物也越来越少。

注意有8个引物对有错误的配对点,用粉红色或淡绿色箭头指示出来。第

28

13对和第22对正向引物有错配点(右边显示),就会用第二条产品棒的表示错误的产品大小。

查看引物的其他信息

PrimerSelect能预测引物形成self-dimers, pair-dimers and hairpins的可能性。

? 单击选定“Best choice”引物。 ? 从报告菜单(REPORT MENU),选Amplification Summary,打开左面的窗口。

显示用所选个引物做PCR扩增反应的报告。 ? 选择Composition Summary,打开

左面的窗口,描述扩增区和引物对的碱基组成。

? 从报告菜单,选择Self Dimers,

Pair Dimers和/或Hairpins打开新窗口显示每种二级结构的预测结果。Self-Dimer形成窗口如右。

按照引物特点分类

PrimerSelect在自动将引物按照从好到坏的顺序分类以前,已经计算了引物的各个特点。Located Primers & Probes窗口是我们能够根据引物的不同特点,如引物位置、长度、溶解点或自由能等,来对引物进行分类。这里让我们用溶解

点来分类引物。

? 从报告菜单,选择Located Primers & Probes打开左面的窗口。窗口显示

符合我们标准的引物的一览表。在没有特别指定的情况下,引物按照位置排列。

? 从LOCATE MENU选择Sort Primers打开下边对话框。

? 保留对正向和反向引物的选定,去除对By Position的选定。选定By Tm

Nearest方框,输入65。

? 单击同意,现在两个窗口里的引物按照

融解温度离65oC最近的程度依次排列。

改变引物长度

PrimerSelect’s工作台允许你在引物中引入限制性酶切位点,突变,改变使用的密码子,核查引物二级结构,查找错配点。在这

29

一节中,我们将用正向引物工作台来扩展我们的引物长度。 ? 双击选定正向“Best choice”引物。

? 从编辑菜单,选择Work on Upper Primer打开下面的窗口。

? 确认Dimer,Hairpin和Priming Sites调色板工具(窗口左侧从顶端起的

4-6)已经激活。

让我们仔细查看一下工作台。在窗口下边的第3排可以看见引物序列。序列两端的三角形“handles”允许你缩短或者延长序列。在窗口的左上角的标题告诉我们引物的长度是23核苷酸,溶解温度为65.5度;而底部窗口的绿色棒显示引物在序列上的大概位置。下面的信息告诉我们没有大于2 bp的二聚体形成,并且引物只能形成一个并不理想的发卡样结构。拖动窗口左边的滚动条之间的黑框调整上下窗口的比例。

? 拖动引物左上黑三角形直到长度延伸到33核苷酸。

现在引物的长度已经显示在窗口的标题中。引物的溶解温度也增加到78.6度,将难以进行PCR。看下面的窗口有二聚体和发卡形成,并标记(坏!)。由于长引物容易形成稳定的二聚体和发卡样结构,所以我们设计的引物经常较短。 ? 再一次拖三角直到引物最初的23核苷酸。窗口又和我们开始打开它的时候

一样了。

引物中引入突变

PrimerSelect工作台可以很容易的在引物中引入突变。我们“Best choice”的正向引物序列只编码一个苯丙氨酸。在这一节中,我们把读框1的苯丙氨酸通过改变读框中的密码子转换成苏氨酸。转换完成后我们将可以观察到我们变化的效果。

? 点击引物下面,读框1中绿色的苯丙氨酸,会

出现一个小盒子(如右)。盒子中显示全部4种可能的苯丙氨酸密码子和词“Other.”标记的GCC是这个苯丙氨酸残基的密码子。

? 选择Other会自动跳出一个子菜单,其中显示

所有的氨基酸及其代号,在“T-Threonine.”上点击一下,模板序列上的碱基组成没有改变,但是引物序列和其编码的氨基酸(Thr-Ala)发生了改变。

Thr显示为红色,表明它是从最初的引物序列上突变得到的。查看屏幕底部的左角,可以看到引物形成了一个稳定的二聚体。我们可以通过给我们的Thr残基做沉寂突变来删除这个不受欢迎的二聚体。我们试着把苏氨酸的密码子改变为ACC。这个密码子与苯丙氨酸密码子(GCC)只有一个核苷酸不同。

? 单击红的Thr残基,从菜单中选ACC代替现在的ACT。 下面的窗口显示从G到A的单一的核苷酸变化去除了二聚体。另外,正向引物的融解点已经从65.5减少了到53.7。也许正向引物新的溶解温度可以与反向引物匹配,但是我们可以找到与之更相匹配的反向引物。 ? 在工作台的右上的白色文框输入突变引物的名字。

30

间。

? 为了继续一节,关上SDS PAGE Gel Simulation窗口。

Features注释(与GeneQuest中讲解的相似,这里从略)

进行BLAST检索

Protean允许你通过因特网或企业内部互联网进行序列数据库检索。

在这一节中,我们将在NCBI的BLAST服务器上检索与人的钙调蛋白序列相似的序列。注意电脑必须与因特网相连接,否则,跳过这一的部分,继续下一部分。 ? 单击调色板工具中的范围选择器(箭图标),在序列上选择你想进行检索的

部分。由于我们的序列比较短,所以我们选择全序列进行比较。 ? 从EDIT MENU选择Select All。

? 从网络检索菜单,选择BLAST

查找。BLAST对话框出现(如左),默认的数据库是nr。 ? 单击同意开始查找。

BLAST结果显示为一个二分窗口(如下,结构、内容与相关操作参见

GeneQuest的BLAST结果)。

现在我们选择三个BLAST序列,在Protean中打开他们。 ? 在BLAST结果窗中选择一个结果。

? 单击Create Document,保存对话

框窗打开(如左)。从保存的下拉菜单选择Next(默认为Selected)。 ? 在“Sequences.”的左边文本框输

入数字“3”。

? 单击同意,打开三个新的选定序列

的Protean的分析文件。 现在关上BLAST结果窗。

二级结构模拟

36

Protean能够展示诸如螺旋轮,螺旋网和beta片层等基本元件的二级结构。另外, 它能以线性的space-fill样模型或者化学公式样模型展示蛋白质序列。在这一节中,我们做一个阿尔法区域的螺旋轮二级结构。二级结构Garnier-Robson方法已经应用于我们序列,阿尔法螺旋也已展示出来。选定其中的一个阿尔法区域后,我们就能以螺旋轮展示其二级结构。

? 单击调色板工具中的范围选择器(箭图标)。

? 点击Protean文件最上边的Garnier-Robson分析结果中的一个阿尔法区域。 ? 从分析菜单,选择Model Structures中的Helical Wheel,就会出现左边的

二级结构预测图。

为继续这一节,关上螺旋轮窗口。 展示滴定曲线

下面,我们将查看全蛋白质序列的滴定曲线。

? 单击Protean’s调色板工具右

边的白色空间。这使得选择回到起始位置,如果没有选中的序列,在绘制滴定曲线时,Protean就会默认是对全序列进行计算。 ? 从分析菜单,选择Titration Curve。

? 打开序列的滴定曲线窗口(如上)。Protean会在等电点处加一个蓝色的

“crosshairs”,以显示pH和所带电荷。

保存分析的文件(略)。

37

SeqMan II的使用方法 SeqMan II不仅仅能够将成千上万个序列装配成contigs,而且在装配前,可以修整质量差的序列以及从你的序列中清除污染数据,还提供完善的编辑和输出功能。SeqMan II可以使用DNASTAR独特的跟踪(trace)品质评价策略,通过对自动测序仪产生的跟踪数据进行评价,自动生成最精确的一致序列。

装配过程从序列输入开始,输入的序列可以是自动测序仪输出的、也可以是文本格式或DNASTAR序列格式。另外, 你可以从因特网的Entrez或BLAST服务器输入序列。使用Preassembly options中的命令可以进行包括修整质量差的数据,除掉特定的载体或污染序列等操作。你甚至可以在装配过程中选择最后加入重复序列。

Contigs装配完毕后,Strategy View可以用图形化的方式展示contig的范围和质量,并提示你什么地方需要补充序列。在需要的情况下,你可以加入更多的序列,或其他的SeqMan II文件对现有的结果进行再装配。Alignment View 允许你编辑,修整连续的一致序列,找回以前修整过的数据,调整队列(alignments)结果。另外, 你可以查看每一个或所有序列的质量评分。SeqMan II为你提供自动或手动工具,帮助你选择是否加入多个contigs。和其他Lasergene应用程序一样,SeqMan II也提供整合的BLAST查找功能。

输入序列片段

我们将从打开“Demo Seqman”文件夹中的14样品序列开始。每个序列都是自动测序仪(PE Applied Biosystems, Inc.)输出的文件格式(*.trace)。 ? 从文件菜单,选择New打开Unassembled Sequences窗口和一个空的未命名

Project Summary窗口。Project Summary窗口在你装配序列之前始终是空的。

? 从Sequences菜单选择Add打开

Enter Sequences对话框(如右)。 ? 打开“Demo Seqman.”文件夹会出

现14个序列。这些就是我们将要装配的序列。

? 把片段序列通过把Add All按钮移到右边的窗口。现在14序列名字应该出

现于右边的窗口中。单击Done按钮。

? Unassembled Sequences窗口现在会出现这14个序列。

38

? 通过拖拽其窗口右下角展开窗口,直到你能同时看全部样品名字。 Pre-Assembly Options操作 在装配前面,你可以考虑进行两三个装配前的选择。你可以从你的片段中除掉载体和污染序列,优装配顺序,设定片段末端和标记重复序列。在这一节中,我们将从样品中自动除掉Janus载体序列并修整序列末端。 ? 选定全部14个序列。

? 在窗口右上的下拉菜单中选择“Janus”

作为SeqMan I要寻找的载体。

? 点击窗口上边的Trim Ends按钮打开右

边的对话框。你将注意到在没有特别指定的情况下,SeqMan II将用适中的严谨度进行末端修整。不改变设定退出对话框。

? 单击窗口右上的Options按钮。打开下

面的对话框,显示全部装配前的选择一览表。默认设定显示扫描载体,实行序列末端修整,使用最适当的序列装配顺

序。

? 单击Scan All。报告窗口将出现,

但是现在可以放到一旁。在扫描后,你将注意到Unassembled Sequences窗口的2中心专栏发生了变化。现在载体栏显示:载体名字前都有一个检测通过的标志,说明Janus载体在全部14序列中都已经检测到了。limits栏展示新的序列末端,说明载体序列已经去除,末端修整已经完成。

查看修整的数据

现在我们可以查看在扫描完成的末端修整和载体序列去除的细节报告。 ? 从PROJECT MENU,选Trim Report

打开左边的窗口,窗口中显示:末端修整的参数、每个序列的名字,平均质量,被修整的数量以

及修整前和修整的序列长度。 ? 在你查看完报告之后,关上它。

要查看SeqMan的修整结果,让我们查看休整后序列的跟踪数据。

? 从Unassembled Sequences窗口,双击打开8号样本,打开右面的

chromatogram窗口。 从5’末端起变淡的部分将不会用于序列装配。注意大部分

39

序列修整部分优化后的质量。之所以从这里去除,是因为这些变淡的序列是Janus载体序列。

垂直的黑的棒出现于修整和未修整的序列之间。你可以根据需要拖动黑棒调整用于装配的序列末端。

下面,让我们查看一下序列的5’末端: ? 单击一致序列的任何地方。

? 从编辑菜单,选择Go To Position。 ? 在位置文本框输入“500”。 ? 单击同意。

注意到最好的质量落到这区域上,SeqMan II认为507位以外的序列质量低于中等水平。

? 检查完跟踪数据后,关上那个窗口。

序列装配

现在我们准备调用序列装配程序。

? 单击Unassembled Sequences窗口左上的装配按钮。

Unassembled Sequences窗口立即消失,报告窗口显示装配的进度。装配完整之

后,出现左边的窗口,窗口上边为装配好的一致序列,窗口下边为所有连续的序列。在我们例子中,SeqMan II将14个序列装配成为单一的contig。

查看覆盖面和构建结果

现在我们已经将所有的片段装配成一个序列,下面我们用Strategy View查看一下其中的矛盾碱基的数量和序列的覆盖程度。这个窗口图形化的显示了

每个片段在contig中位置和方向。

? 单击Project window中

的contig。

? 从CONTIG菜单,选择

Strategy View打开右边的窗口。注意标尺下面的那条带,显示学的覆盖程度。

条带的颜色和厚度代表覆盖序列的数量。你会看到在大致200-900之间有绿色的较

厚条带。这表示两条链都被测序,且高于最小覆盖面临界值的区域。(覆盖面临界值可以通过PROJECT MENU-Parameters-Strategy Viewing来改变)。中间的蓝线表示只有一条链被测序的区域。。出现于contig两边的细红线表示这个区域只测过一次序。

? 选定窗口左上的Conflicts box可以查看片段序列间的一致程度方型图。方

40

本文来源:https://www.bwwdw.com/article/42s3.html

Top