生物信息学作业实验5-3

更新时间:2023-10-12 13:53:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

广州大学学生实验报告

开课学院及实验室:生命科学学院 计机楼407 2013年 11 月 29 日

学 院 生命科学学院 年级、专业、班 生物工程 姓名 学号 成绩 指 导 教 师 10142000 实验课程名称 实验项目名称 生物信息学 实验5-3 多重序列比对及系统发生树的构建 一、实验目的 1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识; 2、掌握使用Clustalx进行序列多重比对的操作方法; 3、掌握使用Phylip软件构建系统发生树的操作方法。 二、实验内容 1、采用以上例子给出的DNA序列进行系统发育树的构建结果。(包括序列比对结果及最终生成的树) 2、以下给出的是蛋白质序列,使用以上方法构建系统发育树。(包括序列比对结果及最终生成的树) >RAT MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNNPKGMIPLKGSTLTSPCQDFGKRMFVLK 1

ITTTKQQDHFFQAAYLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI >HUMAN

MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI >CANFA

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI >MOUSE

MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVLK ITTTKQQDHFFQAAFLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGI >Canis

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK ITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGI >Gallus gallus

MEREPMRIREGYLVKKGSMFNTWKPMWVVLLEDGIEFYKRKSDNSPKGMIPLKGSTINSPCQDFGKRMFV FKLTAAKQQDHFFQASYLEERDAWVRDIKKAIQCIDGGQRFARKSTRKSIRLPETINLSALYLSMKDPEK >Danio rerio

MEPTTIREGYLVKKGTVLNSWKAVWVVLKDDAIEFFKKKTDRNAKGMIPLKGATLTSPCQDFSKRALVFK VSTAKNQDHYFQATHLEEREHWVKDIRRAITCLQGGKKFARKSTRRSIRLPESVNLSELYVCMKDPDRGV >chimpanzee

MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFK ITTTKQQDHFFQAAFLEERDAWVRDMKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI

3、以上构建系统进化树的方法为N-J法,请总结采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。

2

三、实验步骤

1、DNA序列进行系统发育树的构建结果

图中的8和50分别表示8个序列和每个序列有50个碱基。

2、用PHYLIP软件推导进化树

1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。

3

图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。这样,一个序列就可以变成了许多序列。一个多序列组也就可以变成许多个多序列组。根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。Jackknife则是另外一种随机选取序列的方法。它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。R选项让使用者输入replicate的数目。所谓replicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的replicate,此处选200,输入Y确认参数并在Random number seed (must be odd) ?的下面输入一个奇数(比如3)。当我们设置好条件后按回车,程序开始运行,并在EXE文件夹中产生一个文件outfile,Outfile用记事本打开如下:

4

这个文件包括了200个replicate。

2、文件outfile改为infile。点击DNADIST程序。选项M是输入刚才设置的replicate的数目,输入D选择data sets,输入200。

5

二、用PHYLIP软件推导进化树。

1、 进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。 依次输入r 200 y 3

2、文件outfile改为infile。点击protdist程序。选项M是输入刚才设置的replicate的数目,输入D选择data sets,输入200。11

设置好条件后,输入Y确认参数。程序开始运行,并在EXE文件夹中产生outfile

3将outfile文件名改为infile,为避免与原先infile文件重复,将 原先文件名改为infile1。EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。输入M更改参数。输入200。输入奇数种子3。

输Y确认参数。程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。outtree文件是一个树文件,可以用treeview等软件打开。outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。部分内容如下:

12

4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。点击CONSENSE程序。输入Y确认设置。EXE文件夹中新生成outfile和outtree。Outfile文件用记事本打开,内容如下:

5、将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。点击DRAWTREE程序,输入font1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。

13

6、点击DRAWGRAM程序,输入font1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。14

15

3,采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。

DNA采用的是这个exe

而蛋白质的构建采用的是这一个

____________________________________________________________________________________________________________________________________

16

3,采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。

DNA采用的是这个exe

而蛋白质的构建采用的是这一个

____________________________________________________________________________________________________________________________________

16

本文来源:https://www.bwwdw.com/article/ijqf.html

Top