mapmaker_3应用及辅助软件使用

更新时间:2023-06-03 07:11:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

mapmaker_3应用及辅助软件使用

第23卷第3期

1999年5月南 京 林 业 大 学 学 报

JournalofNanjingForestryUniversityVol.23No.3May1999

遗传作图软件应用及辅助软件的研制    何祯祥 林国忠 Ξ

    (210037)

摘 要   MAPMAKER3.0(forPC)的功能、。介绍了作者开发的MAPMAKER要求的分析数据文件,以及对标记的MDAC。提出了进一步开发中文版新一代遗传作图软件、建立基因组图谱数据库和基于因特网(Internet)的基因组信息检索等设想。

关键词 遗传连锁图谱;软件;应用与开发

中图分类号 S722

TheApplicationofMAPMAKER3.0(forPC)andtheDevelopment

ofaCompanionProgram

HeZhenxiang LinGuozhong ShiJisen

(CollegeofForestResourcesandEnvironmentNanjingForestryUniversity Nanjing 210037)

Abstract Theresearchonbio-genomeisahotpointduringthoseyearsintheworld.Theconstructingge2neticlinkagemapisoneofthestudies.Duringtheconstructionofthegeneticlinkagemap,whenwegotalotofmoleculardataweshouldusecomputerstohelpustoanalysethem.MAPMAKER3.0(forPC)isoneofthesoftwarestoconstructgeneticlinkagemapbeingusedwidelyinChina.Thegeneralinformation,datastructure,basicmappingcommandsandstepsofMAPMAKER3.0(forPC)forconstructinggeneticlinkagemapandQTLmappingwereintroducedindetailinthisarticle.WealsopointedoutsomeaspectsnoteasyforresearcherstouseMAPMAKER3.0(forPC).AcompanionprogramMDACforresearcherseasytosetuptherawdatafileandprimaryanalysisofmarkersegregationratiowasdeveloped.Thefutureworkfordevelopingnewgeneticmappingsoftware(Chineseversion),constructinggenomemapdatabaseandsearchingbio-genomeinformationviaInternetwerealsoputforward.

Keyw

ord Geneticlinkagemap;Software;Applicationanddevelopment

近几年来,生物基因组研究的热潮在全球范围内掀起,其中构建各种生物体的遗传连锁图谱成为当今分子遗传学领域的热点之一[1]。在遗传图谱构建过程中,当获得了大量分子标记的数据以后,由于

Ξ收稿日期 1999202218 修改稿收到日期1999204223

 3国家自然科学基金项目(No.3963230)和国家“九五”攻关项目(952011203217203)

 第一作者简介:何祯祥,男,南京林业大学森林资源与环境学院讲师,在职博士生。

—1

© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved. —

mapmaker_3应用及辅助软件使用

         南 京 林 业 大 学 学 报               第23卷 第3期计算的复杂性用手工是无法完成的,必须借助计算机才能对大量数据进行分析和处理。自20世纪70年代第一个“通用连锁分析软件”推出以后,与遗传连锁分析有关的软件数量迅猛增长。据因特网(In2ternet)上的站点—http://linkage.rockfeller.edu/soft/list.html———美国Rockfeller大学统计遗传实验室所提供的信息已达100多种,而且新的软件还在不断涌现。笔者对当前普遍用于遗传图谱构建和QTL定位的软件MAPMAKER3.0(forPC)[2]的功能、数据结构和基本操作命令与步骤作一介绍;同时把作者在应用时发现的该软件中存在一些不足之处指出来和同行一起讨论;介绍作者开发的用于遗传图谱构建中方便研究者建立符合MAPMAKER要求的分析数据文件,软件MDAC的主要特点。、和基于Internet的基因组信息检索等设想。

1 MAPMAKER3.01.1 组成和功能

MAPMA算机软件。它的0:

(1)MAPMAKER/EXP(3.0)

MAPMAKER/EXP是用于构建杂交试验中有分离的标记连锁遗传图谱的连锁分析软件。它可以处理BC1回交、F2和F3(自交)杂交及重组近交系中显性、隐性和共显性(如类RFLP)标记的多点连锁分析(根据原始数据自动估算所有的重组片段)。

(2)MAPMAKER/QTL(1.1)

MAPMAKER/QTL是MAPMAKER/EXP的伴侣,它可以将F2杂交和BC1回交中控制多基因数量性状的基因定位到相应的遗传连锁图谱上。

1.2 运行环境与安装

MAPMAKER有三种版本分别运行在SunSPARCStation、AppleMacintosh和PC机。对于国内用户来说,目前在科研中用得最多的还是PC版本。MAPMAKER3.0(forPC)对计算机的软硬件环境的基本要求是MS-DOS5.0以上版本;486DX(带有数学协处理器)、5MB扩展内存、20MB以上的硬盘自由空间。

MAPMAKER目前可以从Internet上免费下载:

ftp://ftp-genome.wi.mit.edu/distributions/software/mapmaker3

或http://www-genome.wi.mit.edu/genome-software

它包含两个用PKZIP压缩的自释放文件,分别为MAPM3PC1.EXE和MAPM3PC2.EXE。在DOS提示符下(如果使用的是WINDOWS操作系统,在启动WINDOWS之后进入MSDOS状态)键入:

A:MAPM3PC1-d(回车)

A:MAPM3PC2-d(

回车)

自动安装结束后在计算机硬盘上建立了MAPMAKER子目录,该子目录含有22个文件(略)和一个下一级子目录GSCRIPT。然后检查(修改)计算机系统配置文件CONFIG.SYS和批处理文件AU2TOEXEC.BAT。

在CONFIG.SYS中应含有:

DEVICE=C:\DOS\HIMEM.SYS或

DEVICE=C:\WINDOWS\HIMEM.SYS

DEVICE=C:\DOS\ANSI.SYS

BREAK=ON

在AUTOEXEC.BAT中需含有如:

PATH=C:\DOS;C:\WINDOWS;C:\MAPMAKER;C:\MAPMAKER\GSCRIPT;

—2—

© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved.

mapmaker_3应用及辅助软件使用

 1999年 总第81期       何祯祥等:遗传作图软件应用及辅助软件的研制

SETMAPM-LIB=C:\MAPMAKER

SETGS-LIB=C:\MAPMAKER\GSCRIPT

完成以上操作后重新启动计算机并进入DOS状态,需要运行MAPMAKER/EXP或MAPMAK2ER/QTL,则分别键入MAPMAKER或QTL即可。

1.3 数据结构

在MAPMAKER3.0软年包中,MAPMAKER/EXP和MAPMAKER/QTL共享一个以RAW为扩展名的原始数据文件,它必须是一个纯ASCII文本文件,其模式结构如图1。

文件的第一行为:datatypeXAC  datatypeX3GG12G1n3X为下列数据类型之一:GG2n

f2intercross

f2  f3  riself

risiblocusm Gm1Gm23trait1 T11T123trait2 T21T22  ……3traitp Tp1Tp23GmnT1nT2nTpn

第二行包括3个参数:图1 MAPMAKER3.0要求的原始数据结构模式  ABCFig.1 TherawdatastructureforMAPMAKER3.0这里A为子代的个数;B为遗传位点的个数;

)。C为数量性状的个数(可以为“0”

如果关于各遗传型由下列默认值来表示,则第二行3个参数后不需加载其它信息,否则需用“sym2bols”命令来加以特殊申明。这些默认值为:

F2回交数据:用“A”表示纯合子“;H”表示杂合子“;-”表示缺失数据。

F2杂交数据:用“A”表示这个位点来自亲本a纯合子;用“B”表示这个位点来自亲本b纯合子;用“H”表示携带a、b两个等位基因的纯合子;用“C”表示等位基因a的非纯合子;用“D”表示等位基因b的非纯合子“;-”表示缺失数据。

RI数据:用“A”表示亲本基因型a的纯合子“;B”表示亲本基因型b的纯合子“;-”表示缺失数据。第三行开始为遗传位点的数据。对每个位点,位点名称必须为英文字母、数字或“-”、“.”来表示,长度不能超过8个字符且第一个字符必须是字母;名称前冠一个“3”。名称后空若干个空格输入各遗传型代码,代码之间可以加或不加空格。

在遗传位点数据之后为数量性状数据,每个性状需要有一个名称,名称前也需冠一个“3”,名称后空若干个空格输入各数量性状值,每个数值之间至少空一格,缺乏数据同样用“-”表示。

1.4 MAPMAKER3.0基本操作命令与步骤

以下按通常操作步骤介绍MAPMAKER3.0基本操作命令。

(1)pd(或preparedata)。该命令对原始数据进行预处理,格式:pd(或preparedata)〈文件名.raw〉(2)photo。该命令将后面的操作及结果保存在一个文本文件中,使用格式:photo〈文件名.out〉(3)s(或sequence)。

i)该命令是指定那些位点参与连锁分析,使用格式:s(或sequence)〈locusllocus2……〉,如果所有的位点都参与连锁分析可使用命令:sall

ii)对某连锁群内的位点需要确定相对位置之前需使用该命令,使用格式:s(或sequence)〈

{locus1locus2……}〉

iii)某一连锁群内的各位点已确定最优顺序后进行作图前需使用该命令,使用格式:s(或se2quence)〈locus1locus2……〉

(4)group。该命令是对指定的位点通过两点分析来推测可能有的连锁群。默认的LOD值为3.00,

—3

© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved. —

mapmaker_3应用及辅助软件使用

         南 京 林 业 大 学 学 报               第23卷 第3期最大图距为50.00。使用格式:group〈最小LOD〉〈最大图距〉

(5)compare。该命令是对某个特定的序列计算最大似然值,并从大到小排出前20个(默认值)最优位点顺序图

(6)map。该命令是对指定的某连锁群最优位点的顺序排列进行作图,计算两两标记间的图距,单位为厘摩(cM)

(7)drawmap。该命令将产生某连锁群的图形文件(PostScript格式)

(8)system。该命令为在不退出MAPMAKER环境下执行系统命令,键入“exit。

1.5 完整遗传连锁图谱的绘制

将每次产生的各连锁群的PS(PostScript)锁图谱。第一种将每个PS,然后通过图形处理软件将第二种方法是进入WINDOWS后,运行:

C:\EXE

PS文件,然后用“copytoclipboard”命令将图形拷贝到剪贴版上,再启“paste”命令即可进行下一步常规的图象处理。

1.6 MAPMAKER3.0存在的主要问题

根据作者使用MAPMAKER3.0(forPC)以后,发现它主要有以下不足之处:(1)原始数据的格式要求太苛刻,且与常规数据的输入格式有较大的差距。增加了遗传图谱构建研究者在原始数据文件(特别是大量的数据)制备中的难度和工作量。(2)图形输出的格式不通用且不能绘制整张遗传图谱。造成图形处理上的复杂和难度,以致一般计算机使用者(特别是没有很好的图形处理基础)很难去绘制连锁图谱。(3)缺乏对原始数据的检查与分析(如标记的偏分离情况)。这将影响作图的精确性甚至产生错误的结果。(4)没有一个通用的数据接口,无法将构建遗传连锁图谱的数据进一步与数据库挂接,缺乏数据的可移植性和信息的交流。(5)命令行形式操作,界面不友善,没有经验的人很难使用。

2 图谱数据分析伴侣MDAC的研制

根据上述MAPMAKER3.0(forPC)中存在的主要问题,作者初步开发了图谱数据分析伴侣软件MDAC,给遗传图谱构建的研究者在建立符合MAPMAKER要求的原始数据文件以及对标记数据进行初步分析(偏分离情况)提供方便。MDAC目前具有以下特点和功能:

(1)按研究者习惯的通用数据格式(图2)在任何一个文本数据编辑器如EDIT、WPS、WORD、EX2CEL等输入数据,以文本文件保存。

locus1 G11G12

locus2 G21G22G1nT11T12G2nT21T22T1pT2p

……

locusm Gm1Gm2CmnTm1Tm2Tmp

图2 通用数据输入格式

Fig.2 Theformatfordatainput

(2)对基因型的数据输入时,可以用“0

”“、1”等字符输入,不必输入英文字母。软件会自动转换。(3)自动对原始数据进行检查,一旦发现错误即提示用户进行修改。

(4)对标记是否符合规定的分离比进行卡平方检验。

(5)用户按图2的通用格式输入数据保存为文本文件后,运行MDAC并按菜单提示操作,最后可得到3个输出文件:

 i)标记分离比卡平方检验结果;

—4—

© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved.

mapmaker_3应用及辅助软件使用

 1999年 总第81期       何祯祥等:遗传作图软件应用及辅助软件的研制

 ii)符合MAPMAKER3.0要求的分析数据文件(去除偏分离标记);

 iii)符合MAPMAKER3.0要求的分析数据文件(包含偏分离标记)。

3 未来的研究

随着构建遗传图谱新方法的不断涌现和遗传图谱数量的增加,需要及时开发新的适合广大研究者需要的专业软件,同时必须建立专业的基因组数据库,以建立完整的生物基因组档案。这不仅对积累生物基因组方面的知识而且对应用基因组信息有着重大的意义,

和重视,并对相应的开发研究项目给予资助。

因特网的普及和发展,使得信息不再是孤立

和独占的了。共享的目的。,

需要。,比较适合的模

式如图3。开发中文版适合专业特点的有关基因

组网络数据库已是发展之所需。

参 考 文 献

1 何祯祥,施季森.林木遗传图谱构建的技术和策略.浙江林学院学报,1998,15(2):151~157

2 LanderES,Green

P.Mapmaker:aninteractivecomputerpackageforconstructingprimarygeneticlinkagemapsofexperi2

mentalandnaturalpopulations.Genomics,1987,1:174~181

3 李雪琴.网络精品屋.重庆:西南交通大学出版社,1998

4 徐云碧.分子标记在数量基因定位中的应用.遗传,1992,14(2):45~48

5 徐云碧.分子数量遗传学.北京:中国农业出版社,1994

6 谭浩强.C程序设计.北京:清华大学出版社,1992图3 未来基因组信息系统模式Fig.3 Themodelofthegenomeinformationsysteminfuture

(责任编辑 郑琰炎炎)

—5

© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved. —

本文来源:https://www.bwwdw.com/article/9os1.html

Top