浙大生物统计实验报告1

更新时间:2023-11-18 22:48:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

课程名称:姓 名:学 院:系:专 业:学 号:指导教师:生物统计与实验设计

赵应

农业与生物技术学院 应用生物科学 应用生物科学 3140100080 朱军、徐海明

2016年4月11 日

专业:应用生物科学 姓名:赵应 学号: 3140100080 实验报告 日期: 2016年4月11日

课程名称:生物统计与实验设计指导老师:徐海明成绩:________________ 实验名称:简单统计分析和简单线性回归实验类型:综合实验 同组学生姓名:无 一、 实验目的和要求

初步了解Excel软件的数据分析功能,掌握连续变量和离散变量的样本资料简单统计分析的方法,掌握简单回归模型的分析方法。 二、 实验内容和原理

1、连续变量的统计分析方法; 2、离散变量的分析方法;

3、简单回归模型的统计分析方法。 三、 主要仪器设备

一台装有excel和SAS软件的PC 四、 操作方法和实验步骤

1、 实验数据的生成:本实验所用的数据需要基于设置的参数,运行计算机模拟软件

(QTLSimulation.exe)产生。先打开参数设置文件SimPar.txt,用自己的学号替换第一设置行“The seed for initilizing the rand() = 2551949”中的随机数发生器的种子“2551949”。然后重新保存设置文件。运行模拟软件时需要输入参数设置文件名。模拟软件产生三个文件,DHSim.Par是基因数目、位置、效应的参数文件,DHSim.Map是分子标记遗传图谱的文件,DHSim.Txt是基因定位遗传群体(样本数n =200)的分子标记和二个环境模拟性状的表现型值的文件。以DHSimuData.xls文件的格式,整理可分析的数据文件。计算机模拟的参数设置如下:

表1参数设置

地点:紫金港西1-106(多) 装订线 QTL

1 2 3 4 5

Chromosome

l

1 1 2 3 3

Marker Intervae

Distanc

A

(cM)

4.70

0.00

-4.10

0.00

3.50

16 0 0 0 7 1

AE

2 4.4

47 0.0

0 0.0

0 0.0

0 -3.

6

AE

3 7 4 6 3

3.0 8.0 5.0 2.0 1.0

-4.0.00.00.03.1

表2参数设置

InteraQQAAA

ction

1 2 3

TL-i

1 1 2

TL-j

2 3 4

A

3.20

0.00

-3.00

AE1

0.00

-4.20

3.16

AE2

0.00

4.20 -3.16

2、 实验数据的分析:采用Excel软件整理数据,采用Excel对样本资料进行简单的统

计分析和简单回归分析,如下: a) 连续变量的统计分析:采用Excel分别计算仿真群体的表现型数据的样本均值、

样本方差、标准误。

b) 离散变量的统计分析:对各分子标记位点,采用Excel计算仿真群体的分子标

记基因型频率、样本频率的方差、标准误。

c) 简单回归模型的统计分析方法;采用Excel以环境一的数据为依变量,以环境

二的数据为自变量,计算简单线性回归系数的估计值及其标准误、计算各项变异的自由度、平方和、均方。采用Excel分别以二个环境的表现型数据为依变量,分子标记为自变量,计算仿真群体表现型数据与分子标记的简单相关系数。

五、 实验数据记录和处理

表3连续变量的统计分析

环境1

环境2 环境1 环境2

表现型方差 173.1435977 94.65116171

均值95%下限 102.2243844 96.83224

表现型标准差 13.15840407 9.72888286

方差95%下限 143.58902 78.49477

表现型标准误 0.930439675 0.687935904 方差95%上限 212.91719 116.39390

均值95%上限 105.8939576 99.54540

表4离散变量的统计分析

A的频率 B的频率

均值 0.493939 0.506061 方差 0.00034 0.00034 标准误 0.003211 0.003211

环境

Mk10 Mk11 Mk12 Mk13 Mk14 Mk15 Mk16 Mk17 Mk18

-0.19791 -0.20039 0.190274 0.19426 0.273134 0.324983 0.272791 0.217011 0.188191 1 环境

-0.05579 -0.07573 0.217489 0.253964 0.290337 0.399782 0.368053 0.257015 0.238907 2

以环境一的表现型值为依变量,以环境二的表现型值为自变量,运行sas程序,得到:

环境

Mk1 Mk2 Mk3 Mk4 Mk5 Mk6 Mk7 Mk8 Mk9

-0.40929 -0.51972 -0.67318 1 环境

-0.616 -0.53924 -0.40714 -0.35012 -0.29228 -0.27644

-0.06068 -0.0452 -0.01516 0.076456 0.113036 0.079987 0.045066 0.045995 -0.02191 2

表5仿真群体表现型数据与分子标记的简单相关系数

环境

Mk19 Mk20 Mk21 Mk22 Mk23 Mk24 Mk25 Mk26 Mk17

0.12431 0.071319 0.062918 0.040391 0.005624 -0.01162 -0.06373 -0.17677 -0.14065 1 环境

0.271575 0.260455 0.194454 0.15109 2

-0.33

-0.32322 -0.39922 -0.49479 -0.56993

环境1 环境2

Mk28 -0.1258 -0.66838

Mk29 -0.11172 -0.65725

Mk30 -0.10073 -0.47147

Mk31 -0.09094 -0.42518

Mk32 -0.09902 -0.38046

Mk33 -0.08927 -0.3616

六、 实验结果与分析

1、 检验群体均值和方差与零是否存在显著差异

用二尾检验:H0:u=0 H1:u≠0均值用t检验,得出环境1、2均值都存在显著差异 H0:σ2=0 H1:σ2≠0方差用卡方检验,得出环境1、2方差存在显著差异 2、 计算仿真群体各分子标记位点的基因型95%置信区间,检验分子标记基因型频率是

否符合1:1的分离比例

标记型A的95%置信区间:0.493939±0.009403,因0.5属于其中,故符合1:1比例 3、 对二个环境表现型值的线性回归关系进行评价:

两个环境的表现型值的R2=0.0136,由此可知两者之间基本上不存在线性回归关系。 4、 以二个环境的表现型值为依变量,以分子标记为自变量,进行多元回归分析:在SAS

中对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:

对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:

由此推断:环境1的数量性状基因在Mk3、Mk15、Mk5附近;环境2的数量性状基因在Mk28、Mk15、Mk29附近。 七、 讨论、心得

1、 通过本次实验,我初步了解了Excel软件的数据分析功能,掌握了连续变量和离散

变量的样本资料简单统计分析的方法,以及简单回归模型的分析方法;

2、 对于大量数据的分析统计,SAS使用起来更方便,但是命令太多,需要一定时间熟

悉各种命令;

3、 实验数据是通过程序产生的,对于实际的生物学研究没有太大联系,但是其中所用

到的数据处理分析方法却是生物学研究必不可少的。

本文来源:https://www.bwwdw.com/article/y25v.html

Top