第1章 统计数据的收集与整理

更新时间:2023-06-07 03:56:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第一章

统计数据的收 集与整理

第一节 生物统计的概述 合理地进行调查或试验设计、 科学地整理 、 分 析 所 收 集 得来的资料是生物统计 (Biometrics)的根本任务。 生物统计是数理统计的原理和方法在生 物科学研究中的应用,是一门应用数学。 一、提供试验或调查设计的方法 试验设计这一概念有广义与狭义之分:

广义的试验设计是指试验研究课题设计,

也就是指整个试验计划的拟定 , 包含课题名称、试验目的,研究依据、内容及预期达到的

效果,试验方案,供试单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要

求,试验结果的分析方法,经济效益或社会效益的估计 , 已具备的条件 , 需要购置的仪器设

备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰 写等内容。

狭义的试验设计主要是指试验单位 (如动 物试验的畜、禽 )的选取、重复数目的确定及 试验单位的分组。生物统计中的试验设计主要 指狭义的试验设计。合理的试验设计能控制和

降低试验误差,提高试验的精确性,为统计分析获得试验处理效应和试验误差的无偏估计提 供必要的数据。

二、提供整理、分析资料的方法整理资料的基本方法是根据资料的特性将

其整理成统计表、 绘制成统计图。 通过统计表、图可以大致看到所得资料集中、离散的情 况。并利用所收集得来的数据计算出几个统计 量,以表示该资料的数量特征、估计相应的总 体参数。

统计分析 最重要的内容是 差异显著性检 验。通过抽样调查或控制试验,获得的是具有 变异的资料。产生变异的原因是什么?是由于 进行比较的处理间,例如不同品种、不同饲料 配方间有实质性的差异或是由于无法控制的偶 然因素所引起?显著性检验的目的就在于承认 并尽量排除这些无法控制的偶然因素的干扰, 将处理间是否存在本质差异揭示出来。显著性 检验的方法很多,常用的有:

t 检验——主要用于检验两个处理平均数 差异是否显著; 方差分析——主要用于检验多个处理平均

数间差异是否显著;

检验 —— 主要用于由质量性状得来2

的次数资料的显著性检验等。

统计分析的另一个重要内容是对试验指标 或畜禽性状间的关系进行研究,或者研究它们

之间的联系性质和程度,或者寻求它们之间的联系形式,即进行相关分析与回归分析。通过

对资料进行相关、回归分析,可以揭示出试验指标或性状间的内在联系,为畜禽、水产新品 种选育等提供强有力的依据。

还有一类统计分析方法不考虑资料的分布类型 , 也不事先 对

有关 总体参数进行估 算,这类统计分析方法叫非参数检验法。非

参数检验法计算简便。当通常的检验方法对畜禽、水产科研中的某些资料无能为力时, 非参数检验法则正好发挥作用。

第二节 生物统计的常用术语一、总体与样本根据研究目的确定的研究对象的全体称为 总体(population); 总体中的一个研究单位称为个体

(individual);总体的一部分称为样本(sample); 含有有限个个体的总体称为有限总体; 包含有无限多个个体的总体叫无限总体;

在实际研究中还有一类假想总体。例如进 行几种饲料的饲养试验,实际上并不存在用这 几种饲料进行饲养的总体,只是假设有这样的 总体存在,把所进行的试验看成是假想总体的 一个样本; 样本中所包含的个体数目叫样本容量或大 小(sample size),样本容量常记为n。通 常把n≤30的样本叫小样本,n >30的样本 叫大样本。 研究的目的是要了解总体,然而能观测到 的却是样本,通过样本来推断总体是统计分析 的基本特点。

为了能可靠地从样本来推总体,要求样本 具有一定的含量和代表性。 只有从 总体 随机抽取 的样本才具有代表 性。所谓随机抽取(random sampling) 的 样本是指总体中的每一个个体都有同等的机会 被抽取组成样本。

样本毕竟只是总体的一部分,尽管样本具 有一定的含量也具有代表性,通过样本来推断 总体也不可能是百分之百的正确。有很大的可 靠性但有一定的错误率这是统计分析的又一特 点。

二、参数与统计量为了表示总体和样本的数量特征,需要计算出几 个特征数。 由总体计算的特征数叫参数(parameter); 由样本计算的特征数叫统计量(staistic)。 常用希腊字母表示参数,例如用μ表示总体平均 数,用σ表示总体标准差;

常用拉丁字母表示统计量,例如用平均数,用S表示样本标准差。

x 表 示样本

总体参数由相应的统计量来估计,例如用

x 估计μ,用S估计σ等。三、准确性与精确性准确性(accuracy)也叫准确度,指在调 查或试验中某一试验指标或性状的观测值与其 真值接近的程度。设某一试验指标或性状的真 值为μ,观测值为 x,若 x与μ相差的绝对值 |x-μ|小, 则观测值x的准确性高; 反之则

低。

精确性(precision)也叫精确度,指调查 或试验中同一试验指标或性状的重复观测值彼 此接近的程度。若观测值彼此接近,即任意二 个观测值xi 、xj 相差的绝对值|xi -xj |小, 则观测值精确性高;反之则低。 调查或试验的准确性、精确性合称为正确

性。

在调查或试验中应严格按照调查或试验计 划进行,准确地进行观测记载,力求避免人为 差错,特别要注意试验条件的一

致性,即除所

研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理

措施等应尽量控制一致,并通过合理的调查或试验设计努力提高试验的准确性和精确性。

由于真值μ常常不知道,所以准确性不易度量,但利用统计方法可度量精确性。

四、随机误差与系统误差随机误差(random error)与系统误差 (systematic error) 随机误差 也叫 抽样误差 (sampling error) , 这是由于许多无法控制的内在和外 在试验中,即使十分小心也难以消除。随 机误差影响试验的精确性。

在的偶然因素 所造成 。随机误差带有偶然性质,

统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。

系统误差 也叫 片面误差

(lopsided

error), 这是 由于试验动物的初始条件相差

较大,饲料种类、品质、数量、饲养条件未控制相同 ,测量的仪器不准 、 标准试剂未经校

正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。

第三节 资料的分类正确地进行资料的分类是资料整理的前提。在调查或 试验中,由观察、测量所得的数据按其性质的不同,

一般可以分为数量性状资料 、 质量性状资料和半定量(等级)资料三大类。

一、数量性状资料

数量性状(quantitative character) 是 指能够以量测或计数的方式表示其特征的

性状 。观察测定数量性状而获得的数据就是数量性状资料 ( data of quantitative characteristics)。数量性状资料的获得有 量测和计数两种方式 ,因而数量性状资料 又 分为计量资料和计数资料两种。

(一)计量资料

指用量测方式获得的数

量性状资料,即用度、量、衡等计量工具直接 测定获得的数量性状资料。其数据是用长度、 容积、重量等来表示。这种资料的各个观测值 不一定是整数,两个相邻的整数间可以有带小 数的任何数值出现,其小数位数的多少由度量

工具的精度而定 , 它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。

本文来源:https://www.bwwdw.com/article/3uj1.html

Top