《统计学》第六章抽样调查

更新时间:2023-08-13 22:19:01 阅读量: IT计算机 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第六章

抽样调查

§1抽样调查的意义 §2抽样调查的基本概念和理论依据 §3抽样平均误差 §4抽样推断 §5必要抽样单位数的确定

§1、抽样调查的意义一、抽样调查的概念、特点(一)、概念: 抽样调查是按照随机原则从全部研究对象中抽取一 部分单位进行观察,并依据所获得的数据对全部研究对 象的数量特征做出具有一定可靠性的估计判断,从而 达到对全部研究对象的认识的一种统计方法。

(二)、抽样调查的基本特点: 根据部分实际资料对全部总体的数 量特征做出估计。 按随机的原则从全部总体中抽取样 本单位。

抽样推断的抽样误差可以事先计算 并且加以控制。

二、抽样调查的作用: 对某些不可能进行全面调查而又要了解其全面情况 的社会经济现象,必须应用抽样调查。 对某些社会经济现象虽然可以进行全面调查,但抽 样调查可以节约时间、费用,提高调查的时效性。 抽样调查和全面调查同时进行,可以发挥相互补充 和检查质量的作用。 抽样调查可以用于工业生产过程的质量控制。 利用抽样调查原理,还可以对某种总体的假设进行 检验,来判断这种假设的真伪,以决定行动的取舍。

§2、抽样调查的基本概念及理论依据一、总体与样本 (一)、总体与总体指标 总体:是根据研究目的确定的所要研究的同类 事物的全体。总体单位数称为总体容量,一 般用N 表示。 总体指标:用来反映总体数量特征的指标,也 称为参数。一般来说总体指标有:总体平均 数、总体成数、总体平均数标准差、总体平 均数方差、总体成数标准差、总体成数方差。

参 数参数: 指反映总体数量特征的综合指标,它是确定的、 唯一的。 XF x 总体平均数 F 研究总体中 ( X X )2 F 的数量标志 X 总体标准差 F

总体成数 研究总体中 的品质标志 成数平均数 成数标准差

N1 P N

XP P P P(1 P)

未分组情况下的全及指标总体平均数总 体 成 数具 备 某 种 特 征 的 单 位 数 P N

总体方差

2

Xi 1

N

i

X

2

N

总体标准差

Xi 1

N

i

X

2

N

资料分组情况下

总体指标: XF F X 或 X F F

Xi X F2

F N1 XP P N

P P 1 P

(二)、样本与样本指标 样本:从总体中抽取的部分总体单位所构成的 整体。样本所包含的总体单位个数称为样本 容量,一般用n表示。在实际工作中,人们 通常把n≥30的样本称为大样本,而把 n﹤30 的样本称为小样本。 样本指标:是根据样本资料计算的、用于估计 和推断相应总体指标的综合指标

,也称统计 量。一般来说样本指标有:样本平均数、样 本成数、样本平均数标准差、样本平均数方 差、样本成数标准差、样本成数方差。

统计量:

根据样本数据计算的综合指标。样本平均数

xf x f x 2 ( x x ) f

研究数量标志 样本标准差

f

样本成数 研究品 质标质 成数平均数

n1 p n

xp p p p(1 p)

成数标准差

未分组情况下的抽样指标 x1 xn 样本平均数 x n 具备某种特征的单位数 p 样本成数 n n 2 xi x 2 i 1 s 样本方差 ns

样本标准差

x x i 1 i

n

2

n

资料分组情况下

样本指标: xf f x 或 x f f s xi x f2

f

n1 xp p n sp ( p 1 p)

二、概率抽样与非概率抽样随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定 概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率 的概率被抽选为样本单位,每个总体单位能否选入样本是随机的。 抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽 样和整群抽样。 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调 查者的经验或判断,从总体中有意识地抽取若干单位构成样本。 重点调查、典型调查、配额调查等属于非随机抽样。(但由于 非随机抽样的效果取决于调查者的经验、主观判断和专业知识, 故难免掺杂调查者的主观偏见,出现因人而异的结果,且容易 产生倾向性误差;此外,非随机抽样不能计算和控制其抽样误 差,无法说明调查结果的可靠程度。)

三、抽样框:是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好坏通常会 直接影响到抽样的随机性和调查的效果。

抽样框的主要形式有三种: 1、名单抽样框:即列出全部总体单位的名录 一览表,如职工名单、企业名单等。 2、区域抽样框:即按地理位置将总体范围划 分为若干小区域,以小区域为抽样单位。 3、时间表抽样框:即将总体全部单位按时间 顺序排列,把总体的时间过程分为若干个小 的时间单位,以此时间单位为抽样单位。

四、抽样误差:登记性误差

登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。

误 差

系统性误差是指由于非随机因素引起的样 本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。

系统性误差

代表性误差随机性误差代表性误差是指用样本指标推断 总体指标时,由于样本结构与总

体结构不一致、样本不能完全代 表总体而产生的误差。

随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。

五、抽样方法和样本可能数目样本的可能数目既和样本的容量有关,也和抽 样的方法有关。 根据取样方式的不同,抽样方法有重复抽样和不重 复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量 为n的样本,每次抽出一个单位后,再将其放回总体 中参加下一次抽取,这样连续抽n次即得到一个样本。 2、不重复抽样:是指抽中单位不再放回总体中,下一 个样本单位只能从余下的总体单位中抽取。

重复抽样与不重复抽样的区别: 重复抽样: 同一总体单位有可 能被重复抽中; 每个总体单位在每 次抽样中被抽中的 概率都是相同的。 不重复抽样: 同一总体单位不可能被 重复抽中; 由于每次抽取是在不同 数目的总体单位中进行, 每个总体单位在各次抽 样中被抽中的概率不相 等。 抽样误差较小。

抽样误差较大。

根据对样本的要求不同,抽样方法又有 考虑顺序抽样和不考虑顺序抽样两种:1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样本各单位的不同性质,而 且还考虑不同性质各单位的中选顺序。相同构成成

分的单位,由于顺序不同,也作为不同样本。

2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本各单位的组成成分如何,而不考虑单位的抽样顺序。如果样本的成分相

同,不论顺序有多大不同,都作为一种样本。

以上抽样方法的两种分类还存在交叉情况,即有:

考虑顺序的不重复抽样数目 考虑顺序的重复抽样数目N! A N n !n N

B Nn Nn N

n

不考虑顺序的不重复抽样数目N! C n ! N n !

不考虑顺序的重复抽样数目n n DN CN n 1

例如:从4个(N)职工中抽取其中的2个(n) 进行调查。 考虑顺序的重复抽样数目

B N 4 16(个)n N n 2

不考虑顺序的不重复抽样数目N! 4! 4 3 2 1 C 6(个) n ! N n ! 2! 4 2 ! 2 2n N

A=40、B=50、C=70、D=80 考虑顺序的重复组合: AA BA CA DA AB BB CB DB AC BC CC DC AD BD CD DD 不考虑顺序的不重复抽样数目 AB BC CD AC BD AD

本文来源:https://www.bwwdw.com/article/d6hj.html

Top