样本容量的确定
更新时间:2023-11-09 13:03:01 阅读量: 教育文库 文档下载
样本容量的确定 分类:Statistics
在参数区间估计的讨论中,估计值和总体的参数之间存在着一定的差异,这种差异是由样本的随机性产生的。在样本容量不变的情况下,若要增加估计的可靠度,置信区间就会扩大,估计的精度就降低了。若要在不降低可靠性的前提下,增加估计的精确度,就只有扩大样本容量。当然,增大样本容量要受到人力、物力和时间等条件的限制,所以需要在满足一定精确度的条件下,尽可能恰当地确定样本容量。
一、影响样本容量的因素
(一)总体的变异程度(总体方差)
在其它条件相同的情况下,有较大方差的总体,样本的容量应该大一些,反之则应该小一些。例如:在正态总体均值的估计中,抽样平均误差为它反映了样本均值相对于总体均值的离散程度。所以,当总体方差较大时,样本的容量也相应要大,这样才会使较(二)允许误差的大小
允许误差指允许的抽样误差,记为允许误差可以表示为
能范围,所以又称为误差。
,例如,样本均值与总体均值之间的
小,以保证估计的精确度。
,允许误差以绝对值的形式表现了抽样误差的可
允许误差说明了估计的精度,所以,在其他条件不变的情况下,如果要求估计的精度高,允许误差就小,那么样本容量就要大一些;如要求的精确度不高,允许误差可以大些,则样本容量可以小一些。 (三)概率保证度1-α的大小
概率保证度说明了估计的可靠程度。所以,在其他条件不变的情况下,如果要求较高的可靠度,就要增大样本容量;反之,可以相应减少样本容量。 (四)抽样方法不同
在相同的条件下,重复抽样的抽样平均误差比不重复抽样的抽样平均误差大,所需要的样本容量也就不同。重复抽样需要更大的样本容量,而不重复抽样的样本容量则可小一些。
此外,必要的抽样数目还要受抽样组织方式的影响,这也是因为不同的抽样组织方式有不同的抽样平均误差。
二、样本容量的确定
(一) 估计总体均值的样本容量
在总体均值的区间估计里,置信区间是由下式确定的:
例如,对于正态总体以及非正态总体大样本时,都是以它为置信区间。
从图6–1中可以看到,从估计量x的取值到点的距离实际上为置信区间长
度的。这段距离表示在一定置信水平1-α下,用样本均值估计总体均值时所允许的最大绝对误差即允许误差Δ。显然,若以x的取值为原点,则允许误差Δ可以表示为:
(6–15)
x=0
图6–1 允许误差示意图
公式(6–15)反映了允许误差Δ、可靠性系数、总体标准差与样本容量之间的相互制约关系。只要这四个因素中的任意三个因素确定后,另一个因素也就确定了。
在重复抽样条件下,把允许误差Δ的计算公式容量的计算公式:
变形整理,则得到样本
(6–16)
在不重复抽样的条件下,抽样允许误差为
形后得到不重复抽样条件下的样本容量公式为
, 因此变
n=(6–17)
例6–14 某食品厂要检验本月生产的10 000袋某产品的重量,根据以往的资料,这种产品每袋重量的标准差为25克。如果要求在95.45%的置信度下,平均每袋重量的误差不超过5克,应抽查多少袋产品? 解由题意可知N=10 000(原作者误为20 000),1–α=95.45%,有
=2。在重复抽样的条件下
=25克,
=5克,根据置信度
n=(袋)
注:Excel中的计算方法:
利用标准正态分布函数的反函数NORMSINV计算在该置信度下的标准偏差度z=2; 题中要求平均每袋重量的误差不超过5,即表明SD*z小于或者等于5;
那么倒推标准偏差应该不超过2.5;在总体标准差为25克的前提下,那么取样量应该为99.96,当然,取样量应该是整数,即100。 在不重复抽样条件下
n==99(袋)
由计算结果可知:在其它条件相同的情况下,重复抽样所需要的样本容量大于不重复抽样所需要的样本容量。
在计算样本容量时,必须知道总体的方差,而在实际抽样调查前,往往总体的方差是未知的。在实际操作时,可以用过去的资料,若过去曾有若干个方差,应该选择最大的,以保证抽样估计的精确度;也可以进行一次小规模的调查,用调查所得的样本方差来替代总体的方差。 (二)估计总体成数时的样本容量
估计总体成数时样本容量的确定方法与估计总体均值是一样的,设允许误差,在1—a的置信度下,重复抽样条件下有
为
解上面的方程可得重复抽样条件下样本容量的公式为
同理可得不重复抽样条件下的样本容量公式为
(6–19)
在估计成数时,计算样本容量时需要总体的成数,但是总体的成数通常是未知的,在实际的抽样调查时,可先进行小规模的试调查求得样本的成数来代替。也可用历史的资料,如果有若干个成数可供选择,则应选择最靠近50%的成数,使样本成数的方差最大,以保证估计的精确度。
例6–15 为了检查某企业生产的10 000个显像管的合格率,需要确定样本的容量。根据以往经验合格率为90%、91.7%。如果要求估计的允许误差不超过0.0275,置信水平为95.45%。求应该取多少只显像管?
解根据资料,我们应该选择P=0.9计算样本容量,根据置信水平0.9545,有
重复抽样条件下,样本容量
=2,
不重复抽样条件样本容量
从计算的结果可以看出,重复抽样应该抽477件件检验,而不重复抽样应该抽455件,可见,在相同条件下,重复抽样需要的样本容量更大。 注:Excel中的计算方法:
利用标准正态分布函数的反函数NORMSINV计算在该置信度下的标准偏差度z=2.
正在阅读:
样本容量的确定11-09
暑期社区实践心得体会06-09
小学财产管理制度11-28
堕落的少女走上刑场007-01
六年级语文下册期末总复习S版04-05
宁波2011年一级建造师 - 图文04-23
tob与toc的意思与区别12-30
高中地理教学反思02-13
《新时代新担当新作为》观后感12-11
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 样本
- 容量
- 确定
- 深圳牛津英语新版七上chapter1知识点及练习
- 2013-2014下第01期政教简报 1
- 生物化学复习题及答案
- 2015中考 反比例函数(已排版)
- 光伏理论发电功率及受阻电量计算方法
- 民事诉讼法案例及解析
- 微观经济学上海商学院第5章--成本函数--习题
- 广东省广州市天河区2014年初中毕业班综合测试(二)物理试卷 有答案
- 心血管疾病介入培训考试电生理起搏模拟试题一 - 图文
- 手指口述操作标准
- 夯实科目建设,提升教师课程力
- 小学综合实践课程资源的开发和利用马乃灿
- 2011注册城市规划原理答案
- 会计信息系统(含答案)
- 汽车试验学总复习
- 2015年初中学业水平美术笔试模拟试题
- 论社会舆论的社会控制功能
- 操作系统作业题及答案
- 加强安全管理 杜绝事故发生(1)
- 冲击、疲劳、光测等力学实验