第 5 章 抽样与参数估计
更新时间:2023-10-21 04:17:01 阅读量: 综合文库 文档下载
- 第五人格推荐度:
- 相关推荐
第 5 章 抽样与参数估计 名人名言
见一叶落,而知岁之将暮,睹瓶中之冰,而知天下之寒,以近论远。 ——《淮南子·说山训》
偶然的东西是没有根据的,因为它是偶然的;但同样因为它是偶然的,它又是有根据的。 —— 黑格尔
参数估计在统计方法中的地位 第 5 章 抽样与参数估计 5.1 抽样与抽样分布
5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 学习目标
?理解概率抽样方法 ?理解抽样分布
?估计量与估计值的概念 ?点估计与区间估计的区别 ?评价估计量优良性的标准 ?总体均值的区间估计方法 ?总体比例的区间估计方法 ?样本容量的确定方法
一、抽样推断 (概念要点)
是根据观测到的样本数据对总体作出推测,这种推测伴随某种不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。 统计推断的过程
抽样推断的应用范围
①带有破坏性检验。如产品寿命试验(灯泡、轮胎)破坏性试验(汽车抗碰撞)、可靠性试验(烟火)
②总体规模大、单位数多的调查对象。如生产线上的产品质量检查、海洋生物研究、人口流动调查、森林木材积蓄量等。
③经济上不必要进行全面调查。如城市和农村居民的收支情况调查、物价调查、民意调查等。 ④对全面调查资料进行验证和修正。如对人口、农作物产量等普查后,用抽样调查的数据来验证和修正
二、抽样方法 统计应用
一次失败的民意调查
?在1936年的美国总统选举前,一份名为Literary Digest 杂志进行了一次民意调查。调查的焦点是谁将成为下一届总统—是挑战者,堪萨斯州州长Alf Landon,还是现任总统 Franklin Delano Roosevelt
?为了解选民意向,民意调查专家们根据电话簿和车辆登记簿上的名单给一大批人发了简单的调查表(电话和汽车在1936年并不像现在那样普及,但是这些名单比较容易得到)。尽管发出的
调查表大约有一千万张,但收回的比例并不高。在收回的调查表中, Alf Landon非常受欢迎。于是该杂志预测 Landon 将赢得选举。但事实上是Franklin Roosevelt赢得了这次选举
?调查失败的主要原因是抽样框出现了问题。在经济大萧条时期由于电话和汽车并不普及,只是富裕阶层才会拥有,调查有电话和汽车的人们,并不能够反映全体选民的观点 抽样方法 (一)概率抽样
(probability sampling)
?也称随机抽样 ?特点
?按一定的概率以随机原则抽取样本
?抽取样本时使每个单位都有一定的机会被抽中
?每个单位被抽中的概率是已知的,或是可以计算出来的
?用样本对总体进行估计时,要考虑到每个样本单位被抽中的概率
简单随机抽样
(simple random sampling)
?从总体N个单位中随机地抽取n个单位作为样本,每个单位入选样本的概率是相等的 ?特点
?简单、直观,在抽样框完整时,可直接从中抽取样本 ?用样本统计量对目标量进行估计比较方便
?局限性
?当N很大时,不易构造抽样框
?抽出的单位很分散,给实施调查增加了困难 ?没有利用其它辅助信息以提高估计的效率
简单随机抽样
(simple random sampling) 抽取方式:
总体N个单位从1-N编号,从中抽取n个单位 1、抽签法:做材质相同的N个标签,不放回抽取 2、随机数法: ⑴摇奖机
⑵随机数色子 ⑶随机数表
⑷随机数发生器(EXCEL) 分层抽样
(stratified sampling)
?将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样
本
分层抽样
(stratified sampling)
1. 使层内差异小,层间差异大。 2. 优点:
?保证样本的结构与总体的结构比较相近,从而提高估计的精度 ?组织实施调查方便
?既可以对总体参数进行估计,也可以对各层的目标量进行估计 分层抽样
(抽样方法)
1、等额分配法:在各层中分配同等单位数 n1=n2=…=ni
2、等比例抽样:按各层在总体中所占的比例分配样本单位数。 整群抽样
(cluster sampling)
?将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调
查
整群抽样
(cluster sampling)
?使群内差异大,群间差异小。 ?特点
?抽样时只需群的抽样框,可简化工作量
?调查的地点相对集中,节省调查费用,方便调查的实施 ?缺点是估计的精度较差 系统抽样
(systematic sampling)
?将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初
始单位,然后按事先规定好的规则确定其它样本单位。
?优点:操作简便,可提高估计的精度 ?缺点:对估计量方差的估计比较困难
系统抽样 (抽样方法)
1、无关标志排队等距抽样
如:产品质量检查按生产时间顺序排队;学生成绩调查按学号排队;居民住户收入调查按门牌号排序。
2、有关标志排队等距抽样
如:职工家计调查按工资水平排队;农产量抽样调查,按平均亩产排序。 3、起点和间隔的确定:
⑴随机起点:间隔 k=N/n,a1=r, a2=r+k, a3=r+2k…an=r+(n-1)k ⑵中点起点等距抽样: a1=k/2, a2=k/2+k, a3=k/2+2k… an=k/2+(n-1)k ⑶随机起点对称等距抽样: a1=r, a2=(2k+1)-r, a3=2k+r,
a4=(4k+1)-r, a5=4k+r 多阶段抽样
(multi-stage sampling)
?先将总体单位划分成若干大群,大群内再分成若干小群。先按某种方法抽取大群,然后在中选群中抽取小群,再进一步抽样,从选中的群中抽取出若干个单位进行调查
?二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的阶段数增多,就称为多阶段抽样
?具有整群抽样的优点,保证样本相对集中,节约调查费用 ?缺点:估计量的结构比较复杂,估计量方差的估计很复杂
?适用于大规模的抽样调查,如:我国的农作物产量调查、职工家计调查等 多阶段抽样
例:全国农作物产量抽样调查,首先由省所有县市级中抽取部分县市作为第一阶段样本,再从被抽中的县市中抽取乡镇作为第二阶段样本,从被抽中乡镇中抽取村作为第三阶段样本,最后
从中选村中抽取农户,并从农户的播种面积中抽取部分地块,进行实割实测,计算平均亩产量,然后逐级往上综合计算平均亩产量,并推算全国总产量。 多阶段抽样实例
2005年全国1%人口抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、多阶段、整群概率比例抽样方法,在全国31个省、自治区、直辖市抽取了2869个县(市、区)、21181个乡(镇、街道)、77417个调查小区的1699万人。
经加权后汇总,2005年全国人口出生率为12.40‰,死亡率为6.51‰,自然增长率为5.89‰。按此推算,2005年末全国总人口为130756万人,出生人口为1617万人,死亡人口为849万人,净增人口为768万人。 (二)非概率抽样
(non-probability sampling)
?相对于概率抽样而言
?抽样时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部
分单位对其实施调查。
?有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式 。
方便抽样
?调查过程中由调查员依据方便的原则,自行确定入选样本的单位。
?调查员在街头、公园、商店等公共场所进行拦截调查 ?厂家在出售产品柜台前对路过顾客进行的调查
?优点:容易实施,调查的成本低
?缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总
体
判断抽样
?研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本
?有重点抽样,典型抽样,代表抽样等方式
?样本选择的好坏取决于调研者的判断、经验、专业程度和创造性 ?抽样成本比较低,容易操作
?样本是非随机人为确定的,调查结果不能用于推断总体
自愿样本
?被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息
?例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等
?自愿样本与抽样的随机性无关
?样本是有偏的
?不能依据样本的信息推断总体
滚雪球抽样
?先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,
调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。
?适合于对稀少群体和特定群体研究
?优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低。
配额抽样
?先将总体中的所有单位按一定的标志分为若干类,然后在每个类中采用方便抽样或判断抽样
的方式选取样本单位。
?操作简单,可以保证样本的结构和总体的结构类似。 ?抽取具体样本单位时,不是依据随机原则
概率抽样与非概率抽样的比较
?概率抽样
?依据随机原则抽选样本 ?样本统计量的理论分布存在 ?可根据调查的结果推断总体
?非概率抽样
?不是依据随机原则抽选样本 ?样本统计量的分布是不确定的 ?无法使用样本的结果推断总体
三、抽样分布 总体分布
(population distribution)
?总体中各元素的观察值所形成的分布 ?分布通常是未知的
?可以假定它服从某种分布
样本分布
(sample distribution)
?一个样本中各观察值的分布 ?也称经验分布
?当样本容量n逐渐增大时,样本分布逐渐接近总体的分布
抽样分布
(sampling distribution)
?从一个总体中,抽取容量相同的所有可能样本,样本统计量的全部可能取值及相应的频率(概
率)分布就是统计量的抽样分布
?随机变量是样本统计量
?样本均值, 样本比例,样本方差等
?是一种理论概率分布
抽样分布
(sampling distribution) (一)样本均值的抽样分布 样本均值的抽样分布
?在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布 ?一种理论概率分布
?推断总体均值?的理论基础
样本均值的抽样分布 (例题分析)
样本均值的抽样分布 (例题分析)
样本均值的抽样分布 (例题分析)
正在阅读:
第 5 章 抽样与参数估计10-21
汪曾祺的散文集03-30
世界科技文化史(mooc)09-14
2022-2022学年新人教版初中七年级英语上下册全套精品教案【精品04-12
抗浮锚杆设计(8.0m)01-27
电网工程变电部分试卷及答案(2)09-27
高中语文 第四专题《兰亭集序》同步训练 苏教版必修501-07
病句课堂练习及答案07-28
中央本级基本支出预算管理办法05-09
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 抽样
- 估计
- 参数
- 第 九 章 审计测试中的抽样技术(答案解析)
- 某工大教师公寓防空地下室施工组织设计 - 图文
- 伺服电机原理和应用
- 现代 市场调查与预测试题及答案
- 地理人文地理原因类部分主观题答案整理
- 《公差与技术测量》实验指导书
- 动画概论笔记
- 概率统计13-14第2学期期末试题
- 两学考试 教育心理学第八章重点习题及答案
- 一年级写话指导第7讲 - --美妙声音一句话
- 工程水文学1-2章习题含答案
- 信号与系统考试试题及答案
- 剑桥汉学产生的历史基础
- 人体寄生虫学试卷及答案2套
- 防螨虫剂,抗菌防霉剂,吸湿快干剂,消臭抗菌剂,除螨剂
- 对海军遂行护航任务中法律问题的思考
- 国家安全监管总局关于公布第二批重点监管危险化工工艺目录调整首批重点监管危险化工工艺中部分典型工艺通知
- 生化试题库第一套试卷
- 2019二年级语文下册课文620《蜘蛛开店》教案1新人教版
- 单证类