抽样复习题-2013(下)(2)

更新时间:2024-03-16 19:38:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《抽样调查》复习题

概述

1.1 结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由; 1.研究居住在某城市所有居民的食品消费结构;抽样调查

2.调查一个县各村的粮食播种面积和全县生猪的存栏头数;全面调查 3.为进行治疗,调查一地区小学生中患沙眼的人数;全面调查 4.估计一个水库中草鱼的数量;抽样调查

5.某企业想了解其产品在市场的占有率;抽样调查 6.调查一个县中小学教师月平均工资。全面调查 1.2 结合习题1.1的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。 答:全面调查:是一种有策划、有方法、有程序的活动,调查的结果一般表现为搜集的数据。

抽样调查:为某一特定目的而对部分考查对象进行的调查

1.3 某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。

试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?

答:属于抽样调查,属于概率抽样,每一个样本单元被选中入样的概率是已知的。

1.5 结合习题1.3的讨论,根据你的理解什么是概率抽样?什么是非概率抽样?它们各有什么优点?

答:非概率抽样:

优点:操作简单,调查数据的处理较容易,省时,省费用。

概率抽样:根据随机原则,按照事先设计的程序,从总体抽取部分单元的抽样方法(要求每一个样本单元被选中入样的概率是已知的)

优点: 1.6抽样调查的特点。

答:1、节约费用 2、时效性强 3、完成全面调查不能胜任的项目 4、有助于提高数据质量

抽样调查基本原理

2.1 试说明以下术语或概念之间的关系与区别;

1.总体、样本与个体;总体:是指所要研究对象的全体,它由研究对象中所有性质相同的个体组成,组成总体的各个个体称为总体单元或单位。

抽样总体:是指从中抽取样本的总体。

2.总体与抽样框;

总体与抽样框应保持一致

抽样框:是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按照一定的随机化程序进行抽样。抽样总体的具体表现是抽样框。

3.个体、抽样单元与抽样框。

抽样单元是构成抽样框的基本要素,抽样单元可以只包含一个个体,也可以包含若干个个体,抽样单元还可以分级。

2.2 试说明以下术语或概念之间的关系与区别;

1.均方误差、方差与偏倚;

2???V(?)?E??E(?)

方差:

????B(?)?[E(?)??]偏倚:

?????)????E??MSE(?V(?)?B(?)??均方误差:

22

2.方差、标准差与标准误;

N?n21?f2??Vy?S?SNnn 方差:

3.无偏估计、祥和估计量与可用估计量;

4.绝对误差限、置信限(置信区间)与置信度。

2.3 从某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476

2

1.计算样本均值y与样本方差s;

2.若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3.根据上述样本数据,如何估计v(y)? 4.假定y的分布是近似正态的,试分别给出总体均值μ的置信度为90%,95%,的(近似)置信区间。

2.4 样本可能数目及其意义;

答:绝对误差

?)d?tV(?

V(??)r?t? 相对误差

均值估计时样本量n的确定

t2S2n0?2d (1) 按绝对误差d决定样本n

t2S2n0?2(rY)(2) 按相对误差r决定样本n

比例估计时样本量n的确定

t2P(1?P)n0?d2(1) 按绝对误差d决定样本n

t2P(1?P)n0?2(rP)(2)按相对误差r决定样本n

2.5 影响抽样误差的因素;

答:抽样误差:抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异。

估计量方差及估计量标准差都为抽样误差的表现形式。

2.6 抽样分布及其意义;

简单随机抽样

3.1设总体N=5,其指标值为{3,5,6,7,9}

1.从中抽取n=2的随机样本,分别计算不放回抽样的方差V(y); 3.按不放回抽样的分别列出所有可能的样本并计算y,验证E(y)=Y;

4. 按不放回抽样的所有可能的样本,计算其方差V(y),并与公式计算的结果进行比较; 5.对所有的可能样本计算样本方差s2,并验证在不放回的情况下:E(s2)= S2。

3.2 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公

顷的方形样地,测得这50块样地的平均储蓄量为9m3,标准差为1.63 m3,试以95%的置信度估计该林场的木材储蓄量。

3.3 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随

机抽样抽选了100户,得y=12.5,s2=1252。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?

3.4 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人

中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。

3.5 从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,

试以95%的置信度估计这批单据中有错误的比例。若已知这批单据共1000张,你的结论有何变化?若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样本?

3.6 欲调查二种疾病的发病率,疾病A的发病率较高,预期为50%;

疾病B的发病率预期为1%。若要得到相同的标准差0.5%,采用简单随机抽样各需要多大的样本量?试对上述不同的结果加以适当的说明。 3.7 简单随机抽样中样本量确定的原则及主要考虑因素; 3.8 总体方差的预先确定思路。

分层抽样

4.1 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料: 工人 N1=132 S12=36 技术人员 N2=92 S22=25 行政管理人员 N3=27 S32=9 若样本量n=30,试用奈曼分配确定各层的样本量。

nh?n?WhSh?WShh?1k?n?hNhSh?NShh?1kh

4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下: 工人 技术人员 行政管理人员 8,24,0,0,16,32, 4,5,0,24,8,12,3,2,1,8 6,0,16,7,4,4,9,5,1,8 8,18,2,0 试估计总的工时损失数并给出它的置信度为95%的置信区间。

4.3调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据 层 1 2 3 4 村总数 1411 4705 2558 14997 样本村养牛头数 1 2 3 4 5 6 7 8 9 10 43 84 98 0 10 44 0 124 13 0 50 147 62 87 84 158 170 104 56 160 228 262 110 232 139 178 334 0 63 220 17 34 25 34 36 0 25 7 15 31 (h?1,2,?,L)要求:

?)Y? (1) 估计该地区养牛总头数Y及其估计量的相对标准误差s(Y(2) 讨论分层抽样与不分层抽样比较效率有否提高。 (3) 若样本量不变采用乃曼分配可以减少方差多少? 4.5用下面的工厂分组资料 按工人人数分组 工厂数目 每工厂产值(万元) 标准差 1—49 50—99 100—249 250—999 1000人以上 18260 4315 2233 1057 567 100 250 500 1760 2250 80 200 600 1900 2500 若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率: (1) 按工厂数多少分配样本; (2) 按奈曼分配。

4.6 设费用函数具有形式CT?c0?c?h?1Lhnh,其中c0,ch(h=1,…,L)均为已知数。

22WS23试证明当总的费用固定时,为了使V(yst)达到最小,nh必与(hh)成比例。

ch4.7 怎样分层能提高精度?

4.8 总样本量在各层间分配的方法有哪些? 答:按比例分配、 按最优分配、按奈曼分配 4.9 分层的原则及其意义。 答:若分层的目的为了便于组织或估计子总体的参数,则分层按自然或单元的类型来划分。若分层的目的为了提高抽样效率,则分层的主要原则为:层内方差尽量小,而层间方差尽量大。

比估计与回归估计

5.1 对以下假设总体(N=6) Xi Yi U1 U2 U3 U 4 U 5 U6 0 1 3 5 8 10 1 3 11 18 29 46 (1) 用简单随机抽样抽取n=2的样本,列出所有可能的样本计算每个样本的R。R是不是无偏的?若有偏,偏倚多大?

(2) 若用n=2的简单样本去估计总体总量Y,试比较比估计与简单估计的方差。

5.2 欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出yi与总收入xi的数据如下表: 样本户 1 2 3 4 5 6 7 8 9 10 总收入xi 25100 32200 29600 35000 34400 26500 28700 28200 34600 32700 食品支出yi 3800 5100 4200 6200 5800 4100 3900 3600 3800 4100 11 12 13 14 31500 30600 27700 28500 4500 5100 4200 4000 要求估计食品支出占收入比重的95%置信度的置信区间。 5.3某乡欲估计今年的小麦总产量,全县共有123个村,按简单随机抽样抽取13个村作为样本,取得资料如下: 样本村 1 2 3 4 5 6 7 8 9 10 11 12 13 去年的小麦产量(百斤) 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 今年的小麦产量(百斤) 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 (1) 若已知去年的小麦总产量为128200(百斤),采用比估计法估计今年的小麦总产量

和置信度为95%的置信区间。

(2) 估计每个村的平均小麦产量及估计的相对标准差。 5.6 回归估计、比估计与简单估计间的区别; 5.7 辅助变量的选择原则;

5.8 分别比估计与联合比估计间的区别; 5.9分别回归估计与联合回归估计间的区别;

本文来源:https://www.bwwdw.com/article/zdi8.html

Top