抽样调查期末复习题

更新时间:2023-12-06 06:24:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1、简答题

1. 为什么分层抽样常在全国范围抽样调查中被采用? 答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行推算。 (3分)

(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。(3分)

(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2分)

(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。

2. 整群抽样的优缺点是什么?

答:整群抽样可以简化抽样框的编制。

样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。

3. 简述分层的原则及如何选择分层标志?

答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差异小”。

最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一个变量。

4. 为什么多阶抽样常在大型抽样调查中被采用? 答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时又避免了对小单元过多调查造成的浪费,充分发挥抽样调查的优点。(2)由于多阶抽样是分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。所以多阶抽样常用于大范围的且抽样单元为各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。

2、 简单随机抽样

【例1.1】 我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。如表

简单随机样本的指标值 1 2 3 4 5 6 7 8 9 10 序号i yi

4 5 2 0 4 6 6 15 0 8 解:依题意。N=100,n=10,f?10?0.1 100计算样本均值及样本方差为:

1n50 y??yi??5

ni?1101n1722s?(y?y)??19.11 ?in?1i?192因此对总体平均水平的估计为:

??y?5 Y对的方差及标准差的估计为:

1?f21?0.1?)v(Y?S??19.11?1.72n10

?)?v(Y?)?1.3115s(Y由置信度95%对应的t=1.96,因此,可以以95%的把握说总体平均水平大约在

5?1.96?1.3115之间,即2.4295~7.570之间。

【例1.2】(续例1.1)如果采取放回抽样,则相应结果为多少?

1n501n17222解:由上例知y??yi??5,s?(y?y)??19.11 ?ini?110n?1i?19v(y)?121S??19.11?1.911n10

s(y)?v(y)?1.3824由置信度95%对应的u1??/2?1.96,因此,可以以95%的把握说总体平均水平大约在5?1.96?1.3824即[2.2905,7.7095]之间。

【例1.3】某销售公司希望了解全部3 000家客户对该公司的综合满意程度,决定用电话来调查一个简单随机样本。这时,销售公司希望以95%的把握保证客户满意的总体比例P在样本比例p±10%的范围内,但对总体比例P无法给出一个大致的范围。这时,应该调查多少个客户,才能保证对总体比例估计的要求?(P30)

解:由该问题给出的条件:N=3 000,d=10%=0.1,置信度95%,对应的u1??/2?1.96,由于无法得到P的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的n:

u12??/2S21.96?0.5?0.5n???9622 d0.1【例1.4】某居民区共10000户,欲估计该居民区的用水量。采用简单随机抽样抽选了100户,得样本均值为12.5吨,样本方差为1252吨。

(1)估计该居民区的总用水量的置信度95%的置信区间。

(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20%,试问应抽多少户作样本?(P31) 解:(1)

??Ny?125000Y 1?f?s(Y)?Ns(y)?Ns?35206.25nY的置信度为95%的置信区间为: ????????Y?us(Y),Y?us(Y)?55995.75,194004.25????1?1?22??或

??Ny?125000Y 1?fs?s(Y)?Ns(y)?Ns?N?35383.612nn(2)

Y的置信度为95%的置信区间为: ??????.12,194351.88??Y?u1??s(Y),Y?u1??s(Y)???5564822??u1??/2s2n0??769.5?7702(ry) n0n??714.9?715n01?N

23、不等概率抽样

【例2.1】 某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表6.3。已知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总头数

某县养猪专业户年生猪出栏头数调查样本资料 (单位: 头)

i 1 2 3 4 mi 15 23 9 29 yi 75 134 37 152 i 11 12 13 14 mi 40 32 17 26 yi 258 186 69 156 i 21 22 23 24 mi 19 26 37 21 yi 124 160 215 104 5 6 7 8 9 10 注:

8 31 24 29 13 19 45 185 133 173 74 87 15 16 17 18 19 20 11 36 25 5 38 42 49 221 145 33 288 304 25 26 27 28 7 43 18 30 49 336 96 177 i表示养猪专业户样本编号,mi表示各专业户生猪上年末存栏数,yi表示各专业户调查年生猪出栏头数,

其中第2、19号专业户被抽中两次.

解:根据题中所给资料,n?30,M0?9542

?YHHM0nyi954275134??(??2??ni?1mi301523?)?v(YHHnyi?21(?YHH)?n(n?1)i?1zi?2M0nyiY?(?HH)?n(n?1)i?1miM0?177)?56163(头)(P56 30,3.1.2)

9542275561632134561632?[(?)?(?)?2?30?29159542239542?2806070?)?v(Y?)?1575(头) (P58,3.1.5) se(YHHHH

177561632?(?)]3095424、分层随机抽样

【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的置信度为90%的置信区间。(P75)

解:根据已知条件有:W1=23560148420=0.1370,W2??0.8630171980171980Lh?1yst??Whyh?W1y1?W2y2?0.1370?15180?0.8630?9856?10585.39v(yst)=?Wi2i?121?fi2si=20260.6756niv(yst)?142.34(元)故全市年平均户收入的置信度为90%的置信区间为:??y?us(y),y+us(y)10585.39?1.645?142.34],即?10351.24,10819.54??st?stst?st?=[1?1?22??

【例3.2】在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。调查结果如表所示。试以95% 的置信度估计总体中会计算机者占的比例。(P75)

计算机使用情况调查 层 30岁以下 30~35岁 36~40岁 41~45岁 45岁以上 总计 解:由表中数据得到:

人数 7781 7497 9779 4627 5366 35050 入样人数 71 68 89 42 50 320 样本中会使用计算机的人数 24 12 22 11 4 p1?0.3380,p2?0.1765,p3?0.2472,p4?0.2620,p5?0.0800,5W1?0.2220,W2?0.2139,W3?0.2790,W4?0.1320,W5?0.1531则pst??Whph?0.2286h?1

由于抽样比很小,故可以忽略不计。估计量的方差为v(pst)??Wh(1?fh)2h?15

ph(1?ph)?0.000534nh?1P置信度为95%的置信区间为: ???pst?u1??v(pst),pst?u1??v(pst)???18.33%,27.39%?22??

本文来源:https://www.bwwdw.com/article/sbrt.html

Top