抽样技术课后习题答案

更新时间:2023-12-08 20:47:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 定义 抽样理论 概率统计 1ny??yini?11ny??yi ni?1 11.期望Ey??y?i?P?i???y?i?n?Y CNi?1i?12.方差Vy?性质 ??nCNnCN?1n?1n1.期望Ey?E??yi???E?yi? ?ni?1?ni?1??????y???Ey???P?? iiii?1nCN2 ?1?n???? n ? ?1??y?Ey?????Ciii?1nCN22.方差V?y??Eyi?? ??2nN?1?f?S2 n?1n? ?E??yi??? ?ni?1?1?22 ?E?yi???? nn 2 2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y?9.5(千瓦时),s?206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,y?9.5,s?206

22?)?v(Ny)?N V(Y

21?f2s?500002n1?30050000*206?1706366666 300v(y)?1706366666?41308.19

1

该市居民用电量的95%置信区间为

[[Ny?z?V(y)]=[475000±1.96*41308.19]

2即为(394035.95,555964.05) 由相对误差公式

u?2v(y)y≤10%

可得1.96*1?n50000*206?9.5*10%

n即n≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

n?0.02 N??1?f 又有:E(p)?E(p)?p?0.35 V(p)? p(1?p)?0.0012n?1解析:由已知得:N?10000 n?200 p?0.35 f?该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:[E(P)?Z?V(P)]

2??代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 1 2 3 4 5 6 7 8 9 10

文化支出 200 150 170 150 160 130 140 100 110 240

编号 11 12 13 14 15 16 17 18 19 20

文化支出 150 160 180 130 100 180 100 180 170 120

估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。 解析:由已知得:N?200 n?20

2

120yi?144.5 根据表中数据计算得:y??20i?12120y?y?827.06842 s??i20?1i?12?? V(y)?? 该小区平均文化支出Y的95%置信区间为:[y?z1n (1?)s2?37.21808 V(y)?6.1001 5nN?2

V(y)]即是:[132.544 ,156.456]

故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544 ,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到

2,S?2560,据此估计该地区今年的粮食总产量,并给出置信水平95%的y=1120(吨)

置信区间。

解析:由题意知:y=1120 f?n50??0.1429 S2?2560?s?160 N350 置信水平95%的置信区间为:[y?z?21?fs] 代入数据得: n置信水平95%的置信区间为:[1079.872,1160.872]

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S?68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?

2NZ?S2解析:简单随机抽样所需的样本量n1?22Nd2?Z?S222 n2?n1 70% 由题意知:N?1000 d?2 S?68 代入并计算得:n1?61.3036?61

2Z??1.962

n2?n1?87.142?8770%

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y?25,这些企业去年的平均产量为x?22。试估计今年该地区化肥总产量。

3

解析:由题可知x?22,

X?X2135??21.35N100,y?25

?则,该地区化肥产量均值Y的比率估计量为

Y?Xy25?21.35?24.2624x

??100*24.26?2426??NYYR 该地区化肥产量总值Y的比率估计量为

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 1 2 3 4 5 6 7 8 9 10 文化支出 200 150 170 150 160 130 140 100 110 140 总支出 2300 1700 2000 1500 1700 1400 1500 1200 1200 1500 编号 11 12 13 14 15 16 17 18 19 20 文化支出 150 160 180 130 150 100 180 100 170 120 总支出 1600 1700 2000 1400 1600 1200 1900 1100 1800 1300 全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

1n1x??xi?(2300?1700???1300)?1580ni?120解析:由题可知

y?144.5

??r?y?144.5??0.091Rx1580 y144.5yR?X?1600*?146.329x1580 又

1nS?(yi?y)2?826.053?n?1i?1

2Sxy

1n??(yi?y)(xi?x)?3463.158n?1i?1 1n?(xi?x)2?8831.579?n?1i?1

4

Sx

2 故平均文化支出的95%的置信区间为

[yR?Z?21?f21?f2?S?R?2S2),y?Z?S?R?2S2)](S?2R(S?2RyxxR?2yxxnn

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:

单位:千克 编号 1 2 3 4 5 6 7 8 9 10 原重量 95 97 87 120 110 115 103 102 92 105 现重量 150 155 140 180 175 185 165 160 150 170 用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

1n1?102.6 解:由题可知,x??xi?(95???105)ni?1101n1150??170)?163 y??yi?(ni?1101n12S?(y?y)?*1910?212.222 ?in?1i?192 Sxy1n1?(y?y)(x?x)?*1317?146.333 ?iin?1i?191n1?(xi?x)2?*926.4?106.933 ?n?1i?19 Sx2 故有?0?SxySx2?146.333?1.368

106.933 所以总体均值Y的回归估计量为

5

ylr?y??0(X?x)?163?1.368*(100?102.6)?159.443 其方差估计为:

?(y)?1?f(S2??2S2?2?S)Vlr0x0xyn101?120(212.222?1.3682*106.933?2*1.368*146.333) =

10=1.097

而V?(y)?1?fnS2 =

1?1012010*212.222 =19.454

显然V?(ylr)?V?(y) 所以,回归估计的结果要优于简单估

6

第三单元习题答案(仅供参考) 1解:(1)不合适

(2)不合适 (3)合适 (4)不合适

2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。 3.根据表中调查数据,经计算,可得下表: h 1 2 3 总计 10 10 10 30 256 420 168 844 0.3033 0.4976 0.1991 1 0.0391 0.0238 0.0595 11.2 25.5 20 10710 3360 16937.2 2867.2 94.4 302.5 355.6 错误!未找到引用源。=错误!未找到引用源。=20.1 V(错误!未找到引用源。)=错误!未找到引用源。-错误!未找到引用源。 =9.7681-0.2962 =9.4719

错误!未找到引用源。=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n=错误!未找到引用源。=185.4407错误!未找到引用源。185 错误!未找到引用源。=n错误!未找到引用源。=56,错误!未找到引用源。=92,错误!未找到引用源。=37

按内曼分配:n=错误!未找到引用源。=175

错误!未找到引用源。=33,错误!未找到引用源。=99,错误!未找到引用源。=43

4.根据调查数据可知: h 1 2 3 4 5 6 0.18 0.21 0.14 0.08 0.16 0.22 0.9 0.933 0.9 0.867 0.933 0.967 错误!未找到引用源。=错误!未找到引用源。=0.924

根据各层层权错误!未找到引用源。及抽样比错误!未找到引用源。的结果,可得 错误!未找到引用源。(错误!未找到引用源。)=错误!未找到引用源。=0.000396981 错误!未找到引用源。=1.99%

错误!未找到引用源。估计量的标准差为1.99%,比例为9.24% 按比例分配:n=2663

错误!未找到引用源。=479,错误!未找到引用源。=559,错误!未找到引用源。=373,错误!未找到引用源。=240,错误!未找到引用源。=426,错误!未找到引用源。=586

7

内曼分配:n=2565

错误!未找到引用源。=536,错误!未找到引用源。=520,错误!未找到引用源。=417,错误!未找到引用源。=304,错误!未找到引用源。=396,错误!未找到引用源。=392 5.解:由题意,有

错误!未找到引用源。=错误!未找到引用源。=75.79

错误!未找到引用源。购买冷冻食品的平均支出为75.79元 又由V(错误!未找到引用源。)=错误!未找到引用源。+错误!未找到引用源。 又n=错误!未找到引用源。

错误!未找到引用源。V(错误!未找到引用源。)=53.8086 错误!未找到引用源。=7.3354

错误!未找到引用源。95%的置信区间为[60.63,90.95]。 7.解:(1)对 (2)错 (3)错 (4)错 (5)对 8.解:(1)差错率的估计值错误!未找到引用源。=错误!未找到引用源。70%+错误!未找到引用源。30%=0.027

估计的方差v(错误!未找到引用源。)=错误!未找到引用源。=3.1967错误!未找到引用源。

标准差为S(错误!未找到引用源。)=0.0179。

(2)用事后分层的公式计算差错率为错误!未找到引用源。=错误!未找到引用源。=0.03 估计的方差为;v(错误!未找到引用源。)=错误!未找到引用源。-错误!未找到引用源。=2.5726错误!未找到引用源。 9.解:(1)所有可能的样本为: 第一层 第二层 3,5 3,10 5,10 0,3 0,6 3,6 8,15 8,25 15,25 6,9 6,15 9,15 (2)用分别比估计,有错误!未找到引用源。=0.4,错误!未找到引用源。=0.65,所以用分别比估计可计算得错误!未找到引用源。=6.4。

用联合比估计,有错误!未找到引用源。=0.5,错误!未找到引用源。=0.625,所以用联合比估计可计算得错误!未找到引用源。=6.5。

第四章习题

4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群

10户,现随机抽取4个群,取得资料如下表所示:

8

群 1 2 3 4 各户订报数yij 1,2,1,3,3,2,1,4,1,1 1,3,2,2,3,1,4,1,1,2 2,1,1,1,1,3,2,1,3,1 1,1,3,2,1,5,1,2,3,1 yi 19 20 16 20 试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。 解:由题意得到N?400,n?4,M?10,f?n4??0.01 N400?1故Y?y?Mn?i?1nyi?19?20?16?20?1.875(份)

10?4y?M?y?10?1.875?18.75(份) ??M?N?y?10?400?7500(份) Y2sbM?n?1?(yi?1ni?y)2

n1?f21?f1v(y)?sb?nMnM2n?1?(yi?1i?y)2

1?0.01(19?18.75)2???(20?18.75)2 ??24?14?10?0.00391875

?)?N2M2v(y)?4002?102?0.00391875?62700 v(Y于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。

该辖区总的订阅份数为7500,估计量方差为62700。

9

4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单

随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:

单位 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 总人数 51 62 49 73 101 48 65 49 73 61 58 52 65 49 55 赞成人数 42 53 40 45 63 31 38 30 54 45 51 29 46 37 42 (1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。

(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不

超过8%,则应抽取多少个单位做样本?

解:题目已知N?87,n?15,f?1)由已知估计同意改革的比例

n15 ?N87??p?yi?1ni?1ni?i?M1M?nni?1646?0.709 911?Mi?60.733

n11?f1?)?2v(pnn?1M此估计量的标准差为

?(yi?1i?Mi)2?0.008687 ?p?)?v(p?)?0.008687?0.9321 s(p

10

本文来源:https://www.bwwdw.com/article/v2ut.html

Top