抽样技术课后习题 - 参考答案 - 金勇进

更新时间:2024-03-13 16:16:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r。然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 抽样理论 概率统计 定义 1ny??yi ni?1y?1n?yini?1 11.期望Ey??y?i?P?i???y?i?n?Y CNi?1i?12.方差Vy??y?i??Ey?i?P?i? i?1??nCNnCN?1n?1n1.期望Ey?E??yi???E?yi? ?ni?1?ni?1????nCN??i2 ?1?n???? n性质 ? ?1??y?Ey?????Cii?1nCN22.方差V?y??Eyi?? nN??2 ?1?f?S2 n?1n? ?E??yi??? ?ni?1?1?22 ?E?yi???? nn2 2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y?9.5(千瓦时),s2?206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,y?9.5,s2?206

2?)?v(Ny)?N21?fs2?50000V(Yn1?30050000*206?1706366666 300 v(y)?1706366666?41308.19 该市居民用电量的95%置信区间为

[[Ny?z?V(y)]=[475000±1.96*41308.19]

2即为(394035.95,555964.05) 由相对误差公式

u?2v(y)y≤10%

可得1.96*1?n50000*206?9.5*10% n即n≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

n解析:由已知得:N?10000 n?200 p?0.35 f??0.02

N??1?fp(1?p)?0.0012 又有:E(p)?E(p)?p?0.35 V(p)?n?1该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:

[E(P)?Z?V(P)]

2??代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 1 2 3 4 5 6 7 8

文化支出 200 150 170 150 160 130 140 100

编号 11 12 13 14 15 16 17 18

文化支出 150 160 180 130 100 180 100 180

9 10 110 240 19 20 170 120

估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。 解析:由已知得:N?200 n?20

120 根据表中数据计算得:y??yi?144.5

20i?12120 s?y?y?827.06842 ?i20?1i?12?? V(y)?? 该小区平均文化支出Y[132.544 ,156.456]

1n(1?)s2?37.21808 V(y)?6.10015 nN2的95%置信区间为:[y?z?V(y)]即是:

故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544 ,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y=1120(吨),S2?25600,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。 解析:由题意知:y=1120 f?n50??0.1429 S2?25600?s?160 N350 置信水平95%的置信区间为:[y?z?21?fs] 代入数据得: n置信水平95%的置信区间为:[1079.872,1160.872]*350

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S2?68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?

NZ?S22解析:简单随机抽样所需的样本量n1?2Nd2?Z?S222 n2?n1 70% 由题意知:N?1000 d?2 S?68 代入并计算得:n1?61.3036?61

n2?2Z??1.962

n1?87.142?8770%

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y?25,这些企业去年的平均产量为x?22。试估计今年该地区化肥总产量。

X?X2135??21.35N100,y?25

?解析:由题可知x?22,

则,该地区化肥产量均值Y的比率估计量为

Y?Xy25?21.35?24.2624x

??100*24.26?2426??NYYR 该地区化肥产量总值Y的比率估计量为 所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 文化支出 总支出 编号 文化支出 总支出 1 200 2300 11 150 1600 2 150 1700 12 160 1700 3 170 2000 13 180 2000 4 150 1500 14 130 1400 5 160 1700 15 150 1600 6 130 1400 16 100 1200 7 140 1500 17 180 1900 8 100 1200 18 100 1100 9 110 1200 19 170 1800 10 140 1500 20 120 1300 全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

1n1x??xi?(2300?1700???1300)?1580ni?120解析:由题可知

y?144.5

??r?y?144.5??0.091Rx1580

yR?Xy144.5?1600*?146.329x1580

1nS?(yi?y)2?826.053?n?1i?1

2

Sxy1n??(yi?y)(xi?x)?3463.158n?1i?1 1n2?(x?x)?8831.579?in?1i?1

Sx2 故平均文化支出的95%的置信区间为

[yR?Z?21?f21?f2?S?R?2S2),y?Z?S?R?2S2)](S?2R(S?2RyxxR?2yxxnn

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:

单位:千克 编号 原重量 现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10 105 170 用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

1n1解:由题可知,x??xi?(95???105)?102.6

ni?1101n1 y??yi?(150??170)?163

ni?1101n12S?(y?y)?*1910?212.222 ?in?1i?192 Sxy1n1?(y?y)(x?x)?*1317?146.333 ?iin?1i?19

Sx21n1?(xi?x)2?*926.4?106.933 ?n?1i?19 故有?0?SxySx2?146.333?1.368

106.933 所以总体均值Y的回归估计量为

ylr?y??0(X?x)?163?1.368*(100?102.6)?159.443 其方差估计为:

?(y)?1?f(S2??2S2?2?S)Vlr0x0xyn101?=120(212.222?1.3682*106.933?2*1.368*146.333)

10=1.097 1?f2?(y)?S 而Vn

1?10120*212.222 =

10 =19.454

?(y)?V?(y) 显然Vlr所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适

2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。 3.根据表中调查数据,经计算,可得下表: h 1 2 3 总计 =

10 10 10 30 256 420 168 844 =20.1

0.3033 0.4976 0.1991 1 0.0391 0.0238 0.0595 11.2 25.5 20 2867.2 10710 3360 16937.2 94.4 302.5 355.6 V()=-

=9.7681-0.2962 =9.4719

=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n=

=185.4407185

=n=56,=92,=37

按内曼分配:n==175

=33,=99,=43

4.根据调查数据可知: h 1 2 3 4 5 6 =

=0.924

0.18 0.21 0.14 0.08 0.16 0.22 0.9 0.933 0.9 0.867 0.933 0.967 根据各层层权及抽样比的结果,可得

()==0.000396981

=1.99%

估计量的标准差为1.99%,比例为9.24% 按比例分配:n=2663

=479,

=559,

=373,

=240,

=426,

=586

内曼分配:n=2565

=536,

=520,

=417,

=304,

=396,

=392

5.解:由题意,有 =

=75.79

购买冷冻食品的平均支出为75.79元

又由V()=+

又n=

V()=53.8086

=7.3354

95%的置信区间为[60.63,90.95]。 7.解:(1)对 (2)错 (3)错 (4)错 (5)对

8.解:(1)差错率的估计值=

70%+

30%=0.027

估计的方差v()==3.1967

标准差为S()=0.0179。

(2)用事后分层的公式计算差错率为==0.03

估计的方差为;v()=-=2.5726

9.解:(1)所有可能的样本为: 第一层 第二层 3,5 3,10 5,10 0,3 0,6 3,6 =0.4,

8,15 8,25 15,25 6,9 6,15 9,15 (2)用分别比估计,有=0.65,所以用分别比估计可计算得=6.4。

用联合比估计,有

=0.5,=0.625,所以用联合比估计可计算得=6.5。

第四章习题

4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个

群,每群10户,现随机抽取4个群,取得资料如下表所示: 群 各户订报数yij yi 1 1,2,1,3,3,2,1,4,1,1 19 2 1,3,2,2,3,1,4,1,1,2 20 3 2,1,1,1,1,3,2,1,3,1 16 4 1,1,3,2,1,5,1,2,3,1 20 试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。 解:由题意得到N?400,n?4,M?10,f??1故Y?y?Mnn4??0.01 N400?i?1nyi?19?20?16?20?1.875(份)

10?4y?M?y?10?1.875?18.75(份)

??M?N?y?10?400?7500(份) Y2sbM?n?1?(yi?1ni?y)2

n1?f21?f1v(y)?sb?nMnM2n?1?(yi?1i?y)2

1?0.01(19?18.75)2???(20?18.75)2??

4?14?102?0.00391875

?)?N2M2v(y)?4002?102?0.00391875?62700 v(Y于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为

0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。

4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽

样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下: 单位 总人数 赞成人数 1 51 42 2 62 53 3 49 40 4 73 45 5 101 63 6 48 31 7 65 38 8 49 30 9 73 54 10 61 45 11 58 51 12 52 29 13 65 46 14 49 37 15 55 42 (1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。 (2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允

许误差不超过8%,则应抽取多少个单位做样本?

解:题目已知N?87,n?15,f?1)由已知估计同意改革的比例

n15 ?N87??p?yi?1ni?1ni?i?M1M?nn646?0.709 911?Mi?1i?60.733

11?f1n?)?2?Mi)2?0.008687 v(p(yi?pnn?1i?1M?此估计量的标准差为

?)?v(p?)?0.008687?0.9321 s(p

4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员

欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料: 抽屉编号 票据数Mi 费用额(yi,百元) 1 42 83 2 27 62 3 38 45 4 63 112 5 72 96 6 12 58 7 24 75 8 14 58 9 32 67 10 41 80 要求以95%的置信度估计该集团办公费用总支出额度置信区间(?=0.05)。

nnn10解:已知N=48, n=10, f=?, 由题意得?yi?736,?Mi?365,

N48i?1i?1Nn48?则办公费用的总支出的估计为Y??yi??736?3532.8(元)

ni?1101n1群总和均值y??yi??736?73.6(元)

ni?110?)?N(1?f)?v(Yn2?(yi?1ni?y)2n?1

10)(83?73.6)2?(62?73.6)2?...?(80?73.6)248= ?1091= 182.4??3590.4

9= 72765.44 482?(1??)=269.7507 v(Y?的置信度为95%的置信区间为3532.8?1.96?269.7507,即[3004.089,则Y4061.511].

4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,

从中抽出20个小区域,测量树的高度,得到如下资料: 数目株数平均高度数目株数平均高度区域编号 区域编号 Mi Mi yi(尺) yi(尺) 1 2 3 4 5 6 7 8 9 10 42 51 49 55 47 58 43 59 48 41 6.2 5.8 6.7 4.9 5.2 6.9 4.3 5.2 5.7 6.1 11 12 13 14 15 16 17 18 19 20 60 52 61 49 57 63 45 46 62 58 6.3 6.7 5.9 6.1 6.0 4.9 5.3 6.7 6.1 7.0 估计整个林区树的平均高度及95%的置信区间。

解:由已知得N?386,n?20,f?n20??0.0518 N3866180.8?5.909 1046整体的平均高度Y?y???Mi?1ni-1niyi?i?M1M?n?Mi?1ni?52.3

n方差估计值v(Y)?v(y)??0.02706

?1?fnM2?(yi?1i?Miy)2n?1

标准方差s(Y)?v(Y)?0.02706?0.1644

在置信度95%下,该林区的树木的平均高度的置信区间为

??(Y?t?/2?s(Y))?(5.909?1.96?0.1644)?(5.5868,6.2312)

??4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女

生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表: 样本宿舍 拍照人数 样本宿舍 拍照人数 1 2 6 1 2 0 7 0 3 1 8 1 4 2 9 1 5 1 10 0 试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。 解:题目已知N?200,n?10,M?6,m?3,f1?n10m??0.05,f2??0.5 N200M??p?yi?1ninm?9?0.3 10?311?f1?)?2?v(p?nn?1m?(yi?1ni?p?m)?0.005747

?)?v(p?)?0.005747?0.0758 s(p在置信度95%下,p的置信区间为

??t?/2v(p?))=(0.3?1.96?0.0758)?(0.151432,0.448568) (p

4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的

调查,宿舍间的标准差为S1=326元,宿舍内同学之间的标准差为S2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c1为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为c0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?

解:由已知条件得到以下信息:

S1?326(元)S2?188(元)c1?10(分钟)c2?1(分钟)c0?4?60?240(分钟) 由此得到

2S1?106276,

S22?35344,

S2u2S235344?S1??106276??100385.33

M6mopt?S2c18810?1???1.82 S1c23261因而取最优的m?2,进一步计算nopt 由于总时间的限制C?480,由关系式

C?c0?c1n?c2nm得到480?240?10nopt?2nopt

计算方程得到nopt?20,因而取n?20

则最优的样本宿舍数为20间,最优样本学生数为2。

本文来源:https://www.bwwdw.com/article/shl8.html

Top