抽样技术课后习题 参考答案 金勇进

更新时间:2023-08-15 11:21:01 阅读量: 人文社科 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

抽样技术课后习题 参考答案 金勇进

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r。然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同?

2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y 9.5(千瓦时),s2 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300, 9.5,s2 206

抽样技术课后习题 参考答案 金勇进

2 ) v(N) N21 fs2 50000V(Y

n

1

300

*206 1706366666 300

v( 41308.19 该市居民用电量的95%置信区间为

[[Ny z (y)]=[475000±1.96*41308.19]

2

即为(394035.95,555964.05) 由相对误差公式

u 2v()

≤10%

可得1.96*

n*206 9.5*10% n

即n≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

n

解析:由已知得:N 10000 n 200 p 0.35 f 0.02

N 1 f

p(1 p) 0.0012 又有:E(p) E(p) p 0.35 V(p)

n 1

该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:

[E(P) Z V(P)]

2

代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 1 2 3 4 5 6 7 8

文化支出 200 150 170 150 160 130 140 100

编号 11 12 13 14 15 16 17 18

文化支出 150 160 180 130 100 180 100 180

抽样技术课后习题 参考答案 金勇进

9 10 110 240 19 20 170 120

估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。 解析:由已知得:N 200 n 20

120

根据表中数据计算得:y yi 144.5

20i 1

2120

s y y 827.06842 i

20 1i 1

2

V(y)

该小区平均文化支出Y

[132.544 ,156.456]

1n

(1 )s2 37.21808 (y) 6.10015 nN

2

的95%置信区间为:[y z (y)]即是:

故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544 ,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y=1120(吨),S2 2560,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。 解析:由题意知:y=1120 f

n50

0.1429 S2 2560 s 160 N350

置信水平95%的置信区间为:[y z

2

f

s] 代入数据得: n

置信水平95%的置信区间为:[1079.872,1160.872]

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S2 68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?

NZ S2

2

解析:简单随机抽样所需的样本量n1

2

Nd2 Z S2

2

2

n2

n1

70%

由题意知:N 1000 d 2 S 68 代入并计算得:n1 61.3036 61

n2

2

Z 1.96

2

n1

87.142 8770%

抽样技术课后习题 参考答案 金勇进

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y 25,这些企业去年的平均产量为x 22。试估计今年该地区化肥总产量。

X2135 21.35N100, 25

解析:由题可知 22,

则,该地区化肥产量均值的比率估计量为

Y X

y25

21.35 24.26

24x

100*24.26 2426 NYR 该地区化肥产量总值Y的比率估计量为 所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:

置信水平95%的置信区间,并比较比估计和简单估计的效率。

1n1

xi 2300 1700 1300) 1580

ni 120解析:由题可知

144.5

r 144.5 0.091R

1580

R 144.5 1600* 146.3291580

抽样技术课后习题 参考答案 金勇进

1n

S (yi )2 826.053 n 1i 1

2

Sxy

1n

(yi )(xi ) 3463.158n 1i 1

1n2 (x ) 8831.579 i

n 1i 1

Sx

2

故平均文化支出的95%的置信区间为

[R Z 2

f2 f2

S R 2S2), Z S R 2S2)](S 2R(S 2RyxxR 2yxx

nn

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:

的结果进行比较。

1n1

解:由题可知, xi 95 105) 102.6

ni 110

1n1

yi 150 170) 163

ni 110

1n12

S (y ) *1910 212.222 i

n 1i 19

2

Sxy

1n1 (y )(x ) *1317 146.333 ii

n 1i 19

抽样技术课后习题 参考答案 金勇进

Sx

2

1n1 (xi )2 *926.4 106.933 n 1i 19

故有 0

SxySx

2

146.333

1.368

106.933

所以总体均值的回归估计量为

lr 0( ) 163 1.368*(100 102.6) 159.443 其方差估计为:

() 1 f(S2 2S2 2 S)Vlr0x0xy

n101

=(212.222 1.3682*106.933 2*1.368*146.333)

10=1.097 1 f2

() S 而V

n

1 *212.222 =

10 =19.454

() V () 显然Vlr

所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适

2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。

=

=20.1

抽样技术课后习题 参考答案 金勇进

V()=-

=9.7681-0.2962

=9.4719

=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n=

=185.4407

185

=n=56,=92,=37

按内曼分配:n=

=175

=33,=99,=43

=

=0.924

根据各层层权及抽样比的结果,可得

()==0.000396981

=1.99%

抽样技术课后习题 参考答案 金勇进

估计量的标准差为1.99%,比例为9.24% 按比例分配:

n=2663

=479,

=559,

=373,

=240,

=426,

=586

内曼分配:

n=2565

=536,

=520,

=417,

=304,

=396,

=392

5.解:由题意,有

=

=75.79

购买冷冻食品的平均支出为75.79元

又由V()=+

又n=

V()

=53.8086

=7.3354

95%的置信区间为[60.63,90.95]。 7.解:(1)对 (2)错 (3)错 (4)错 (5)对

8.解:(1)差错率的估计值=

70%+

30%=0.027

估计的方差v()==3.1967

抽样技术课后习题 参考答案 金勇进

标准差为S()=0.0179。

(2)用事后分层的公式计算差错率为==0.03

估计的方差为;v()=-=2.5726

=0.4,

(2)用分别比估计,有=0.65,所以用分别比估计可计算得=6.4。

用联合比估计,有

=0.5,=0.625,所以用联合比估计可计算得=6.5。

第四章习题

4.1

邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个

解:由题意得到N 400,n 4,M 10,f

1故

Mn

n4 0.01 N400

i 1

n

yi

19 20 16 20

1.875(份)

10 4

M 10 1.875 18.75(份)

M N 10 400 7500(份) Y

抽样技术课后习题 参考答案 金勇进

2sb

M

n 1

(i 1

n

i

)2

n

1 f21 f1v() sb

nMnM2n 1

(i 1

i

)2

1 0.01(19 18.75)2 (20 18.75)2

4 14 102

0.00391875

) N2M2v() 4002 102 0.00391875 62700 v(Y

于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为

0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。

抽样技术课后习题 参考答案 金勇进

4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽

样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政

(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允

许误差不超过8%,则应抽取多少个单位做样本?

解:题目已知N 87,n 15,f 1)由已知估计同意改革的比例

n15

N87

p

y

i 1

ni 1

n

i

i

M

1

n

n

646

0.709 911

M

i 1

i

60.733

11 f1n

) 2 Mi)2 0.008687 v(p(yi p

nn 1i 1

此估计量的标准差为

) v(p ) .008687 0.9321 s(p

抽样技术课后习题 参考答案 金勇进

4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员

欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整

)。

nn

n10

解:已知N=48, n=10, f= , 由题意得 yi 736, Mi 365,

N48i 1i 1

Nn48 则办公费用的总支出的估计为Y yi 736 3532.8(元)

ni 1101n1

群总和均值 yi 736 73.6(元)

ni 110

) N(1 f) v(Y

n

2

(y

i 1

n

i

)2

n 1

10)

(83 73.6)2 (62 73.6)2 ... (80 73.6)248=

109

1

= 182.4 3590.4

9

= 72765.44 482 (1

)=269.7507 v(Y

的置信度为95%的置信区间为3532.8 1.96 269.7507,即[3004.089,则Y

4061.511].

抽样技术课后习题 参考答案 金勇进

4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,

估计整个林区树的平均高度及95%的置信区间。

解:由已知得N 386,n 20,f

n20 0.0518 N3866180.8

5.909 1046

整体的平均高度

M

i 1ni-1

n

i

i

i

M

1M

n

M

i 1

n

i

52.3

n

方差估计值v() v()

0.02706

1 fn2

(y

i 1

i

Mi)2

n 1

标准方差s() v() 0.02706 0.1644

在置信度95%下,该林区的树木的平均高度的置信区间为

( t /2 s()) (5.909 1.96 0.1644) (5.5868,6.2312)

抽样技术课后习题 参考答案 金勇进

4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女

生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进

解:题目已知N 200,n 10,M 6,m 3,f1

n10m 0.05,f2 0.5 N200M

p

y

i 1

n

i

nm

9

0.3 10 3

11 f1 ) 2 v(p

nn 1m

(y

i 1

n

i

p m) 0.005747

) v(p) 0.005747 0.0758 s(p

在置信度95%下,p的置信区间为

t /2v(p ))=(0.3 1.96 0.0758) (0.151432,0.448568) (p

抽样技术课后习题 参考答案 金勇进

4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的

调查,宿舍间的标准差为S1=326元,宿舍内同学之间的标准差为S2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c1为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为c0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?

解:由已知条件得到以下信息:

S1 326(元)S2 188(元)c1 10(分钟)c2 1(分钟)c0 4 60 240

(分钟) 由此得到

2S1

106276,

S22

35344,

S2u

2

S235344 S1 106276 100385.33

M6

mopt

S2c18810

1 1.82 S1c23261

因而取最优的m 2,进一步计算nopt 由于总时间的限制C 480,由关系式

C c0 c1n c2nm得到480 240 10nopt 2nopt

计算方程得到nopt 20,因而取n 20

则最优的样本宿舍数为20间,最优样本学生数为2。

抽样技术课后习题 参考答案 金勇进

4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住

在10个单元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时

(1) 简单估计量 (2) 比率估计量

(3) 对两种估计方法及结果进行评价。 解:(1)简单估计

NYu

n

N

M ii

ni 1

n

Y

ii 1

n

10

(32 3.75 45 3.4 36 4.5 54 4.17) 4

=1650,

=

Y1650

则u u 3.3,

M0500

1n 1 又u Yi 660 165, ni 14

) 所以v(Yu分别计算

N2

) (Y (1 f)

i

u

1

i 1

n

2

nn 1

N

n

Mi(1 f2i)s2i

mi 1i

n

22

(Y )

i

u

i 1

n

2

n 1

5778 1926

3

1

[(120 165)2 (153 165)2 (162 165)2 (225 165)2]

3

抽样技术课后习题 参考答案 金勇进

Mi(1 f2i)s2i

mi 1i

n

22

322 (1

454

) 2.92452 (1 ) 2.8362 (1 ) 7 454

542 (1

6

) 2.2 4628.486

22n

Mi(1 f2i)s2i

mi i 1

n

)2 (Y iu2 1N(1 f1)i 1N v(u)

所以,M0 nn 1n

0.11556 0.046285 0.162

所以标准差s(u) v(u) 0.402 (2) 比率估计

n

R y

M

i 1

ni 1

i

i

i

M

N

2

32 3.75 45 3.4 36 4.5 54 4.17

3.9532

32 45 36 54

R) v(y

) (Y (1 f)

i

u

1

i 1

n

2

nn 1

NnMi(1 f2i)s2i

ni 1mi

22

Y其中R R

M0

M

i 1ni 1

n

i

i

i

M

R) v(y

)v(YRM0

2

0.0715

R) (yR) 0.0715 0.2647 s(y

R) 0.2647 (3) 简单估计标准差s(u) 0.402,比率估计标准差s(y

比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小

抽样技术课后习题 参考答案 金勇进

成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复: (1) 代码法:由Zi=

MiM

Ni可假设M0=1000000,则Mi=ZiM0列成数据表

M0

Mi

i 1

抽样技术课后习题 参考答案 金勇进

随机数为444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891按照范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组; 综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组

(2)拉希里法:M =78216,N=25,在[1, 25]和[1, 78216]中分别产生(n,m): (13,38678),M13=40654 38678,入样; (8, 57764),M8=38981<57764,舍弃,重抽; (23,13365),M23=9066<13365,舍弃,重抽; (19,38734),M19=69492 38734,入样;

以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为: 2,3,5,6,7,12 ,13,16, 19,24组 5.2解:

由数据可得:

t1= y1j=20, t2 y2j 25,t3=38, t4=24, t5=21;

j 1

j 1

Mi

M2

结合t值数据,我们可以推得Z的值 Z1=

M15

0.2,Z2=0.16,Z3=0.32,Z4=0.2,Z5=0.12, M025

抽样技术课后习题 参考答案 金勇进

由公式 ij

4ZiZj 1 Zi Zj

1 2Zi 1 2Zj 1

Zi

i 11 2Zi

N

5.3 解:

设:M0=1,则有:Mi Zi,得到下表:

为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。 5.4 解:

利用汉森-赫维茨估计量对总体总值进行估计:

抽样技术课后习题 参考答案 金勇进

YHH

1nyi1320120290 [ ] 2217.006ni 1Zi30.1380.0620.121yi 11n YHH nn 1i 1 Zi

1 320 [ 2217.006 60.138

2

2

2

2

v YHH

1 120 290

2217.006 2217.006 ] 10370.3 79254.7 32287.9

6 0.062 0.121

=20318.8

s YHH

v YHH 142.5

5.5解:由题可知

X0 Xi Xi=2+9+3+2+1+6=23

i 1

i 1

N

6

由 i n

Xi

得下表:

X0由上表显然有Zi<1/2,于是我们可以采用布鲁尔方法:

ij

4ZiZj 1 Zi Zj

N

Zi

1 2Zi

1 2Zj 1 1 2Z

i 1i

本文来源:https://www.bwwdw.com/article/y4xj.html

Top