抽样技术 - 第三版 - 全部课后答案

更新时间:2024-04-06 21:45:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r。然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 抽样理论 概率统计 定义 1ny??yi ni?1 nCNnCN11.期望Ey??y?i?P?i???y?i?n?Y CNi?1i?1???1n?1n1.期望Ey?E??yi???E?yi? ?ni?1?ni?1??2.方差Vy??y?i??Ey?i?P?i? i?1??nCN??i2 ?1?n???? n性质 ? ?1??y?Ey?????Cii?1nCN22.方差V?y??Eyi?? nN ?1?f?S2 n?1n? ?E??yi??? ?ni?1?1?22 ?E?yi???? nn 2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值y?9.5(千瓦时),s2?206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,y?9.5,s2?206

y?2??2?)?v(Ny)?N21?fs2?500002V(Yn1?30050000*206?1706366666 300 v(y)?1706366666?41308.19 该市居民用电量的95%置信区间为

[[Ny?z?V(y)]=[475000±1.96*41308.19]

2即为(394035.95,555964.05) 由相对误差公式

u?2v(y)y≤10%

可得1.96*1?n50000*206?9.5*10% n即n≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计在暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,试估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

n解析:由已知得:N?10000 n?200 p?0.35 f??0.02

N??1?f 又有:E(p)?E(p)?p?0.35 V(p)?p(1?p)?0.0012

n?1该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:

[E(P)?Z?V(P)]

2??代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 1 2 3 4 5 6 7 8

文化支出 200 150 170 150 160 130 140 100

编号 11 12 13 14 15 16 17 18

文化支出 150 160 180 130 100 180 100 180

9 10 110 240 19 20 170 120

估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。 解析:由已知得:N?200 n?20

120 根据表中数据计算得:y??yi?144.5

20i?12120 s?y?y?827.06842 ?i20?1i?12?? V(y)?? 该小区平均文化支出Y的

[132.544 ,156.456]

1n(1?)s2?37.21808 V(y)?6.10015 nN95%置信区间为:[y?z?V(y)]即是:

2故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为[132.544 ,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y=1120(吨),S2?2560,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。 解析:由题意知:y=1120 f?n50??0.1429 S2?2560?s?160 N3501?fs] 代入数据得: n 置信水平95%的置信区间为:[y?z?2置信水平95%的置信区间为:[1079.872,1160.872]

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差S2?68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?

NZ?S22解析:简单随机抽样所需的样本量n1?2Nd2?Z?S222 n2?n1 70% 由题意知:N?1000 d?2 S?68 代入并计算得:n1?61.3036?61

n2?2Z??1.962

n1?87.142?8770%

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到y?25,这些企业去年的平均产量为x?22。试估计今年该地区化肥总产量。

X?X2135??21.35N100,y?25

?解析:由题可知x?22,

则,该地区化肥产量均值Y的比率估计量为

Y?Xy25?21.35?24.2624x

??100*24.26?2426??NYYR 该地区化肥产量总值Y的比率估计量为

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 文化支出 总支出 编号 文化支出 总支出 1 200 2300 11 150 1600 2 150 1700 12 160 1700 3 170 2000 13 180 2000 4 150 1500 14 130 1400 5 160 1700 15 150 1600 6 130 1400 16 100 1200 7 140 1500 17 180 1900 8 100 1200 18 100 1100 9 110 1200 19 170 1800 10 140 1500 20 120 1300 全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

1n1x??xi?(2300?1700???1300)?1580ni?120解析:由题可知

y?144.5

??r?y?144.5??0.091Rx1580

yR?Xy144.5?1600*?146.329x1580

1nS?(yi?y)2?826.053?n?1i?1

2

Sxy1n??(yi?y)(xi?x)?3463.158n?1i?1 1n2?(x?x)?8831.579?in?1i?1

Sx2 故平均文化支出的95%的置信区间为

[yR?Z?21?f21?f2?S?R?2S2),y?Z?S?R?2S2)](S?2R(S?2RyxxR?2yxxnn

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:

单位:千克 编号 原重量 现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10 105 170 用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

1n1?102.6 解:由题可知,x??xi?(95???105)ni?1101n1150??170)?163 y??yi?(ni?1101n12S?(y?y)?*1910?212.222 ?in?1i?192 Sxy1n1?(y?y)(x?x)?*1317?146.333 ?iin?1i?19

某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下: 单位 总人数 赞成人数 1 51 42 2 62 53 3 49 40 4 73 45 5 101 63 6 48 31 7 65 38 8 49 30 9 73 54 10 61 45 11 58 51 12 52 29 13 65 46 14 49 37 15 55 42 (1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。 (2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允

许误差不超过8%,则应抽取多少个单位做样本?

解:题目已知N?87,n?15,f?1)由已知估计同意改革的比例

n15 ?N87??p?yi?1ni?1ni?i?M1M?nn646?0.709 911?Mi?1i?60.733

n11?f1?)?2v(pnn?1M?(yi?1i?Mi)2?0.008687 ?p此估计量的标准差为

?)?v(p?)?0.008687?0.9321 s(p

4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员

欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料: 抽屉编号 票据数Mi 费用额(yi,百元) 1 42 83 2 27 62 3 38 45 4 63 112 5 72 96 6 12 58 7 24 75 8 14 58 9 32 67 10 41 80 要求以95%的置信度估计该集团办公费用总支出额度置信区间(?=0.05)。

nnn10解:已知N=48, n=10, f=?, 由题意得?yi?736,?Mi?365,

N48i?1i?1??N则办公费用的总支出的估计为Yn?yi?i?1n48?736?3532.8(元) 101n1群总和均值y??yi??736?73.6(元)

ni?110?)?N(1?f)?v(Yn2?(yi?1ni?y)2n?1

10)(83?73.6)2?(62?73.6)2?...?(80?73.6)248= ?1091= 182.4??3590.4

9= 72765.44 482?(1??)=269.7507 v(Y?的置信度为95%的置信区间为3532.8?1.96?269.7507,即[3004.089,则Y4061.511].

4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,

从中抽出20个小区域,测量树的高度,得到如下资料: 数目株数平均高度数目株数平均高度区域编号 区域编号 Mi Mi yi(尺) yi(尺) 1 2 3 4 5 6 7 8 9 10 42 51 49 55 47 58 43 59 48 41 6.2 5.8 6.7 4.9 5.2 6.9 4.3 5.2 5.7 6.1 11 12 13 14 15 16 17 18 19 20 60 52 61 49 57 63 45 46 62 58 6.3 6.7 5.9 6.1 6.0 4.9 5.3 6.7 6.1 7.0 估计整个林区树的平均高度及95%的置信区间。

解:由已知得N?386,n?20,f?n20??0.0518 N3866180.8?5.909 1046整体的平均高度Y?y???Mi?1ni-1niyi?i?M1M?n?Mi?1ni?52.3

n方差估计值v(Y)?v(y)??0.02706

?1?fnM2?(yi?1i?Miy)2n?1

标准方差s(Y)?v(Y)?0.02706?0.1644

在置信度95%下,该林区的树木的平均高度的置信区间为

??(Y?t?/2?s(Y))?(5.909?1.96?0.1644)?(5.5868,6.2312)

??4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女

生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表: 样本宿舍 拍照人数 样本宿舍 拍照人数 1 2 6 1 2 0 7 0 3 1 8 1 4 2 9 1 5 1 10 0 试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。 解:题目已知N?200,n?10,M?6,m?3,f1?n10m??0.05,f2??0.5 N200M??p?yi?1ninm?9?0.3 10?311?f1?)?2?v(p?nn?1m?(yi?1ni?p?m)?0.005747

?)?v(p?)?0.005747?0.0758 s(p在置信度95%下,p的置信区间为

??t?/2v(p?))=(0.3?1.96?0.0758)?(0.151432,0.448568(p)

4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的

调查,宿舍间的标准差为S1=326元,宿舍内同学之间的标准差为S2=188元。以一位同学进行调查来计算,调查每个宿舍的时间c1为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为c0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?

解:由已知条件得到以下信息:

S1?326(元)S2?188(元)c1?10(分钟)c2?1(分钟)c0?4?60?240(分钟) 由此得到

2S1?106276,

S22?35344,

S2u2S235344?S1??106276??100385.33

M6mopt?S2c18810?1???1.82 S1c23261因而取最优的m?2,进一步计算nopt 由于总时间的限制C?480,由关系式

C?c0?c1n?c2nm得到480?240?10nopt?2nopt

计算方程得到nopt?20,因而取n?20

则最优的样本宿舍数为20间,最优样本学生数为2。

4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住

在10个单元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位): 单元i 居民人数Mi 样本量mi 健身锻炼时间yij 1 32 4 4,2,3,6 2 45 5 2,2,4,3,6 3 36 4 3,2,5,8 4 54 6 4,3,6,2,4,6 试估计居民平均每天用于锻炼的时间,并给出估计的标准差。 (1) 简单估计量 (2) 比率估计量

(3) 对两种估计方法及结果进行评价。 解:(1)简单估计

??NYunNMiyi??ni?1n?Y?

ii?1n10?(32?3.75?45?3.4?36?4.5?54?4.17) 4 =1650,

=

?Y?1650?3.3, 则Yu?u?M05001n?1? 又Yu??Yi??660?165, ni?14?)?所以v(YuN2?)??Y(Y?(1?f)iu1i?1n2nn?1N?nMi(1?f2i)s2i ?mi?1in22分别计算

?(Y??Y?)iui?1n2n?15778??192631??[(120?165)2?(153?165)2?(162?165)2?(225?165)2] 3Mi(1?f2i)s2i??mi?1in22322?(1?454)?2.92452?(1?)?2.8362?(1?)?7324536??454542?(1??6)?2.254?4628.486

n??)2??Y(Y?iu2??1N(1?f1)i?1N?v(Yu)??所以,M0?nn?1n???22nMi(1?f2i)s2i???mi? i?1???0.11556?0.046285?0.162??所以标准差s(Yu)?v(Yu)?0.402 (2) 比率估计

n?R?y?Mi?1ni?1iyi?i?MN232?3.75?45?3.4?36?4.5?54?4.17?3.9532

32?45?36?54?R)?v(y?)??Y(Y?(1?f)iu1i?1n2nn?1N?nMi(1?f2i)s2i ?mi?1in22?Y?其中YR?R?M0?)v(YRM02?Mi?1ni?1niyi

i?M?R)?v(y?0.0715

?R)?v(y?R)?0.0715?0.2647 s(y??R)?0.2647 (3)?简单估计标准差s(Yu)?0.402,比率估计标准差s(y?比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小

成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复: (1) 代码法:由Zi=

MiM?Ni可假设M0=1000000,则Mi=ZiM0列成数据表M0?Mii?1为: PSU 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Mi 110 18556 62999 78216 75245 73983 76580 38981 40772 22876 3721 24971 40654 14804 5577 70784 69635 34650 累计Mi 110 18666 81665 159881 235126 309109 385689 424670 465442 488318 492039 517010 557664 572468 578045 648829 718464 753114 代码 1~110 111~18666 18667~81665 81666~159881 159982~235126 235127~309109 309110~385689 385690~424670 424671~465442 465443~488318 488319~492039 492040~517010 517011~557664 557665~572468 572469~578045 578046~648829 648830~718464 718465~753114 753115~822606 36590 859296 822607~20 859296 33853 893049 859297~21 893049 16959 910008 893050~22 910008 9066 919074 910009~23 919074 21795 940869 919075~24 940869 59185 1000054 940870~25 1000054 我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891按照范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组; 综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组

19 (2)拉希里法:M?=78216,N=25,在[1, 25]和[1, 78216]中分别产生(n,m): (13,38678),M13=40654?38678,入样; (8, 57764),M8=38981<57764,舍弃,重抽; (23,13365),M23=9066<13365,舍弃,重抽; (19,38734),M19=69492?38734,入样;

以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为: 2,3,5,6,7,12 ,13,16, 19,24组 5.2解:

由数据可得:

t1=?y1j=20, t2??y2j?25,t3=38, t4=24, t5=21;

j?1j?1MiM269492 822606 结合t值数据,我们可以推得Z的值 Z1=

M15??0.2,Z2=0.16,Z3=0.32,Z4=0.2,Z5=0.12, M025由公式?ij?4ZiZj?1?Zi?Zj?N?Zi?1?2Zi??1?2Zj??1???1?2Zi?1i?????

样本 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5 ?ij 0.273769 0.217405 0.283079 0.243826 0.166251 0.213142 0.243826 0.603903 0.53546 0.243826 5.3 解:

设:M0=1,则有:Mi?Zi,得到下表: i Mi Mi?1000 累Mi?1000 计代码 1 2 3 4 5 6 7 8 9 10 ? 0.104 0.192 0.138 0.062 0.052 0.147 0.089 0.038 0.057 0.121 1 104 192 138 62 52 147 89 38 57 121 1000 104 296 434 496 548 695 784 822 879 1000 1—104 105—296 297—434 435—496 497—548 549—695 696—784 785—822 823—879 880—1000 先在[1,1000]中产生第一个随机数为731,再在[1,1000]里面产生第二个随机数为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。 5.4 解:

利用汉森-赫维茨估计量对总体总值进行估计:

YHH??1nyi1320120290????[??]?2217.006ni?1Zi30.1380.0620.121n?yi??11??YHH?????nn?1i?1?Zi?v?YHH??1?320????[?2217.006???6?0.138??22221?120??290????2217.006????2217.006?]???10370.3?79254.7?32287.9?6?0.062??0.121? =20318.8

???s?YHH???????v?YHH??142.5 ???

5.5解:由题可知

X0??Xi??Xi=2+9+3+2+1+6=23

i?1i?1N6由?i?nXi得下表: X0i 1 2 3 4 5 6 2 9 3 2 1 6 指标值Xi 包含概率?i 0.1739 0.7826 0.2609 0.1739 0.087 0.5217 0.087 0.3913 0.1304 0.087 0.0435 0.2609 Zi 由上表显然有Zi<1/2,于是我们可以采用布鲁尔方法:

?ij?4ZiZj?1?Zi?Zj?N?Zi?1?2Zi??1?2Zj??1???1?2Zi?1i?????

经计算可得下表: 样本 1,2 1,3 1,4 1,5 1,6 2,3 ?ij 0.0068 0.0153 0.0097 0.0046 0.0397 0.1607 2,4 2,5 2,6 3,4 3,5 3,6 4,5 4,6 5,6 附注: (1) ?(2) 样本 1,2 1,3 1,4 1,5 1,6 2,3 2,4 2,5 2,6 3,4 3,5 3,6 4,5 4,6 5,6 验证: XHH?0.1046 0.0512 0.3613 0.0153 0.0074 0.062 0.0046 0.0397 0.0191 Zi?0.1053?1.7999?0.1764?0.1053?0.0476?0.5455?2.78

1?2Zi?1iNZiZj Zi?Zj 0.0340 0.0133 0.0076 0.0038 0.0227 0.051 0.034 0.017 0.1021 0.0113 0.0057 0.034 0.0038 0.0227 0.0113 1.2613 0.2174 0.174 0.1305 0.3479 0.5217 0.4783 0.4348 0.6522 0.2174 0.1739 0.3913 0.1305 0.3479 0.3044 n?x1nxi?? XHT??ini?1Zii?1?i?i?nZi

?另外:

XHH?XHT

N2???Xi???1?V?XHH???Zi??X????ni?1?Zi???XXj???? V?XHT??????i?j??ij??i?????i?1j?i??i?j??NN2代入数据,经计算得到:

??V?XHH??????0?V?XHT???? ?

5.6 解: i 1 2 3 4 5 平均 由题可计算出: (1) i 1 2 3 4 5 yi xi Ri ?10 9 5 2 4 6 7 5 3 1 2 3.6 1.43 1.8 1.67 2 2 1.78 ?Yi 10 9 5 2 4 Yi ?Pi ?Ri ?50 45 25 10 20 10 9 5 2 4 1.43 1.8 1.67 2 2 1N Y?6 S??Yi?YN?1i?12??2=11.5

所以有:Vy????1?f2S=10.0625 nP?y??Y?yY?Ny?R??y x????V??Y???Vy?10.0625???????V?Y??N2Vy?251.5625 ????(2)

由定义有:

?YR

?1?XRNYR?XRSyx??1NS?Yi?Y?N?1i?12??2?11.52Sx?5.81N?Yi?YXi?X?32?N?1i?1????

所以得到下表: i ?YRi YRi ?R ?1 2 3 4 5 5.148 6.48 6.012 7.2 7.2 25.74 32.4 30.06 36 36 1.43 1.8 1.67 2 2 ??211?f?2???2??S?2RSyx?RSx??V?R??2??n???X??????V?YRi??X2V?R??????????X???V?YV?R?Ri??????N????????2

所以有下表: i ???V?YRi? ?????V??YRi?? ?????V?R? ??R ?1 2 3 4 5 (3) 1296 1846.8 1717.2 2041.2 2041.2 51.84 73.872 68.688 81.648 81.648 4.6 5.7 5.3 6.3 6.3 1.43 1.8 1.67 2 2 结合题目已知条件,我们选择的包含概率与Xi成正比: ?i?Zi?P(第i项被选中) i Zi yi YHH ?????YS?Y? ??21 2 3 4 5 7/18 5/18 3/18 1/18 2/18 210 9 5 2 4 25.7 32.4 30 36 36 18.49 5.76 0 36 36 7?18.49?5?5.76?3?0?1?36?2?36???N????V?Y???Zi?YHH?Y???254.71

18??i?1???????????由以上计算结果可以看出:V?YR??V?YHH??V?Y?,比估计在样本量很小的情

??????况下即使是最小的方差也远比另外两种估计的方差大,而简单估计又比PPS汉森

-赫维茨估计略好。

5.7 解:已知 n=2 m=5 ??yij?340 设公司总人数为M0

i?1j?1nm 由于这个样本是自加权的,所以有:

M0nmM0y??340?34M0(分钟) Y???ijnmi?1j?110? ?y?Y?34(分钟) M0? 所以该公司职工上班交通平均所需时间为34分钟。

1nm?y???yij?ynmi?1j?1?1?2440?24410???1??10???40?34???10?34??^??60?34???30?34??22222

?sy??y?15.62(分钟)

5.8 说明:y6?2561 解:由题可知:YHH??Yi1110yi110??????186yi?495299.4(吨) ni?1Zi10i?1Zi10i?1n??????所以,全集团季度总运量为495299.4吨.

???V?YHH?的一个无偏估计为: ??????YHH??n???Yi?11????Z?YHH?nn?1i?1??i2???110?????186yi?YHH??95183360 ??90??i?1??2因为 t?/2=2.306 所以 t?/295183360=22497.8 所以置信度95%的置信区间为[472894.6 , 517890.2]

第6章

第2题 ⑴证明:将总体平方和按照全部可能的系统样本进行分解,可以得到 (N?1)S???(yrj?Y)???(yrj?yr)+??(Yr?Y)2

222r?1j?1kkn__kn__kn____r?1j?1nr?1j?1 ?n?(yr?Y)+??(yrj?yr)2

2r?1____k__r?1j?1

__nkk____2kn ?(yr?Y)+??(yrj?yr)2 ?kr?1r?1j?11k____21 ?(yr?Y)?(N?1)S2?kr?1nk???(yr?1j?1knrj?yr)2__?

根据V(ysy)的定义,且nk?N,有

1k____2(N?1)21 V(ysy)??(yr?Y)?S?Nkr?1N____??(yr?1j?1knrj?yr)2

__ 令S2wsykn__1?(yrj?yr)2 ??k(n?1)r?1j?1 则有V(ysy)?__(N?1)2k(n?1)2S?Swsy NN

⑵证明:在样本量相同的情况下

____(N?1)2k(n?1)21?f2 V(ysy)?V(ysys)?S?Swsy?S

NNn(N?1)2N?n2k(n?1)2 ?S?S?Swsy

NNnN(N?Nn)2k(n?1)2 ?S?Swsy

NNN?k2k(n?1)2k(n?1)22 ?S?Swsy?(S?Swsy)

NNN2?S2时,系统抽样优于简单随机抽样。 立即可得到当且仅当Swsy

第3题 ?N??40?解:⑴k????????5.7?,k取最接近于5.7而不大于5.7的整数5,则将该

?n??7?班同学编号1~40,随机起点r=5,则该样本单元序号为5,10,15,20,25,30,35。

N⑵N?35,n?7,k??5。

n Sethi对称系统抽样:r?5,入样单元为:5,6,10,16,15,26,20 Singh对称系统抽样:由于n为奇数,则从两个断点开始分层,最后中间

的半层取中间位置的单元,r?5,入样单元为:5,31,10,26,15,21,18

第4题 解:由题,N=360,k=8,则n=N/k=45

??1 第45?r?1??j号住户的户主为汉族取Yrj??,

??0 第45?r?1??j号住户的户主不为汉族r?1,2,?,8,j?1,2,?,45,

则可能样本如下表: 1~45 000011000001000000000000000000000000000111100 000000010011101000010010000000000000011111100 000000000011110000000000000000000000011111100 000111001001010000010000000000000000011100000 000011001011110000000000000000000000001111100 000010000011010000000000000000000000011110100 000111100000000000000000000100000000011111000 000110100000000000000000000100000000111111000 由上表可得: 总体均值Y?0.1972

1845Yrj?Y总体方差S???N?1r?1j?12样本均值 0.1556 0.2889 0.2222 0.2222 0.2667 0.2000 0.2222 0.2222 样本内方差 0.1343 0.2101 0.1768 0.1768 0.2000 0.1636 0.1768 0.1768 ??2?0.1588

1?0.1343?0.2101?0.1768?4?0.2?0.1636??0.1769 8N?12k(n?1)2则:Vysy?S?S?r?0

NN451?f2运用简单随机抽样:n=45,f??0.125,Vysys?S?0.0031

360n平均样本内方差S?r2?????显然:Vysys?Vysy,说明等距样本的精确度较简单随机样本的精确度要高。

????第5题 答:⑴欲估计汉族所占比例,选择第⑴种系统抽样的方法好。按照题给条件排序,

在户口册中每5人中抽1人,且平均每户有5口人,分布较均匀,且如此抽样,每户人家基本均有1人入样。

⑵男性所占比例与孩子所占比例。采用简单随机抽样的方法较合适,因为按

题条件排序后,采用等距抽样,若抽得初始单元为1,则男生比例为1,孩子比例为0,如此,则有较大误差。

第6题 ?1,若总体中第r\群\第j个单元具有所研究的特征解:取Yrj=?

0,若总体中第r\群\第j个单元不具有所研究的特征?__1n则总体比例P的简单估计量为P=P=?yrj?ysy,即对总体比例的估计可化

nj?1^成对总体均值的估计。

?1,第r\群\第j个单元为男性① 估计男性所占比例:则,取Yrj=?

0,其他?由题意,系统抽样 K=5,n=10,则所有可能样本如下表:

群内方差S2 rj0.2778 0.2778 0.1778 0.2778 0.2334 1 2 3 4 5 6 7 8 9 10 群平均 0.5 0.5 0.2 0.5 0.7 1 2 3 4 5 1 0 0 1 0 1 0 0 1 0

1 0 1 0 1 0 1 0 1 1 0 1 0 0 1 1 0 0 0 1 0 1 0 1 1 0 1 1 0 1 0 1 0 0 1 1 0 0 1 0 1总体均值Y?N__??Yr?1j?1510rj?0.48

__1510(Yrj?Y)2?0.2547, 总体方差S???N?1r?1j?12152平均群内方差S??Srj?0.2489

5j?12.r以行为“系统样本”的系统抽样:k=5,n=10

N?12k(n?1)2N?12k(n?1)2S?Swsy?S?S.r?0.02559?0.0256NNNN简单随机抽样:n=10,f=20%=0.2 __1?f21?0.2V(y)?S??0.2547?0.0204?0.0256

n10V(ysy)?__V(ysy)?V(y),说明简单随机抽样精度较高。

?1,第r\群\第j个单元为小孩② 估计孩子所占比例:取Yrj=?

?0,其他____由题意,系统抽样:k=5,n=10,则所有可能样本如下表:

10 0 0 1 0 0 群平均 0.2 0.2 0.6 0.8 0.6 群内方差S2 rj0.1778 0.1778 0.2667 0.1778 0.2667 1 2 3 4 5 6 7 8 9 1 2 3 4 5 0 0 1 1 1 0 0 1 1 1 0 0 1 1 0 0 0 0 1 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1 0 0 1 0 0 1 1 0 0 1 1 1总体均值Y?N__??Yr?1j?1510rj?0.48

__1510(Yrj?Y)2?0.2547 总体方差S???N?1r?1j?12152平均群内方差S??Srj?0.2134

5j?12.r以行为“系统样本”的系统抽样:k=5,n=10

__N?12k(n?1)2N?12k(n?1)2V(ysy)?S?Swsy?S?S.r?0.0576

NNNN简单随机抽样:n=10,f=20%=0.2 __1?f21?0.2V(y)?S??0.2547?0.0204?0.0256

n10V(ysy)?V(y),说明简单随机抽样精度较高。

?1,满足条件③ 估计具体某种职业的住户人员的比例:取Yrj=?

?0,不满足条件____由题意,系统抽样 K=5,n=10,则所有可能样本如下表: 1 2 3 4 5 6 7 8 9 10 1 1 1 1 1 群内群2平均 方差Srj 0.4 0.4 0.4 0.4 0.3 0.2667 0.2667 0.2667 0.2667 0.2334 1 2 3 4 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 __0 0 0 0 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1总体均值Y?N2??Yr?1j?15rj?0.38

__1510(Yrj?Y)2?0.2404 总体方差S???N?1r?1j?1152平均群内方差S??Srj?0.26

5j?12.r以行为“系统样本”的系统抽样:k=5,n=10

__N?12k(n?1)2N?12k(n?1)2V(ysy)?S?Swsy?S?S.r?0.0016

NNNN简单随机抽样:n=10,f=20%=0.2 __1?f2V(y)?S?0.01923?0.0016

nV(ysy)?V(y),说明系统抽样精度较高。

____

第7题

?N?解:①由题,N=15,n=3,直线等距抽样k=??=5,则所有可能样本如下:

?n?r 1 2 3 4 5 1总体均值Y?N__可能样本 1 2 3 4 5 N6 7 8 9 10 11 12 13 14 15 样本均值 6 7 8 9 10 样本方差 25 25 25 25 25 ?Yi?1i?8

__1N总体方差S?(Yi?Y)2?20 ?N?1i?12152平均样本方差S??Sri?25

5i?12.r则以直线等距抽样:

__N?12k(n?1)2N?12k(n?1)2V(ysy)?S?Swsy?S?S.r?2

NNNNn简单随机抽样:n=3,f==1/5=0.2

N__1?f2V(y)?S?5.3334?2

nV(ysy)?V(y),说明直线等距抽样的精度较高。

____

②由题,要求抽样间距k=4,n=3,nk=12<15 ysy__1n??yi ni?1__11k__1kn1knyrj???yrj?Y E(ysy)??yr()??yr???kkr?1nkr?1j?1Nr?1j?1r?1__k__ 所以样本均值不是总体均值的无偏估计。

1kn1 当nk=N时,??yrj?nkr?1j?1N??yr?1j?1knrj, E(ysy)?Y。

____即当nk=N时,样本均值为总体均值的无偏估计。

第8题 解:由题,N=30,k=5,则n=30/5=6

则按照所给顺序等距抽样,可能样本如下: j r 1 2 3 4 5 1 10 8 6 5 9 2 8 8 5 9 9 3 9 10 4 3 1 4 2 3 4 0 6 5 3 5 0 3 0 6 0 4 0 8 0 样本均值 5.3333 6.3333 3.1667 4.6667 4.1667 样本内方差 17.4667 7.4667 6.5667 11.4667 18.9667 由上表数据可得:

156Yrj?Y总体方差S???N?1r?1j?12??2?11.8575

S?r2?均样本内方差

1?17.4667?7.4667?6.5667?11.4667?18.9667??12.3867 5N?12k(n?1)2则:Vysy?S?S?r?1.14

NN第七章(仅供参考)

1、根据题中所给表格,可计算各层的权重:

85125140''w1'??0.17 w2??0.25 w3??0.28

50050050011040''w4??0.22 w5??0.08

500500(1)根据式(7.1),可得该县棉花平均种植面积为:

??'ystD??whyh?0.17?h?1L4901806442356074101?0.25??0.28??0.22??0.08? 172528228?164.27

该县共有2000个村,帮全县的棉花种植总面积为: Y?NystD?2000?164.27?328540

y(2)根据式(7.4),Dts的方差估计为:

11'211L'v(ystD)??(?')whsh?('?)?wh(yh?ystD)2

nhnNh?1h?1nhnh1nh122(yhj?yh)?(?yhj?nyh),由表中数据可得: 由公式 sh??nh?1j?1nh?1j?1Ls1?90.6544 s2?195.7733 s3?1335.6773 s4?855.5519 s5?14334.1429

第一项:

?(h?1L11'21111?')whsh?(?)?0.172?90.6544?(?)?0.252?195.7733nhnh178525125111111?)?0.282?1335.6773?(?)?0.222?855.5519?(?)?0.082 2814022110840?14334.1429?14.1864第二项: ?(11L'('?)?wh(yh?ystD)2nNh?11149018064423?(?)?[0.17?(?164.27)2?0.25?(?164.27)2?0.28?(?500200017252856074101164.27)2?0.22?(?164.27)2?0.08?(?164.27)2]228?16760.9705因此 v(ystD)?14.1864?16760.9705?16775.1569

该县种植总面积的抽样标准误差估计为

s(Y)?N?s(ystD)?Nv(ystD)?259037.8883

2,S2进行估计 2、解:本题首先对S12,S2 由于比例估计的方差 S2?NP(1?P) N?1 故我们可以取 S2?P(1?P)进行估计。

根据题意知:W1?W2?0.5 P1?0.2 P2?0.8 c1?0.25 c2h?10 故总体比例 P?W1P1?W2P2?0.5 从而: S12?P1(1?P1)?0.2?0.8?0.16

2?P2(1?P2)?0.8?0.2?0.16 S2 S2?P(1?P)?0.5?0.5?0.25 (1)根据式(7.10)及式(7.7)

?c1f?S?hDhL22?c2h(S??WhSh)?h?1 ?

*CT??n?L?c1??c2hWhfhD?h?1?* 由题意有CT ?300(元) 代入上式有 f1D?0.16?0.25?0.2108

10?(0.25?0.16)0.25?0.2108

10?(0.25?0.16) f2D?0.16? n??300?1272

0.25?(10?0.5?0.2108?2)? n1?f1Dn1?f1Dn?W1?0.2108?1272?0.5?134 ? n2?f2Dn2?f2Dn?W2?0.2108?1272?0.5?134

2112LWhSh1(?1),依题意 此时 V(PstD)?(?)S???n?Nnfh?1hDS20.25n?S2n? 由于亦可忽略不计 ??,而忽略不计,故

NNNNN2LWhShS21??(?1) 故 V(PstD)???nnfhDh?10.250.5?0.161?[?(?1)]?2 127212720.2108 ?0.000667462

(2)不分层的简单随机抽样,样本量为n?268

1?f111 V(P)?NP(1?P)?P(1?P)??0.5?0.5?0.000932835

nN?1n268因此二重分层抽样比不分层的简单随机抽样效率高。 (3)略

3、解:由题知,x??602,由表,计算

???0.9994 y?568.25,x?568.5833,R22?278836.89,sx?256154.86,syx?256262.02 sy 所以,该地区年末牛的总头数估计为:

??Ny?Nyx??1238?568.25?602?744839.1(头) Y RDRDx568.5833?的方差估计为: 根据式(7.15),YRD?)?v(Ny)?N2v(y)?N2[1s2?(1?1)(R?2s2?2Rs)] v(YRDRDRDyxyxnnn?278836.8911 ?12382?[?(?)(0.99942?256154.86

2424500 ?2?0.9994?256262.02)] ?2220650080

?)?47123.7740。 ?的标准差为v(Y 所以YRDRD4、解:(1)根据式(7.10)及式(7.7)

?c1f?S?hDhL22?c2h(S??WhSh)?h?1 ?

*CT??n?L?c1??c2hWhfhD?h?1? 代入数据计算得: f1D?17.7?1?0.1329

100?[620?(0.786?312?0.214?922)]1?0.2282

100?[620?(0.786?312?0.214?922)] f2D?30.4? n??100?612

0.01?(1?0.786?0.1329?1?0.214?0.2282)?n1?f1Dn1?f1Dn?W1?0.1329?612?0.786?64 ?n2?f2Dn2?f2Dn?W2?0.2282?612?0.214?30

2112LWhSh1(?1) 此时, V(ystD)?(?)S???n?Nnfh?1hD

?6200.786?312?1?0.214?922?1??[???1?????1?]612620620?0.1329??0.2282?

?4.6700

(2)略

5、解:由题意可知

n1?300 n2?200 m?62

~(n?1)(n2?1) 由式(7.21) N?1?1?959.33

m?1 由式(7.22)

(n?1)(n2?1)(n1?m)(n2?m)301?201?238?138~v(N)?1??7822.7

(m?1)2(m?2)632?626、解:(1)由题意 n1?7 n2?12 m?4

~(n?1)(n2?1) 由式(7.21) N?1?1?19.8

m?1 由式(7.22)

(n?1)(n2?1)(n1?m)(n2?m)8?13?3?8~v(N)?1??16.64

(m?1)2(m?2)52?6~~ 其95%的置信区间为 N?1.96v(N) 即 (8.64,24.64)

(2)由题意 n1?16 n2?19 m?11

17?20~(n?1)(n2?1) 由式(7.21) N?1?1??1?27.33

m?112 由式(7.22)

(n?1)(n2?1)(n1?m)(n2?m)17?20?5?8~v(N)?1??7.26

(m?1)2(m?2)122?13~~ 其95%的置信区间为 N?1.96v(N) 即 (24.63,30.03)

(3)

1、总体是封闭的——两次抽样间没有人进入或离开湖心塘地区。 ○

2、每个样本都是来自总体的简单随机抽样。即湖心塘地区的每一个人 ○

都有同样的机会被找到。

3、两个样本是独立的。即第一次找到的人混合到了湖心塘地区后,跟 ○

第二次被找到的概率没有关系。

4、不会丢失人找到过的人的信息。 ○

7、(1)略

~(n?1)(n2?1) (2)由题意 由式(7.21) N?1?1

m?1 由表中数据n11?45 n21?15 m1?2代入公式得

~ N1?244.33

同理有

~~~~~~ N2?95 N3?48 N4?79.5 N5?44.5 N6?114 N7?41.67

~~~~~~N8?30.5 N9?62.33 N10?159 N11?31.5N12?4 N13?35 ~~~N14?3 N15?3 N16?1

(3)累积所有年份的数据,有n1?263 n2?93 m?19

~(263?1)?(93?1) 代入公式,有N??1?1239.8

19?116~~ (2)中得到的1970-1985年间的先天性风疹的总病例数为N???Ni?996.33

i?1 (4)略

本文来源:https://www.bwwdw.com/article/kobr.html

Top