课程实验报告(2016抽样技术)

更新时间:2024-04-03 11:02:02 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

实验项目 一、R的基本功能和在描述统计学中的应用 名称 二、简单随机抽样的抽选方法 实验 目的及要求 实验 内容 三、分层抽样中的估计及样本量的分配 四、用R编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析) 一、要求学生掌握R的基本功能和在描述统计学中的应用. 二、要求学生利用R软件编程来确定简单随机抽样的抽选方法. 三、要求学生利用R来计算分层抽样中的估计及样本量的分配 四、提升同学们用R编程的能力. 五、要求:每个同学思考一个现实问题,设计一份问卷调查. 六、要求:每个同学根据自己的问卷调查得到的数据,进行统计分析。 一、(1)数据的输入、复制、移动、删除等; (2)利用R进行计算平均值、方差、协方差、标准误差、中值、众数、最大/最小值、相关系数、相关性检验值、极差、样本总和、样本个数、置信区间、百分比排位、四分位数的方法; 二、简单随机抽样的抽选方法 三、分层抽样中的估计及样本量的分配 四、用R编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析) 实验1、下面列出了30个美国NBA球员的体重(以磅计,1磅=0.454KG)数据,这些数据是从美国NBA球队1990-1991赛季的花名册中抽样得到的。 225 232 232 245 235 245 270 225 240 240 217 195 225 185 200 220 200 210 271 240 220 230 215 252 225 220 206 185 227 236 求这组数据的样本均值和样本方差。 利用R软件求得样本均值和样本方差,R命令语句如下: x<-c(225,232,232,245,235,245,270,225,240,240,217,195,225,185,200, 实验步骤 220,200,210,271,240,220,230,215,252,225,220,206,185,227,236) xbar<-mean(x) xbar var(x) 实验2、 设总体有N=10个单位,相应的单位大小的指标值及其代码数见下表,要求从中抽取一个n=4的PPS样本。 (1)利用代码法进行PPS抽样 (2)利用拉希里法进行PPS抽样 i 1 2 3 4 5 6 7 8 9 10 Mi 88 34 69 15 24 47 36 56 260 51 680 累计Mi 88 122 191 206 230 277 313 369 629 680 代码 1~88 89~122 123~191 192~206 207~230 231~277 278~313 314~369 370~629 630~680 R命令语句如下: 2.1 (1)利用代码法进行PPS抽样R命令为sample(1:680,1) 运行4次结果如下: > sample(1:680,1) [1] 294 > sample(1:680,1) [1] 679 > sample(1:680,1) [1] 565 > sample(1:680,1) [1] 487 2.2 (2)利用拉希里法进行PPS抽样R命令为: i<-sample(1:10,1);i m<-sample(1:260,1);m 实验3、对某地区的2850户居民豆制品年消费支出进行调查,以居民户为抽样单位,根据收入水平将居民户划分为4层,每层按简单随机抽样抽取10,调查获得一些数据,如下表所示。样本量为n=40,按比例分配和尼曼分配时,各层的样本量分别应为多少? 层 1 2 3 4 居民户总数/户 200 400 750 1500 样本户豆制品消费支出/元 1 10 50 180 50 2 40 130 260 35 3 40 130 260 15 4 110 80 0 0 5 15 100 140 20 6 10 55 60 30 7 40 160 25 8 80 85 10 9 90 10 0 160 170 30 25 200 180 300 220 计算R语言命令如下: N1<-200;N2<-400;N3<-750;N4<-1500;N<-2850 n1<-10;n2<-10;n3<-10;n4<-10;n<-40 W1<-N1/N;W1 W2<-N2/N;W2 W3<-N3/N;W3 W4<-N4/N;W4 f1<-n1/N1;f1 f2<-n2/N2;f2 f3<-n3/N3;f3 f4<-n4/N4;f4 y1<-c(10,40,40,110,15,10,40,80,90,0);y1 y2<-c(50,130,130,80,100,55,160,85,160,170);y2 y3<-c(180,260,260,0,140,60,200,180,300,220);y3 y4<-c(50,35,15,0,20,30,25,10,30,25);y4 y1bar<-mean(y1);y1bar y2bar<-mean(y2);y2bar y3bar<-mean(y3);y3bar y4bar<-mean(y4);y4bar v1<-var(y1);v1 v2<-var(y2);v2 v3<-var(y3);v3 v4<-var(y4);v4 ystbar<-sum(W1*y1bar,W2*y2bar,W3*y3bar,W4*y4bar);ystbar n1=W1*n;n1 n2=W2*n;n2 n3=W3*n;n3 n4=W4*n;n4 W1s1<-W1*sqrt(v1);W1s1 W2s2<-W2*sqrt(v2);W2s2 W3s3<-W3*sqrt(v3);W3s3 W4s4<-W4*sqrt(v4);W4s4 sumWhsh<-sum(W1s1,W2s2,W3s3,W4s4);sumWhsh n1<-n*(W1s1/sumWhsh);n1 n2<-n*(W2s2/sumWhsh);n2 n3<-n*(W3s3/sumWhsh);n3 n4<-n*(W4s4/sumWhsh);n4 实验4:《应用抽样技术》p.110,习题5.1(要抄题) 某县有200个村,共播种小麦77000亩,采用抽样调查估计全县小麦总产量。随机抽取10个村对其小麦产量及播种面积进行调查,资料见表5.6。 表5.6 小麦产量及播种面积 产量/万斤 面积/亩 产量/万斤 面积/亩 12.5 220 24.6 417 12 230 18.2 336 10.5 210 9.3 176 18.1 377 12.6 247 5.5 123 18.9 370 1斤=500g 1亩≈666.7??2 试以播种面积为辅助变量用比率估计量估计全县小麦总产量,并与简单估计量就效果进行比较。 计算R命令如下表: x<-c(220,230,210,377,123,417,336,176,247,370);x y<-c(12.5,12,10.5,18.1,5.5,24.6,18.2,9.3,12.6,18.9);y xbar<-mean(x);xbar ybar<-mean(y);ybar R<-ybar/xbar;R N<-200;n=10 f<-n/N;f X<-77000 Y<-R*X;Y VYR<-((N^2)*(1-f)*sum((y-R*x)^2))/(n*(n-1));VYR seYR<-sqrt(VYR);seYR ybar<-mean(y);ybar Vy<-var(y);Vy Y<-N*ybar;Y VY<-N^2*(1-f)*Vy/n;VY seY<-sqrt(VY);seY 实验环境 R软件 1、利用R软件求得样本均值为y?225.6,样本方差为s2?443.3517。 2.1利用代码法进行PPS抽样,在1~680随机抽取4个整数为294、679、565、487,则第7、10、9单位入样,第7、10个单位各入样一次,第9个单位出现了2次,在计算时该单位参加两次运算。抽取一个n=4的PPS样本为:36、51、260、260。 2.2利用拉希里法进行PPS抽样,在1~10抽出i?9,在1~260中抽出m?157,实验结果与 分析 因为M9?260>m?157,所以第9个单位入样;同理,抽出i?9,m?205,由于M9?260>m?205,则第9个单位再次入样;再抽样抽出i?1,m?5,由于M1?88>m?5,则第1个单位再次入样,再抽样抽出i?7,m?35,由于M7?36>m?35,则第7个单位再次入样。抽取一个n=4的PPS样本为:260、260、88、36。 3、由上表中数据可知,N1?200,N2?400,N3?750,N4?1500,N?2850 n1?n2?n3?n4?10 各层的层权及抽样比为 W1?N1200n10??0.07018,f1?1??0.05 N2850N1200N2400n10??0.14035,f2?2??0.025 N2850N2400N3750n10??0.26316,f3?3??0.0133 N2850N3750N41500n10??0.52632,f4?4??0.0067 N2850N41500W2?W3?W4?各层样本均值及方差为: 1n1y1??y1i?43.5 n1i?11n1s?(y1i?y1)?1433.611 ?n1?1i?121同理可得: y2?112,y3?180,y4?24 222s2?1956.667,s3?8622.222,s4?193.333 4yst??Whyh?78.77193 h?1按比例分配时,各层的样本量为: n1?W1n?0.07018?40?2.81 n2?W2n?0.14035?40?5.61 n3?W3n?0.26316?40?10.53 n4?W4n?0.52632?40?21.05 即各层的样本量分别为3,6,10,21 对于尼曼分配,根据前面对W1及sh的计算结果,得到

W1s1?0.07018?1433.611?2.6571 W2s2?0.14035?1956.667?6.2083 W1s1?0.26316?8622.222?24.4358 W4s4?0.52632?193.333?7.3181 ?Wsh?14hh?2.6571?6.2083?24.4358?7.3181?40.6193 因此,按尼曼分配时,各层应分配的样本量为: n1?nW1s14?40??Wsh?12.6571?2.62 40.6193hhn2?6.11 n3?24.06 n4?7.21 即各层的样本量分别为3,6,24,7 4、(1)以播种面积为辅助变量用比率估计量估计全县小麦总产量。 110110??y?14.22?0.05254989;计算:x??xi?270.6,y??yi?14.22,R 10i?110i?1x270.6f?n10??0.05 N200??RX?? 4046.341(万斤) 小麦总产量为:YR?2N(1?f)i?1?)?v(YRnn?1?)?74.0552 se(YRn??yi?Rxi?22002(1?0.05)?i?1?1010?110??yi?Rxi?2?5484.173 (2)利用简单估计量估计全县小麦总产量: 110计算:y??yi?14.22,sy2?10i?1??y?y?ii?1n2n?1?31.68178 ??Ny?200?14.22?2844(万斤) 小麦总产量为:Y2N(1?f)2?)?v(Ys?120390.8 n?)?346.9737 se(YR由于以播种面积为辅助变量用比率估计量估计全县小麦总产量的抽样标准误为74.0552小于简单估计的抽样标准误346.9737,所以比率估计比简单估计效果好。 (不能空泛,要根据各个阶段开展的具体内容及学生的具体表现进行填写。) 教师评语 注:可根据实际情况加页

本文来源:https://www.bwwdw.com/article/j3fr.html

Top