课程实验报告(2016抽样技术)
更新时间:2024-04-03 11:02:02 阅读量: 综合文库 文档下载
- 抽样技术实验报告总结推荐度:
- 相关推荐
实验项目 一、R的基本功能和在描述统计学中的应用 名称 二、简单随机抽样的抽选方法 实验 目的及要求 实验 内容 三、分层抽样中的估计及样本量的分配 四、用R编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析) 一、要求学生掌握R的基本功能和在描述统计学中的应用. 二、要求学生利用R软件编程来确定简单随机抽样的抽选方法. 三、要求学生利用R来计算分层抽样中的估计及样本量的分配 四、提升同学们用R编程的能力. 五、要求:每个同学思考一个现实问题,设计一份问卷调查. 六、要求:每个同学根据自己的问卷调查得到的数据,进行统计分析。 一、(1)数据的输入、复制、移动、删除等; (2)利用R进行计算平均值、方差、协方差、标准误差、中值、众数、最大/最小值、相关系数、相关性检验值、极差、样本总和、样本个数、置信区间、百分比排位、四分位数的方法; 二、简单随机抽样的抽选方法 三、分层抽样中的估计及样本量的分配 四、用R编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析) 实验1、下面列出了30个美国NBA球员的体重(以磅计,1磅=0.454KG)数据,这些数据是从美国NBA球队1990-1991赛季的花名册中抽样得到的。 225 232 232 245 235 245 270 225 240 240 217 195 225 185 200 220 200 210 271 240 220 230 215 252 225 220 206 185 227 236 求这组数据的样本均值和样本方差。 利用R软件求得样本均值和样本方差,R命令语句如下: x<-c(225,232,232,245,235,245,270,225,240,240,217,195,225,185,200, 实验步骤 220,200,210,271,240,220,230,215,252,225,220,206,185,227,236) xbar<-mean(x) xbar var(x) 实验2、 设总体有N=10个单位,相应的单位大小的指标值及其代码数见下表,要求从中抽取一个n=4的PPS样本。 (1)利用代码法进行PPS抽样 (2)利用拉希里法进行PPS抽样 i 1 2 3 4 5 6 7 8 9 10 Mi 88 34 69 15 24 47 36 56 260 51 680 累计Mi 88 122 191 206 230 277 313 369 629 680 代码 1~88 89~122 123~191 192~206 207~230 231~277 278~313 314~369 370~629 630~680 R命令语句如下: 2.1 (1)利用代码法进行PPS抽样R命令为sample(1:680,1) 运行4次结果如下: > sample(1:680,1) [1] 294 > sample(1:680,1) [1] 679 > sample(1:680,1) [1] 565 > sample(1:680,1) [1] 487 2.2 (2)利用拉希里法进行PPS抽样R命令为: i<-sample(1:10,1);i m<-sample(1:260,1);m 实验3、对某地区的2850户居民豆制品年消费支出进行调查,以居民户为抽样单位,根据收入水平将居民户划分为4层,每层按简单随机抽样抽取10,调查获得一些数据,如下表所示。样本量为n=40,按比例分配和尼曼分配时,各层的样本量分别应为多少? 层 1 2 3 4 居民户总数/户 200 400 750 1500 样本户豆制品消费支出/元 1 10 50 180 50 2 40 130 260 35 3 40 130 260 15 4 110 80 0 0 5 15 100 140 20 6 10 55 60 30 7 40 160 25 8 80 85 10 9 90 10 0 160 170 30 25 200 180 300 220 计算R语言命令如下: N1<-200;N2<-400;N3<-750;N4<-1500;N<-2850 n1<-10;n2<-10;n3<-10;n4<-10;n<-40 W1<-N1/N;W1 W2<-N2/N;W2 W3<-N3/N;W3 W4<-N4/N;W4 f1<-n1/N1;f1 f2<-n2/N2;f2 f3<-n3/N3;f3 f4<-n4/N4;f4 y1<-c(10,40,40,110,15,10,40,80,90,0);y1 y2<-c(50,130,130,80,100,55,160,85,160,170);y2 y3<-c(180,260,260,0,140,60,200,180,300,220);y3 y4<-c(50,35,15,0,20,30,25,10,30,25);y4 y1bar<-mean(y1);y1bar y2bar<-mean(y2);y2bar y3bar<-mean(y3);y3bar y4bar<-mean(y4);y4bar v1<-var(y1);v1 v2<-var(y2);v2 v3<-var(y3);v3 v4<-var(y4);v4 ystbar<-sum(W1*y1bar,W2*y2bar,W3*y3bar,W4*y4bar);ystbar n1=W1*n;n1 n2=W2*n;n2 n3=W3*n;n3 n4=W4*n;n4 W1s1<-W1*sqrt(v1);W1s1 W2s2<-W2*sqrt(v2);W2s2 W3s3<-W3*sqrt(v3);W3s3 W4s4<-W4*sqrt(v4);W4s4 sumWhsh<-sum(W1s1,W2s2,W3s3,W4s4);sumWhsh n1<-n*(W1s1/sumWhsh);n1 n2<-n*(W2s2/sumWhsh);n2 n3<-n*(W3s3/sumWhsh);n3 n4<-n*(W4s4/sumWhsh);n4 实验4:《应用抽样技术》p.110,习题5.1(要抄题) 某县有200个村,共播种小麦77000亩,采用抽样调查估计全县小麦总产量。随机抽取10个村对其小麦产量及播种面积进行调查,资料见表5.6。 表5.6 小麦产量及播种面积 产量/万斤 面积/亩 产量/万斤 面积/亩 12.5 220 24.6 417 12 230 18.2 336 10.5 210 9.3 176 18.1 377 12.6 247 5.5 123 18.9 370 1斤=500g 1亩≈666.7??2 试以播种面积为辅助变量用比率估计量估计全县小麦总产量,并与简单估计量就效果进行比较。 计算R命令如下表: x<-c(220,230,210,377,123,417,336,176,247,370);x y<-c(12.5,12,10.5,18.1,5.5,24.6,18.2,9.3,12.6,18.9);y xbar<-mean(x);xbar ybar<-mean(y);ybar R<-ybar/xbar;R N<-200;n=10 f<-n/N;f X<-77000 Y<-R*X;Y VYR<-((N^2)*(1-f)*sum((y-R*x)^2))/(n*(n-1));VYR seYR<-sqrt(VYR);seYR ybar<-mean(y);ybar Vy<-var(y);Vy Y<-N*ybar;Y VY<-N^2*(1-f)*Vy/n;VY seY<-sqrt(VY);seY 实验环境 R软件 1、利用R软件求得样本均值为y?225.6,样本方差为s2?443.3517。 2.1利用代码法进行PPS抽样,在1~680随机抽取4个整数为294、679、565、487,则第7、10、9单位入样,第7、10个单位各入样一次,第9个单位出现了2次,在计算时该单位参加两次运算。抽取一个n=4的PPS样本为:36、51、260、260。 2.2利用拉希里法进行PPS抽样,在1~10抽出i?9,在1~260中抽出m?157,实验结果与 分析 因为M9?260>m?157,所以第9个单位入样;同理,抽出i?9,m?205,由于M9?260>m?205,则第9个单位再次入样;再抽样抽出i?1,m?5,由于M1?88>m?5,则第1个单位再次入样,再抽样抽出i?7,m?35,由于M7?36>m?35,则第7个单位再次入样。抽取一个n=4的PPS样本为:260、260、88、36。 3、由上表中数据可知,N1?200,N2?400,N3?750,N4?1500,N?2850 n1?n2?n3?n4?10 各层的层权及抽样比为 W1?N1200n10??0.07018,f1?1??0.05 N2850N1200N2400n10??0.14035,f2?2??0.025 N2850N2400N3750n10??0.26316,f3?3??0.0133 N2850N3750N41500n10??0.52632,f4?4??0.0067 N2850N41500W2?W3?W4?各层样本均值及方差为: 1n1y1??y1i?43.5 n1i?11n1s?(y1i?y1)?1433.611 ?n1?1i?121同理可得: y2?112,y3?180,y4?24 222s2?1956.667,s3?8622.222,s4?193.333 4yst??Whyh?78.77193 h?1按比例分配时,各层的样本量为: n1?W1n?0.07018?40?2.81 n2?W2n?0.14035?40?5.61 n3?W3n?0.26316?40?10.53 n4?W4n?0.52632?40?21.05 即各层的样本量分别为3,6,10,21 对于尼曼分配,根据前面对W1及sh的计算结果,得到
W1s1?0.07018?1433.611?2.6571 W2s2?0.14035?1956.667?6.2083 W1s1?0.26316?8622.222?24.4358 W4s4?0.52632?193.333?7.3181 ?Wsh?14hh?2.6571?6.2083?24.4358?7.3181?40.6193 因此,按尼曼分配时,各层应分配的样本量为: n1?nW1s14?40??Wsh?12.6571?2.62 40.6193hhn2?6.11 n3?24.06 n4?7.21 即各层的样本量分别为3,6,24,7 4、(1)以播种面积为辅助变量用比率估计量估计全县小麦总产量。 110110??y?14.22?0.05254989;计算:x??xi?270.6,y??yi?14.22,R 10i?110i?1x270.6f?n10??0.05 N200??RX?? 4046.341(万斤) 小麦总产量为:YR?2N(1?f)i?1?)?v(YRnn?1?)?74.0552 se(YRn??yi?Rxi?22002(1?0.05)?i?1?1010?110??yi?Rxi?2?5484.173 (2)利用简单估计量估计全县小麦总产量: 110计算:y??yi?14.22,sy2?10i?1??y?y?ii?1n2n?1?31.68178 ??Ny?200?14.22?2844(万斤) 小麦总产量为:Y2N(1?f)2?)?v(Ys?120390.8 n?)?346.9737 se(YR由于以播种面积为辅助变量用比率估计量估计全县小麦总产量的抽样标准误为74.0552小于简单估计的抽样标准误346.9737,所以比率估计比简单估计效果好。 (不能空泛,要根据各个阶段开展的具体内容及学生的具体表现进行填写。) 教师评语 注:可根据实际情况加页
正在阅读:
课程实验报告(2016抽样技术)04-03
机关文字工作重要性06-12
企业信用担保的宣传广告词03-15
公司理财模拟实验指导书(32)07-10
南开18秋学期(1709、1803、1809)《税务会计》在线作业100分答案207-03
人教版2019年部编本小学语文二年级下册小学必背古诗75首原文12-02
特别的爱给特别的你作文400字06-28
语文新人教版小学二年级上册学案练习题(全册) - 图文03-23
RSA算法安全性分析及其参数的选择04-30
憧憬高中生活(我的动力源)01-20
- 高一物理牛顿运动定律全套学习学案
- 水处理一级反渗透加还原剂亚硫酸氢钠后为什么ORP会升高
- 毕业设计(论文)-正文董家口 - 图文
- 荣盛酒店经营管理公司录用通知及入职承诺书II
- 第二讲 大学英语四级快速阅读技巧
- 质量管理体系文件(2015年委托第三方医药物流配送企业专用版本)
- 214071收款办法
- 苏轼对《文选》选文的评价
- 《诊断学基础B》1-8作业
- 广东省东莞市高一数学下学期期末教学质量检查试题
- 海南电网公司VIS推广应用管理办法
- 红星照耀中国习题
- 苏教版小学语文六年级上册期末复习资料之生字词整理
- 局域网组建与应用—王向东
- 税务稽查内部管理文书样式
- 环保社会实践调查表
- 九年级思品第一单元复习
- 2016年全国注册咨询工程师继续教育公路路线设计规范试卷
- 毕业设计-青岛港董家口港区防波堤设计
- 撞背锻炼方法与益处
- 抽样
- 课程
- 实验
- 报告
- 技术
- 2016
- 初三物理-压强-讲义、练习题(极限法)
- 新药转正标准品种目录第89-104册
- 液压与气压传动习题 - 图文
- 知识产权法试题及参考答案
- 2007春-2010年-江苏省计算机二级C++ - 历年真题及答案(笔试)
- 《普贤菩萨行愿品》注音版
- 自考 婚姻家庭法--阶段测验试题汇总
- 戴小桥和他的哥们儿阅读考查题
- 市场理论部分习题
- 酶工程思考题有答案
- 四年级数学思维训练题整理
- 古人尊称谦称
- 最新苏教版八年级语文上册六 枣核导学案
- 五笔字典
- 2013年广州市综合测试(一)生物科分析报告(定稿) - 图文
- 管理学试题和答案
- 水文化研究材料 - 图文
- 买字画网站?在哪买既便宜又好看 - 图文
- 计算机网络 - 第8章习题答案
- 上海市行政执法证考试题库单选题(101-200)