应用数理统计习题

更新时间:2024-01-12 04:48:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

考试方式:

《应用数理统计》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc或pdf文档发送到 zhang-hh@zju.edu.cn,占30%;(2)结合自己的专业,写一篇统计方法的应用,或介绍一些新的统计方法等小论文,篇幅不限,论文要标注参考文献,占70%。 《数据统计分析》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc或pdf文档发送到zhang-hh@zju.edu.cn,占30%;(2)闭卷或开卷考试,占70%。

参考教材:《实用统计方法》 西安交通大学 梅长林等 科学出版社 2002。 部分习题

第一章 多元回归分析

1.4某种化工产品的得率Y与反应温度X1,反应时间X2 及某反应温度X3 有关。设对于给

定的X1,X2,X3,得率Y服从正态分布且方差为常数。近得实验结果如下,其中X1,X2,X3 均为两水平变量且编码形式表达。 i 1 -1 -1 -1 7.6 2 -1 -1 1 10.3 3 -1 1 -1 9.2 4 -1 1 1 10.2 5 1 -1 -1 8.4 6 1 -1 1 11.1 7 1 1 -1 9.8 8 1 1 1 12.6 Xi1 Xi2 Xi3 Yi

(1)对Y,拟合以X1,X2,X3为自变量的线性回归模型,求出回归参数估计值及残差。 (2)给定显著水平??0.05,检验回归系数的显著性。 (3)对??0.05,检验各自变量对Y的影响的显著性。

1.7为了研究人们对某种品牌食品的喜爱程度Y和该食品的水分含量X1,甜度X2的关系,,

进行了一个完全随机化设计的小规模试验,得到下列数据:

i 1 4 2 64 2 4 4 73 3 4 2 61 4 4 4 76 5 6 2 72 6 6 4 80 7 6 2 71 8 6 4 83 9 8 2 83 10 8 4 89 11 8 2 86 12 8 4 93 13 10 2 88 14 10 4 95 15 10 2 16 10 4 Xi1 Xi2 Yi 94 100

(1) 拟合回归模型

Yi??0??1Xi1??2Xi2??i,

?写出回归方程,问其中的

?1如何解释。

?(2) 求出残差向量,分别作出残差关于拟合值Y, X1, X2及X1X2的残差图及残差

的正态概率图。分析这些残差图并给出你的评述。

(3) 设误差项?i?i?1,2,?16?独立同分布于N?0,?2在??,

?0.01的水平上检验回归

关系的显著性。写出假设、检验准则及结论并求检验的p-值。

T(4) 在(3)中关于?i的假定下,对自变量一组新的观察值 Xnew??5,4?,给出Y的

预报值的99%置信区间。

(5) 拟合Y关于X1的一元线性回归模型,写出回归方程。将X1的回归系数与(1)中

所求得的X1的回归系数作比较,你有什么结论。

(6) SSR?X1?和SSR?X1X2?是否相等?二者的意义有何不同?

1.8 某科学基金会的管理人员希望估价从事数学研究工作的中等或较高水平的数学家的

年工资额Y与他们的研究成果(论文、著作等)的质量指标X1,从事研究工作的时间X2 以及能成功获得资助的指标X3之间的关系。为此按一定的试验设计方法调查了24位此类型的数学家,得到下列数据: i 1 2 3 4 5 6 7 8 9 10 11 12

Xi1 3.5 9 6.1 33.2 13 8.0 23 7.6 43.3 5.3 20 6.4 40.3 14 6.5 35 7.0 44.1 5.1 18 7.4 38.7 15 6.6 39 5.0 42.8 5.8 33 6.7 46.8 16 3.7 21 4.4 33.6 4.2 31 7.5 41.4 17 6.2 7 5.5 34.2 6.0 13 5.9 37.5 18 7.0 40 7.0 48.0 6.8 25 6.0 39.0 19 4.0 35 6.0 38.0 5.5 30 4.0 40.7 20 4.5 23 3.5 35.9 3.1 5 5.8 30.1 21 5.9 33 4.9 40.4 7.2 47 8.3 52.9 22 5.6 27 4.3 36.8 4.5 25 5.0 38.2 23 4.8 34 8.0 45.2 4.9 11 6.4 31.8 24 3.9 15 5.0 35.1 Xi2 Xi3 Yi i Xi1 Xi2 Xi3 Yi

(1)对Y关于X1,X2,X3,拟合线性回归模型,写出回归方程。

?(2)求出残差向量,分别作出残差关于Y, X1,X2,X3及两自变量交叉项的残差图及残差的正态概率图。分析这些残差图,评述你的看法。 (3)设误差项?i独立同分布于N?0,?相关系数R2值并解释其意义。

(4)在(3)中对误差项分布的假定下,分别给出回归参数?1,?2,?3的置信度为95%的置信区间。

(5)在(3)中对误差项分布的假定下,对??0.01,检验假设?1??3。 (6)对各自变量的观测数据作如下变换(成为相关变换):

'??1?Yi?Y?n?1?sY?2?,对??0.05,检验回归关系的显著性,计算复

Yi???'X??, ik??_??1?Xik?Xk?skn?1????,k?1,2,3 ???_其中 Y?1niY?ni?1, Xk?21n?ni?1Xik,k?1,2,3.

2 s?2Y1n?1n?i?1__1????2?Yi?Y?,sk??Xik?Xk? ?n?1i?1????n

然后,对数据(Yi?,Xi?1,Xi?2,Xi?3)?i?1,2,?24?拟合线性回归模型。此时回归系数估计如何解释?并推导在变换数据下得到的回归参数估计和(1)中得到的相应估计的关系。

1.9 某医院管理工作者希望了解病人对医院工作的满意程度Y和病人的年龄X1,病情的严

重程度X2和忧虑程度X3之间的关系。她随机地选取了23位病人,得到下列数据:

i 1 50 51 2.3 48 13 38 55 2.2 47 2 36 46 2.3 57 14 34 51 2.3 51 3 40 48 2.2 66 15 53 54 2.2 57 4 41 44 1.8 70 16 36 49 2.0 66 25 28 43 1.8 89 17 33 56 2.5 79 6 49 54 2.9 36 18 29 46 1.9 88 7 42 50 2.2 46 19 33 49 2.1 60 8 45 48 2.4 54 20 55 51 2.4 49 9 52 62 2.9 26 21 29 52 2.3 77 10 29 50 2.1 77 22 44 58 2.9 52 p11 29 48 2.4 89 23 43 50 2.3 60 12 43 53 2.4 67 Xi1 Xi2 Xi3 Yi i Xi1 Xi2 Xi3 Yi (1)通过穷举法分别利用准则?i?Rp,?ii?MSEp,?iii?Cp 和?iv?PRESS选择最优回归方

程,并作出相应的图以支持你的判断。四个准则下的最优回归方程是否一致?

(2)给定FE?3.0及 FD?2.9,试用逐步回归法选择最优回归方程,其结果和(1)中的结果是否相同?

(3)对所选取的回归方程作进一步的精细分析。

第二章 主成分分析及典型相关分析

2.4下表是美国最大的10家工业公司在某时期内的销售额x1和利润x2的数据(单位:兆美

元): 公司名称 General Motors Ford Exxon

销售额x1 126974 96933 86656 利润x2 4224 3835 3510

IBM General electric Mobile Philip Morris Chrysler du Pont Texaco 由此数据可求得 x??9?6230??,

?2927?63438 55264 50976 39069 36156 35209 32416 3758 3939 1809 2946 359 2480 2413 ?10005.20255.76?5, S???10?14.30??255.76(1) 求x1,x2的样本主成分y1和y2及主成分的样本方差,计算各样本主成分的贡

献率。

(2) 求第一样本主成分y1的观测值并予以排序,它是否基本上反映了原数据的特

性?

2.5 变换第4题中的样本协方差矩阵S为样本相关矩阵R,

(1)求标准化样本的主成分及其样本方差,各主成分的贡献率。和第4题(1)中的结果相比有何变化?

(2)求标准化样本的第一主成分的观测值并排序,它和第4题(2)中的结果相比有何变化? (3)就所给的数据,你认为从样本协方差矩阵出发求主成分合理呢,还是从样本阵出发求主成分合理?解释你的观点。

2.7 下表是某城市在42天中的中午十二点的空气污染数据:

风速(x1) 太阳辐射(x2) 8 7 7 10 6 8 9 5 7 8 6 6 7

CO?x3? NO?x4? NO2?x5? O3?x6? HC?x7? 98 107 103 88 91 90 84 72 82 64 71 91 72 7 4 4 5 4 5 7 6 5 5 5 4 7 2 3 3 2 2 2 4 4 1 2 4 2 4 12 9 5 8 8 12 12 21 11 13 10 12 18 8 5 6 15 10 12 15 14 11 9 3 7 10 2 3 3 4 3 4 5 4 3 4 3 3 3

10 10 9 8 8 9 9 10 9 8 5 6 8 6 8 6 10 8 7 5 6 10 8 5 5 7 7 6 8 70 72 77 76 71 67 69 62 88 80 30 83 84 78 79 62 37 71 52 48 75 35 85 86 86 79 79 68 40 4 4 4 4 5 4 3 5 4 4 3 5 3 4 2 4 3 4 4 6 4 4 4 3 7 7 5 6 4 2 1 1 1 3 2 3 3 2 2 3 1 2 2 1 3 1 1 1 5 1 1 1 1 2 4 2 2 3 11 8 9 7 16 13 9 14 7 13 5 10 7 11 7 9 7 10 12 8 10 6 9 6 13 9 8 11 6 7 10 10 7 4 2 5 4 6 11 2 23 6 11 10 8 2 7 8 4 24 9 10 12 18 25 6 14 5 3 3 3 3 4 3 3 4 3 4 3 4 3 3 3 3 3 3 4 3 3 2 2 2 2 3 2 3 2

你的任务是利用尽可能少的变量提取原数据集的信息。分别样本协方差矩阵和样本相关矩阵作主成分分析,二者的结果有何差异?原始数据的变化可否由三个或更少的主成分反映,你能否给所选取的主成分作出解释?

2.8 下表是世界上55个国家和地区1984年前在七个径赛项目上的女子纪录: 国家和地区 100m(s) 200m(s) 400m(s) 800m(min) 22.94 22.35 23.09 23.04 23.05 23.17 24.47 54.50 51.08 50.62 52.00 53.30 52.80 55.00 2.15 1.98 1.99 2.00 2.16 2.10 2.18 1500m(min) 4.43 4.13 4.22 4.14 4.58 4.49 4.45 3000m(min) 9.79 9.08 9.34 8.88 9.81 9.77 9.51 马拉松(min) 178.52 152.37 159.37 157.85 169.98 168.75 191.02 阿根廷 11.61 澳大利亚 11.20 奥地利 11.43 比利时 11.41 百慕大 巴西 缅甸

11.46 11.31 12.14

加拿大 智利 中国 哥伦比亚 库克岛 哥斯达黎加 捷克斯洛伐克 丹麦 多米尼加共和国 芬兰 法国 东德 西德 11.00 12.00 11.95 11.60 12.90 11.96 11.09 11.42 11.79 11.13 11.15 10.81 11.01 22.25 24.52 24.41 24.00 27.10 24.60 21.97 23.52 24.05 22.39 22.59 21.71 22.39 22.13 24.08 24.54 23.06 24.28 24.24 23.51 23.57 23.00 24.00 23.88 24.49 25.78 24.96 24.21 25.08 23.62 22.81 23.13 23.31 25.07 23.54 22.21 24.22 23.46 25.00 50.06 54.90 54.97 53.26 60.40 58.25 47.99 53.60 56.05 50.14 51.73 48.16 49.75 50.46 54.93 56.09 51.50 53.60 55.34 53.24 54.90 52.01 53.73 52.70 55.70 51.20 56.10 55.09 58.10 53.76 52.38 51.60 53.12 56.96 54.60 49.29 54.30 51.20 55.08 2.00 2.05 2.08 2.11 2.30 2.21 1.89 2.03 2.24 2.03 2.00 1.93 1.95 1.98 2.07 2.28 2.01 2.10 2.22 2.05 2.10 1.96 2.09 2.00 2.15 1.97 2.07 2.19 2.27 2.04 1.99 2.02 2.03 2.24 2.19 1.95 2.09 1.92 2.12 4.06 4.23 4.33 4.35 4.84 4.68 4.14 4.10 4.74 4.18 4.14 3.96 4.03 4.03 4.35 4.86 4.14 4.32 4.61 4.11 4.25 3.98 4.35 4.15 4.42 4.25 4.38 4.69 4.79 4.25 4.06 4.18 4.01 4.84 4.60 3.99 4.16 3.96 4.52 8.81 9.37 9.31 9.46 11.10 10.43 8.98 8.92 9.89 8.71 8.98 8.75 8.59 8.62 9.87 10.54 8.98 9.98 10.02 8.89 9.37 8.63 9.20 9.20 9.62 9.35 9.64 10.46 10.90 9.59 9.01 8.76 8.53 10.69 10.16 8.97 8.84 8.53 9.94 149.45 171.38 168.48 165.42 233.22 171.80 155.27 154.23 203.88 151.75 155.27 157.68 148.53 149.72 182.20 215.08 156.37 188.03 201.28 149.38 160.48 151.82 150.50 181.05 164.65 179.17 174.68 182.17 261.13 158.53 152.48 145.58 145.48 233.00 200.37 160.82 151.20 165.45 182.77 英国 11.00 希腊 11.79 危地马拉 11.84 匈牙利 11.45 印度 11.95 印度尼西亚 爱尔兰 以色列 意大利 日本 肯尼亚 韩国 朝鲜 11.85 11.43 11.45 11.29 11.73 11.73 11.96 12.25 卢森堡 12.03 马来西亚 12.23 毛里求斯 11.76 墨西哥 11.89 荷兰 11.25 新西兰 挪威 巴布亚新几内亚 菲律宾 11.55 11.58 12.25 11.76 波兰 11.13 葡萄牙 11.81 罗马尼亚 11.44 新加坡 12.30

西班牙 瑞典 瑞士 中国台北 泰国 土耳其 美国 11.80 11.16 11.45 11.22 11.75 11.98 10.79 23.98 22.82 23.31 22.62 24.46 24.44 21.83 22.19 25.85 53.59 51.79 53.11 52.50 55.80 56.45 50.62 49.19 58.73 2.05 2.02 2.02 2.10 2.20 2.15 1.96 1.89 2.33 4.14 4.12 4.07 4.38 4.72 4.37 3.95 3.87 5.81 9.02 8.84 8.77 9.63 10.28 9.38 8.50 8.45 13.04 162.60 154.48 153.42 177.87 168.45 201.08 142.72 151.22 306.00 苏联 11.06 西沙摩亚 12.74

(1)求其样本相关矩阵R及它的特征值和相应正交单位化特征向量。 (2)求前两个标准化样本主成分及其累计贡献率。

(3)解释(2)中的两个主成分的意义(事实上,第一主成分近似是各变量的等权重之和,他反应了各国家和地区的运动员的优秀程度,第二主成分可用以度量各国家和地区在各径赛项目上的相对实力)。

(4)基于第一样本主成分的观测值对各国家和地区排序,这与你从原始数据中得到的直观看法是否基本吻合?

2.12从某校初一学生中随机选取了n?40名,考察下列两组指标:

X1:阅读速度, X2阅读理解力; Y1:计算速度, Y2:计算正确程度.

根据观测数据求得?X1,X2,Y1,Y2?的相关矩阵为

T?R11R12R???R21R22?1.000.630.24?0.631.00?0.06??????0.24?0.061.00??0.060.070.420.06??0.07?0.42??1.00?,

(1) 求各对样本典型变量和样本典型相关系数。

(2) 给定??0.05,检验各对典型变量间的相关性是否显著。利用显著相关的典型变量对解

释描述阅读能力的变量?X1,X2?T和描述计算能力的变量?Y1,Y2?T之间的关系。

2.13 随机抽取n?70个家庭考察两个“消费”变量, 和三个“人口统计学”变量Y1,Y2,Y3

之间的关系,其中

X1: 一个家庭每年进餐馆就餐的次数; X2:一个家庭每年去电影院看电影的次数; Y1: 家长的年龄

Y2: 家庭年收入

Y3:家长受教育的程度。

由调查数据求得 ?X1,X2,Y1,Y2,Y3?的样本相关矩阵为

T?R11R12R???R21R22?1.00?0.80?????0.26???0.67?0.34?0.801.000.330.590.340.260.331.000.370.210.670.590.371.000.350.34??0.34?0.21??0.35?1.00??

1 求各典型变量对的典型相关系数,并检验其相关的显著性(??0.05)。

2 求显著相关的典型变量对。

3 利用(2)中典型变量的系数解释“消费”变量与“人口统计学变量”的关系。

第三章 判别分析

3.7下表给出了两类公司的有关金融数据,一类是破产公司,表中数据是这些公司在破产前

两年的四个金融指标。一类是未破产公司在和破产公司大约相同时期的四个相同的金融指标。这四个指标是 X1?流通资金总债务,X2?纯收入总资产,X3?当前资产当前债务,X4?当前资产纯销售额。

各公司的数据如下表(表中最后一列“0”表示破产公司,“1”表示非破产):

编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

x1 x2 x3 x4 总体 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.45 -0.56 0.06 -0.07 -0.10 -0.14 0.04 -0.06 0.07 -0.13 -0.23 0.07 0.01 -0.28 0.15 0.37 -0.08 -0.41 -0.31 0.02 -0.09 -0.09 -0.07 0.01 -0.06 -0.01 -0.14 -0.30 0.02 0.00 -0.23 0.05 0.11 -0.08 1.09 1.51 1.01 1.45 1.56 0.71 1.50 1.37 1.37 1.42 0.33 1.31 2.15 1.19 1.88 1.99 1.51 0.45 0.16 0.40 0.26 0.67 0.28 0.71 0.40 0.34 0.44 0.18 0.25 0.70 0.66 0.27 0.38 0.42

18 19 20 21 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

0.05 0.01 0.12 -0.28 0.51 0.08 0.38 0.19 0.32 0.31 0.12 -0.02 0.22 0.17 0.15 -0.10 0.14 0.14 0.15 0.16 0.29 0.54 -0.33 0.48 0.56 0.20 0.47 0.17 0.58 0.03 0.00 0.11 -0.27 0.10 0.02 0.11 0.05 0.07 0.05 0.05 0.02 0.08 0.07 0.05 -0.01 -0.03 0.07 0.06 0.05 0.06 0.11 -0.09 0.09 0.11 0.08 0.16 0.04 0.04 1.68 1.26 1.14 1.27 2.49 2.01 3.27 2.25 4.24 4.45 2.52 2.05 2.35 1.80 2.17 2.50 0.46 2.61 2.23 2.31 1.84 2.33 3.01 1.24 4.29 1.99 2.92 2.45 5.06 0.95 0.60 0.17 0.51 0.54 0.53 0.35 0.33 0.63 0.69 0.69 0.35 0.40 0.52 0.55 0.58 0.26 0.52 0.56 0.20 0.38 0.48 0.47 0.18 0.45 0.30 0.45 0.14 0.13 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 (1)对n1?21个破产公司和n2?25个非破产公司就二位变量x??x1,x2?求两类公司样本均值x(1),x(2)和样本协方差矩阵S1,S2.

T(2)假定X??X1,X2?对两总体均服从二维正态分布且协方差矩阵不相同,在等先验分布和等误判损失下,建立Bayes判别准则。

(3)在(2)中判别准则的貌似误判率和刀切法误判比例,评价此判别准则。

(4)在q1?0.05,q2?0.95,c?12??c?21?下,重复(2),(3)分析。你认为这里对总体出现的先验概率分布的假定是否正确,解释之。

(5)假定X??X1,X2?对两总体均服从协方差矩阵相等的正态分布,重复(2),(3)的分

T

析并比较两种分类准则的优良性,哪一个较优?

(6)对变量组?X1,X3?T,?X1,X4?重复(1)~(4)的分析,你发现哪个变量组的分类效

T果较好?

(7)利用所有四个变量,重复(1)~(4)的分析,结果如何?是否用较多的变量建立的判别准则的分类效果一定优于用其中一部分变量所建立的判别准则的分类效果。

2.8 E.Anderson在1939年收集了 尾属植物中的三个品种的花的形状尺寸。从这三个品

种(记为G1,G2,G3)中各选择了50株植物,测量了下述四个变量:

X1?花的萼片长度,X3?花瓣的长度,XX42?花的萼片宽度?花瓣的宽度

数据如下表

(1)只考虑变量?X2,X4?,假设三个总体对这两个均服从二维正态分布,在协方差

T矩阵不等的假定下,构造二次判别函数(3.3.23),并评估相应的判别准则(3.3.24)分类效果。

(2) 假定有新样品x0??x2,x4???3.5,1.75?,利用(1)中的判别准则对x0分类。

TT(3) 假定三个总体的协方差矩阵相等,求线性判别函数(3.3.25),并评估相应的判

别准则(3.3.26)分类效果和(1)中的结果作比较。 (4) 利用(3)中的判别准则判别新样品x0??x2,x4???3.5,1.75?的归类,它和

TT(2)中的结果是否相同?

(5) 利用全部四个变量重复(1)和(3)的分析,并和(1),(3)中的结果作比较,

评述你的发现。

G1 x1 x2 x3 G2 x4 x1 x2 x3 G3 x4 x1 x2 x3 x4 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9 5.4 4.8 4.8 4.3

3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 3.7 3.4 3.0 3.0 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 1.5 1.6 1.4 1.1 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.1 7.0 6.4 6.9 5.5 6.5 5.7 6.3 4.9 6.6 5.2 5.0 5.9 6.0 6.1 3.2 3.2 3.1 2.3 2.8 2.8 3.3 2.4 2.9 2.7 2.0 3.0 2.2 2.9 4.7 4.5 4.9 4.0 4.6 4.5 4.7 3.3 4.6 3.9 3.5 4.2 4.0 4.7 1.4 1.5 1.5 1.3 1.5 1.3 1.6 1.0 1.3 1.4 1.0 1.5 1.0 1.4 6.3 5.8 7.1 6.3 6.5 7.6 4.9 7.3 6.7 7.2 6.5 6.4 6.8 5.7 3.3 2.7 3.0 2.9 3.0 3.0 2.5 2.9 2.5 3.6 3.2 2.7 3.0 2.5 6.0 5.1 5.9 5.6 5.8 6.6 4.5 6.3 5.8 6.1 5.1 5.3 5.5 5.0 2.5 1.9 2.1 1.8 2.2 2.1 1.7 1.8 1.8 2.5 2.0 1.9 2.1 2.0

5.8 5.7 5.4 5.1 5.7 5.1 5.4 5.1 4.6 5.1 4.8 5.0 5.0 5.2 5.2 4.7 4.8 5.4 5.2 5.5 4.9 5.0 5.5 4.9 4.4 5.1 5.0 4.5 4.4 5.0 5.1 4.8 5.1 4.6 5.3 5.0 4.0 4.4 3.9 3.5 3.8 3.8 3.4 3.7 3.6 3.3 3.4 3.0 3.4 3.5 3.4 3.2 3.1 3.4 4.1 4.2 3.1 3.2 3.5 3.6 3.0 3.4 3.5 2.3 3.2 3.5 3.8 3.0 3.8 3.2 3.7 3.3 1.2 1.5 1.3 1.4 1.7 1.5 1.7 1.5 1.0 1.7 1.9 1.6 1.6 1.5 1.4 1.6 1.6 1.5 1.5 1.4 1.5 1.2 1.3 1.4 1.3 1.5 1.3 1.3 1.3 1.6 1.9 1.4 1.6 1.4 1.5 1.4 0.2 0.4 0.4 0.3 0.3 0.3 0.2 0.4 0.2 0.5 0.2 0.2 0.4 0.2 0.2 0.2 0.2 0.4 0.1 0.2 0.2 0.2 0.2 0.1 0.2 0.2 0.3 0.3 0.2 0.6 0.4 0.3 0.2 0.2 0.2 0.2 5.6 6.7 5.6 5.8 6.2 5.6 5.9 6.1 6.3 6.1 6.4 6.6 6.8 6.7 6.0 5.7 5.5 5.5 5.8 6.0 5.4 6.0 6.7 6.3 5.6 5.5 5.5 6.1 5.8 5.0 5.6 5.7 5.7 6.2 5.1 5.7 2.9 3.1 3.0 2.7 2.2 2.5 3.2 2.8 2.5 2.8 2.9 3.0 2.8 3.0 2.9 2.6 2.4 2.4 2.7 2.7 3.0 2.7 3.1 2.3 3.0 2.5 2.6 3.0 2.6 2.3 2.7 3.0 2.9 2.9 2.5 2.8 3.6 4.4 4.5 4.1 4.5 3.9 4.8 4.0 4.9 4.7 4.3 4.4 4.8 5.0 4.5 3.5 3.8 3.7 3.9 5.1 4.5 5.1 4.7 4.4 4.1 4.0 4.4 4.6 4.0 3.3 4.2 4.2 4.2 4.3 3.0 4.1 1.3 1.4 1.5 1.0 1.5 1.1 1.8 1.3 1.5 1.2 1.3 1.4 1.4 1.7 1.5 1.0 1.1 1.0 1.2 1.6 1.5 1.6 1.5 1.3 1.3 1.3 1.2 1.4 1.2 1.0 1.3 1.2 1.3 1.3 1.1 1.3 5.8 6.4 6.5 7.7 7.7 6.0 6.9 5.6 7.7 6.3 6.7 7.2 6.2 6.1 6.4 7.2 7.4 7.9 6.4 6.3 6.1 6.3 6.3 6.4 6.0 6.9 6.7 6.9 5.8 6.8 6.7 6.7 6.3 6.5 6.2 5.9 2.8 3.2 3.0 3.8 2.6 2.2 3.2 2.8 2.8 2.7 3.3 3.2 2.8 3.0 2.8 3.0 2.3 3.8 2.8 2.8 2.6 2.8 3.4 3.1 3.0 3.1 3.1 3.1 2.7 3.2 3.3 3.0 2.5 3.0 3.4 3.0 5.1 5.3 5.5 6.7 6.9 5.0 5.7 4.9 6.7 4.9 5.7 6.0 4.8 4.9 5.6 5.8 6.1 6.4 5.6 5.1 5.6 5.1 5.6 5.5 4.8 5.4 5.6 5.1 5.1 5.9 5.7 5.2 5.0 5.2 5.4 5.1 2.4 2.3 1.8 2.2 2.3 1.5 2.3 2.0 2.0 1.8 2.1 1.8 1.8 1.8 2.1 1.6 1.9 2.0 2.2 1.5 1.4 1.5 2.1 1.8 1.8 2.1 2.4 2.3 1.9 2.3 2.5 2.3 1.9 2.0 2.3 1.8

第四章 聚类分析

4.1考虑下列4个样品的距离矩阵

12341?0???210? D??3?1120???4?5340?(1) 用最短距离法、最长距离法和类平均法对这4个样品聚类,画出聚类谱系图。 (2) 将D转化为模糊矩阵,利用模糊聚类法作聚类分析,画出谱系图。 (3) 比较各方法的聚类结果,指出它们之间的异同

4.2设有5个变量X1,X2,X3,X4和X5,它们之间的相关系数矩阵为

X1X1?1?X20.643?R?X3??0.082?X4?0.045X5???0.013X21?0.0860.211?0.3281?0.1640.4861?0.185X3X4X5??? ???1??

以R作为各变量间的相似性度量,利用最短距离法、最长距离法及类平均法对这5个变量作聚类分析,画出谱系图并比较这些结果。若利用模糊聚类法,情况又如何?

4.3根据第二章习题8中关于55个国家和地区1984年前在7个竞赛项目上的女子纪录数据作聚类分析:

(1)利用欧式距离计算各国家和地区间在这7个项目上的距离矩阵。

(2)利用最短距离法、最长距离法和类平均法对这55个国家和地区进行聚类,画出谱系图并比较各个方法的聚类结果的异同。

4.4根据第三章习题8中关于 植物花的形状尺寸距离,将第一类G1和第二类G2看成变量,定义各样品间的距离为欧氏距X??X1,X2,X3,X4?的100个观测值(即100个样品)

T离,利用某种谱系聚类法(最小距离法,最大距离法或类平均法)作如下聚类分析, (1)以X?X1为指标变量。 (2)以X??X1,X2?为指标变量。

T(3)以X??X1,X2,X3?为指标变量。

T(4)以X??X1,X2,X3,X4?为指标变量。

T(5)若将这100个样品分为两类,以上4种聚类结果和实际分类相比,效果如何?是否所

用指标变量越多,聚类效果就越好?

第五章 非参数秩方法

5.2为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的回复时间,随机地将作完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:

原方法:20,21,24,30,32,36,40,48,54;

新方法:19,22,25,26,28,29,34,37,38.

在??0.05下检验新方法是否显著地缩短了病人手术后的恢复时间。如果对新护理方法是否是缩短还是延长了恢复时间事先并不清楚,情况又如何?

5.5为检验维生素B1对刺激蘑菇生长的作用是否显著,从24朵大小相近的小蘑菇中随机的选出13朵施以维生素B1,另外11朵不施维生素B1,其他条件保持相同。一段时间后测得两组蘑菇的重量如下:

使用维生素B1:27,34,20.5,29.5,20,28,19.5,26.5,22,24.5,34,35.5,19, 未用维生素B1:18,14.5,13.5,12.5,23,24,21,17,18.5,9.5,14.

利用正态逼近求Wilcoxon秩和检验的p值,在??0.05下,维生素B1对刺激蘑菇生长的效果是否显著。

5.6为了比较两种不同的心理咨询方法的效果,将80位接受心理咨询的人随机的划分为两组,每组40人,其中一组接受一般的心理咨询,另一组接受特殊的心理咨询,试验结束后,将每个人的心理调整效果作仔细评估 ,并分为好,较好,较差和差四档,数据如下:

咨询方法 好 分类 一般 特殊 4 8 6 10 17 14 13 8 较好 较差 差

利用Wilcoxon秩和检验法检验特殊心理咨询方法的效果是否显著优于一般方法(??0.10)。

5.8利用Smirnov检验法求第二题中的检验p值。

5.9从同一工厂的三条不同的白糖包装线上分别抽取5袋、5袋和4袋白糖,测得其净重量如下(单位:克),

第一条包装线:487,492,510,507,488; 第二条包装线:500,498,503,501,512; 第三条包装线:495,494,506,499.

给定??0.10,利用Kruskal-Wallis方法检验这三条包装线包装白糖的重量有无显著差异。

5.14为考察两种不同催化剂对某一化工产品得率的影响,作试验9次,测得数据如下: 催化剂

0.38 0.45 0.72 0.66 0.75 0.68 0.44 0.31 0.32

A 催化剂0.21 0.23 0.45 0.60 0.77 0.65 0.60 0.83 0.21 B 利用双边符号检验法和双边Wilcoxon符号秩检验法检验这两种催化剂对该化工产品得率的影响是否显著。用正态逼近情况如何?(??0.05)。

5.15有两种不同的水稻品种,分别种植在一分为二的10块田地上,得到它们的产量(单位:公斤)如下: 品种363 A 品种379 B 356 443 332 337 356 356 348 340 345 435 345 345 396 396 356 387 371 383 利用Wilcoxon符号秩检验法检验这两种水稻品种的产量是否有显著差异(??0.05)。 5.16为了研究四种不同药品对治疗咳嗽的效果是否相同,有7位患者参加试验。每位患者在指定的不连续的4天内随机地服用这四种药品,记录这位患者在这4天内咳嗽的次数如下: 患者 药品 A B C D 251 207 167 301 126 180 104 120 49 123 63 186 45 85 147 100 233 232 236 250 291 208 158 183 1385 1204 1611 1913 1 2 3 4 5 6 7

利用Friedman检验和改进的Friedman检验法检验这四种药品对咳嗽的疗效是否相同(??0.05)。

第六章 列联表的独立性分析

6.2 为研究患肺癌是否与吸烟量有关,共计调查肺癌患者及其它疾病的患者各1357人,按每天平均吸烟量(单位:支)分类得如下表:

患者类型 吸烟量 0 1~4 5~14 15~24 25~49 ?50 肺癌 7 55 489 475 293 38 其他疾病 61 129 570 431 154 12

Pearson ?统计量被用以检验患肺癌是否与吸烟量有关,求检验的p值。

2第七章 试验设计

7.5交沙霉素片剂处方探索试验。

交沙霉素片在1991年事一种新型抗菌素,对多种疾病有确切疗效且毒副作用小,但其原

料很难溶于水,用常规辅料制成片很难崩解,以致药物不能正常释放,长期以来,国内没有片剂制剂。某药厂决定在片剂中很少用的表面活性剂吐温-80和另外三个因素,采用如下表: 水平 因素 1 2 3 吐温-80A(mg) 0.5 0.8 1.0 低取代B(mg) 9 6 12 淀粉C(美国) 硬脂酸镁D(mg) 4 10 7 0.8 1.5 2.5 三水平进行正交试验,由于没交互作用,用L9?34?安排试验,A,B,C,D分别安排在第1,2,3,4列上,9次试验的崩解时间(min)分别为19,9,7,11,4.5,6,13,9.5,5.

(1) 用直观分析法确定因素的主次和最佳配方。

(2) 用因素离差平方和最小者作为误差离差平方和的处理方法,在??0.05下用方差分

析法检验各因素对崩解时间有无显著影响? (3) 经(1)的正交试验分析后知,除淀粉对崩解时间没什么影响外,从因素—指标关系

图可见A,B,D的最佳点都在边界上,所以还有改进的余地,再进行第二批试验,因

素和水平数如下表所示,用L4?23?安排正交试验,4次试验的崩解时间分别为5.5,3,4.5,1.5,用直观分析法确定其最佳配方。 水平 因素 1 2 A 1.2 1.4 B 7 9 C 1.1 2.3

7.7中医古今名方改革试验。

中医古今名方之多,浩如烟海,《内经》始载13方,《伤寒杂病》发展为314方,时至明初,朱棣等人编写的《普济方》收方6万余首,后经不断的丰富和发展,实难记其数。因此,有必要对中药古今名方进行改革,以期精益求精。使现代科学技术的手段和方法为振兴中医药事业做出贡献。下面研究“五苓散方”的改革方案。 五苓散方功效:利水渗湿,内停水湿。 主治:(1)外有表症,内停水湿。

(2) 水湿内停的水肿,泄泻,小便不利,以及霍乱吐泻等症。

(3) 痰饮,脐不动悸,吐涎沫而头眩,或短气而咳者。

下面研究五苓散方的利尿作用,取五因素2水平如下表所示,用L8?27?确定五苓散方方

案,A,B,C,D,E分别放在第1,2,4,6,7列,不计交互作用。8次试验的尿量增加量分别为7.3,6.3,4.0,4.6,2.6,4.9,3.8,5.8(ml/30min),求五苓散方的最佳改革方案. 水平 因素 1 2 9 10 15 10 猪苓A(g) 泽泻B(g) 白术C(g) 9 15 9 50 6 5 茯苓D(g) 桂枝E(g)

7.8杀灭病毒性肝炎病毒消毒剂的配方试验。

过氧乙酸是广泛应用的一种杀灭病毒性肝炎病毒的主要消毒剂,但其有效成分极不稳定,以致影响消毒效果,现欲通过试验找出有关因素对其稳定性的影响,并找出使过氧乙酸稳定性饿最优条件。试验的因素及水平列表如下: 因素 水平 1 2

选用L9?27?,表头设计:A,B,A?B,C,A?D,D分别放在第1,2,3,4,6,7列,每次试验重复两次,将两次重复试验结果相加进行分析,8次试验结果(两次重复试验相加)放置24h过氧乙酸残存量(mg/3ml)分别为11.11,9.55,1.90,2.86,4.05,5.50,0.65,1.20.

A(%)稳定剂磷酸 0.3 0 水溶温度(。C) 25~30 35~40 10 0 加 不加 B浸泡C(支) 加盖否D

本文来源:https://www.bwwdw.com/article/s9lo.html

Top