2012数学建模A葡萄酒的评价 - 图文
更新时间:2024-01-04 22:28:01 阅读量: 教育文库 文档下载
2012高教社杯全国大学生数学建模竞赛
承 诺 书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名):
日期: 2012 年 9 月 7 日 赛区评阅编号(由赛区组委会评阅前进行编号):
1
2012高教社杯全国大学生数学建模竞赛
编 号 专 用 页
评 阅 人 评 分 备 注 赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
2
葡萄酒的评价
摘 要
目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。葡萄酒的质量与酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。
对于问题1,我们采用方差分析的方法建模解决。基本思路是:对两组评酒员的评价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两组评酒员的评价结果无显著性差异,通过比较两组评酒员评价结果的方差值,得出第二组的结果更可信。
对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分级。基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。最终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。
对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对比,经相关性检验得到他们具有显著的线性相关性,进而用线性回归的方法得出回归方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。
对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。
文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应用和推广。
关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验
1
1.问题的重述
确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
对问题1,我们对附件一所给的葡萄酒品尝评分表进行统计学分析,根据各组评酒员对同一种葡萄酒的评价结果算出每种酒样品的得分,并对每组的数据进行方差分析,利用F检验求出两组间的显著水平,并与0.05的显著水平比较,从而判断两组评酒员的评价结果有无显著性差异。确定哪组更可信时,分别求出两组评价结果的方差进行比较,方差越小,可信度也就越高。
对问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,属于分类问题。对该问题,可以采用主成分分析法,建立综合评价模型。选取附件2中关于葡萄的一级指标作为影响等级划分的因素,采用因子分析法,确定主成分,结合问题1所得出的葡萄酒的质量对酿酒葡萄进行综合评价并分级。
对问题3,分析酿酒葡萄与葡萄酒的理化指标之间的联系,既然是分析两指标之间的联系,就少不了作比较,从比较数据成对出现这一方面考虑,应该选取酿酒葡萄与葡萄酒理化指标中的共有指标进行分析,用一元线性回归模型求出对应指标之间的函数关系,进而确定酿酒葡萄与葡萄酒的理化指标之间的联系。
对问题4,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,参照问题2中酿酒葡萄的理化指标的处理方法,对葡萄酒的理化指标做同样分析。加权处理得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量产生影响的综合因子E,根据葡萄酒质量排名和E排名比较出产生的影响大小。
3.模型的假设
(1)假设评酒员都有很高的品评资质,给出的评价结果客观可信。 (2)假设问题1中葡萄酒的质量只与评酒员的评分有关。
(3)假设更可信的评分组给出的数据可以代表葡萄酒的真实质量。
4.符号说明
2
符号一 SS 方差 符号二 df 自由度 符号三 MS 标准差 符号四 F 统计量 符号五 P?value 假定值 符号六 Fcrit F临界值
符号七 Sig F值实际显著性概率 符号八 Fi 对应的主成分值 符号九 G 总主成分值 符号十 yi 因变量 符号十一 xi 自变量 符号十二 E 综合因子
5.模型的建立与求解
5.1 问题1的模型建立与求解
在评价结果采用百分制的前提下,对每一个品酒员所给出的每一种样品酒的评价结果求和,并求出每一组10名评酒员对同一种酒评价结果总分的平均值,此平均值即为本组针对该样品酒给出的评分,得到两组分别对27个红葡萄酒样品和28个白葡萄酒样品给出的评分。用Excel中的数据分析对每组的数据进行方差分析,利用F检验判断两组评酒员的评价结果有无显著性差异。
方差分析结果如下:
(1)分析两组评酒员对红葡萄酒的评价
表(1):方差分析
方差分析:单因素方差分析
SUMMARY
组 观测数 求和 列 1 27 1972.9 列 2 27 1903.9 方差分析 差异源 SS df 组间 88.16667 1 组内 1802.83 52
平均 73.07037 70.51481
MS 88.16667 34.66981
方差 53.51524 15.82439
F 2.543038
P-value 0.116842
F crit 4.026631
3
总计 1890.997 53
因为统计量F?2.5430?4.0266?F0.05(1,52),所以对红葡萄酒而言,两组评酒员的评价结果没有显著性差异。
因为第二组的方差远小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。
(2)分析两组评酒员对白葡萄酒的评价
表(2):方差分析
方差分析:单因素方差分析
SUMMARY
组 观测数 求和 列 1 28 2079.3 列 2 28 2142.9 方差分析 差异源 SS df 组间 72.23143 1 组内 1001.908 54 总计 1074.139 55
平均 74.26071 76.53214
MS 72.23143 18.55385
方差 27.05284 10.05485
F 3.89307
P-value 0.053613
F crit 4.019541
因为统计量F?3.8931?4.0195?F0.05(1,54),所以对白葡萄酒而言,两组评酒员的评价结果没有显著性差异。
因为第二组的方差小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。
综上所述,两组评酒员的评价结果无显著性差异,且第二组的结果更可信。 5.2 问题2的模型建立与求解
对于问题2,要求根据酿酒葡萄的理化标准及葡萄酒的质量,对酿酒葡萄进行分级,我们考虑红白两种酿酒葡萄及葡萄酒,建立模型,采运因子分析的方法进行主成分分析。
(1) 首先对所给附件二的数据进行求平均值等优化处理,以便于进行运算。为了对酿酒葡萄进行客观分级,采用主成分分析法,应用SPSS软件对数据进行因子分析,具体实施步骤如下:
1、数据的标准化
2、求出R及其特征值,贡献率
运用SPSS软件计算出相关矩阵R及其特征值,贡献率。在主成分个数选取时,按照特征值大于1的原则,计算结果如下表:
4
表(3):方差分解主成分提取分析表
成份 合计 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 6.966 4.940 3.737 2.840 1.999 1.742 1.418 1.270 .961 .738 .691 .514 .494 .372 .296 .254 .218 .200 .112 .070 .062 .043 .032 .016 .010 .003 1.135E-16 -3.056E-17 -1.201E-16 -3.414E-16 初始特征值 方差的 % 23.221 16.467 12.457 9.467 6.663 5.808 4.728 4.234 3.203 2.461 2.302 1.713 1.645 1.240 .986 .846 .728 .668 .375 .234 .206 .143 .108 .053 .034 .012 3.782E-16 -1.019E-16 -4.003E-16 -1.138E-15 累积 % 23.221 39.687 52.144 61.611 68.274 74.082 78.810 83.044 86.247 88.708 91.010 92.723 94.368 95.608 96.594 97.440 98.169 98.836 99.211 99.445 99.651 99.794 99.902 99.955 99.988 100.000 100.000 100.000 100.000 100.000 合计 6.966 4.940 3.737 2.840 1.999 1.742 1.418 1.270 提取平方和载入 方差的 % 23.221 16.467 12.457 9.467 6.663 5.808 4.728 4.234 累积 % 23.221 39.687 52.144 61.611 68.274 74.082 78.810 83.044
由上表可知,有8种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前8个成分作为主要成分,即:F1、……、F8。
然后求出成分矩阵,得出主成分的线性表达式。 8个主成分的成分矩阵如下表:
5
表(4):成分矩阵
1 总酚 花色苷 DPPH自由基 单宁 葡萄总黄酮 蛋白质 果梗比 L* 黄酮醇 出汁率 百粒质量 干物质含量 总糖 还原糖 可溶性固形物 氨基酸总量 白藜芦醇 果皮颜色 果皮质量 b* 可滴定酸 褐变度 PH值 苹果酸 多酚氧化酶活力 果穗质量 VC含量 固酸比 酒石酸 柠檬酸 -.343 -.142 .396 .381 .305 -.460 -.397 -.052 .099 .190 -.220 .094 .431 .367 .400 .863 .847 .756 .756 .719 .614 .583 -.564 .558 .545 -.534 .375 .256 .079 .246 .375 .064 -.332 -.257 -.138 -.302 .597 .270 .391 .313 2 -.171 -.106 -.461 -.152 -.286 -.499 -.212 -.330 .022 -.181 -.355 .856 .785 .769 .760 .543 -.060 .278 -.247 .488 .458 -.090 -.280 .321 .087 3 -.177 -.106 -.013 -.280 -.197 .181 .172 .305 .028 -.271 -.472 -.189 -.150 -.113 -.316 .016 .818 .738 -.613 .601 -.596 .054 .184 .166 -.214 4 成份 5 -.018 .097 -.023 -.166 .031 .193 -.411 .050 -.173 .016 .269 .095 .103 .116 .121 -.241 -.217 -.020 .325 .191 -.330 -.020 .130 .087 .235 .598 -.546 .534 .312 .356 6 .184 .196 .114 .246 .297 -.129 -.405 -.307 -.501 .398 .149 -.024 -.040 -.108 -.048 -.297 .165 .294 -.080 .455 .220 -.057 -.115 .367 -.339 .044 .132 -.104 -.145 -.072 7 -.011 -.093 .212 .243 .124 .081 .088 .076 .476 -.144 .222 .054 -.072 -.050 -.025 .167 .293 .257 .477 .295 .296 -.081 -.286 -.114 -.007 .227 -.022 -.317 .202 .292 8 .088 .063 .114 -.057 .057 -.126 .040 .345 .216 .015 .194 .034 .297 .073 .266 -.009 .294 .213 .221 .090 -.138 .110 .240 .117 .165 .093 .160 .223 -.516 -.428 .224 -.302 .215 -.068 .284 .272 -.215 -.038 -.070 .169 .079 .094 .261 .128 .147 .455 .075 .052 -.112 -.023 -.004 -.707 .696 -.661 -.594 .067 -.009 -.002 .386 -.367 由上面表(4)可以看出:总酚、花色苷、单宁、DPPH自由基、葡萄总黄酮、蛋白质、果梗比、黄酮醇、多酚氧化酶活力、出汁率和褐变度为第一主成分,干物质含量、总糖、还原糖、可溶性固体物、氨基酸总量和可滴定酸为第二主成分,白藜芦醇、果皮颜色、b*和柠檬酸为第三主成分,PH和酒石酸为第四种主成分,百粒质量、果穗质量、固酸比为第五主成分,苹果酸为第六主成分,果皮质量为第七主成分,VC含量、L*为第八主成分。
然后计算出8个主成分用原来指标表达出的线性关系式,其中各变量前的系数为表(4)中数据除以其对应主成分的特征值开平方得到,即:
6
Zji?xji/aj (i?1,2,3,?,8.j?1,2,3,?30.xji为表(4)中相应特征值,aj为主
成分特征值)(所得系数见附录2)
30,h?1,2,3,…,27。bhj为酿酒葡萄原始Fi?Zji*bhj (i?1,2,3,?,8.j?1,2,3,?,数据)
最后计算出综合指标,用8个主成分的贡献率分别乘以F1、F2、F3……F8的值得出最终的G值,其表达式如下:
G?0.232?F1?0.165?F2?0.125?F3?0.095?F4?0.067?F5?0.058?F6?0.047?F7?0.042?F8
由问题一得到的结果可知,第二组的评价结果更可信,所以,该问题建模时使用第二组的评分作为葡萄酒质量的依据,因为酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,故两者之间有着很强的相互依赖关系。
综合考虑酿酒葡萄的理化标准和葡萄酒的质量来对酿酒葡萄进行分级。分级见下表:
表(5):对酿酒红葡萄的分级 红葡萄 F 按F排名 酒质量评分 按酒质量排名 名次之和 综合排名 等级 1 9 2 12 6 11 4 15 19 5 3 18 14 7 25 20 8 21 16 13 10 27 22 26 74.6 77.1 72.2 78.2 72.6 75.8 71.6 74 74.5 68.3 66.3 72.1 71.2 65.4 72.6 71.5 65.3 69.9 68.1 65.7 61.6 72 68.8 71.5 4 2 9 1 7 3 12 6 5 19 22 10 15 25 8 13 26 16 21 24 27 11 17 14 5 11 11 13 13 14 16 21 24 24 25 28 29 32 33 33 34 37 37 37 37 38 39 40 1 Ⅰ 2 Ⅱ 3 Ⅱ 4 Ⅱ 5 Ⅱ 6 Ⅱ 7 Ⅱ 8 Ⅲ 9 Ⅲ 10 Ⅲ 11 Ⅲ 12 Ⅲ 13 Ⅲ 14 Ⅳ 15 Ⅳ 16 Ⅳ 17 Ⅳ 18 Ⅳ 19 Ⅳ 20 Ⅳ 21 Ⅳ 22 Ⅳ 23 Ⅳ 24 Ⅴ 葡萄样品3 690.5144 195.7758 葡萄样品23 521.9043 葡萄样品21 葡萄样品9 186.0653 202.5838 葡萄样品19 186.9619 葡萄样品20 211.0541 葡萄样品22 葡萄样品2 175.0546 140.9148 葡萄样品17 210.2464 葡萄样品12 葡萄样品6 282.394 葡萄样品5 151.633 葡萄样品4 176.3589 197.2206 葡萄样品18 101.7858 葡萄样品14 134.7619 葡萄样品24 葡萄样品7 196.6263 127.7456 葡萄样品16 葡萄样品1 166.7603 179.0912 葡萄样品15 193.7104 葡萄样品11 69.99223 葡萄样品26 116.4478 葡萄样品13 91.81979 葡萄样品27 7
葡萄样品8 160.4123 112.1741 葡萄样品10 115.9208 葡萄样品25 17 24 23 66 68.8 68.2 23 18 20 40 42 43 25 Ⅴ 26 Ⅴ 27 Ⅴ 对本问题分析不能直接证明酿酒葡萄的好坏与葡萄中某些物质如氨基酸、蛋白质的含量多少等因素直接相关,由于酿酒葡萄的理化标准是按主成分分析得出的,其F值不能与葡萄酒质量的评分直接叠加使用进行综合排名,加之葡萄酒质量除与酿酒葡萄的好坏直接相关。我们进行了主成分分析F值的排名和根据葡萄酒的质量进行两种排名。对于综合排名分级,我们为了避免讨论两者所占的权重,采取了两种排名名次的求和重新进行排名分级,结果显得更加客观。最后,我们以10作为区间长度,将葡萄分为五个等级。
(2) 同理,我们对酿酒白葡萄运用SPSS软件进行主成分分析,取特征值大于1
的因子作为主成分,得出的主成分提取分析表如下:
表(6):方差分解主成分提取分析表 成份 合计 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 5.830 4.927 3.630 2.081 1.889 1.655 1.523 1.280 1.238 1.002 .967 .863 .639 .602 .396 .345 .303 .279 .176 .117 .096 .064 .051 .023 .014 .008 .003 8.222E-17 初始特征值 方差的 % 19.434 16.422 12.102 6.935 6.297 5.516 5.077 4.266 4.127 3.340 3.222 2.876 2.131 2.006 1.319 1.149 1.009 .930 .585 .391 .320 .213 .171 .077 .047 .026 .010 2.741E-16 累积 % 19.434 35.856 47.958 54.893 61.190 66.705 71.782 76.049 80.175 83.516 86.738 89.614 91.745 93.751 95.070 96.219 97.229 98.159 98.744 99.135 99.455 99.668 99.839 99.917 99.963 99.990 100.000 100.000 合计 5.830 4.927 3.630 2.081 1.889 1.655 1.523 1.280 1.238 1.002 提取平方和载入 方差的 % 19.434 16.422 12.102 6.935 6.297 5.516 5.077 4.266 4.127 3.340 累积 % 19.434 35.856 47.958 54.893 61.190 66.705 71.782 76.049 80.175 83.516 8
30 -1.318E-16 -4.393E-16 100.000 由上表可知,有10种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前10个成分作为主要成分。
各主成分的的成分矩阵如下:
29 -4.434E-18 -1.478E-17 100.000
表(7):成分矩阵
成份 1 干物质含量g/100g 可溶性固形物g/l 总糖g/L 还原糖g/L 果皮颜色b* 氨基酸总量 出汁率(%) 果穗质量/g L* 单(mmol/kg) 百粒质量/g 多酚氧化酶活力 总(mmol/kg) 葡萄总黄酮(mmol/kg) 蛋白质 固酸比 可滴定酸(g/l) 酒石酸 DPPH自由基1/IC50(g/L) 花色苷 果皮颜色a* VC 黄酮醇(mg/kg) 果梗比(%) 果皮质量(g) 苹果酸 -.170 -.261 .133 -.390 .368 .386 -.480 .371 .101 .117 .220 .610 .342 -.331 .389 .065 .351 .149 -.194 .129 .281 .312 -.264 -.008 .337 .299 -.029 -.058 .177 -.147 -.380 -.280 -.292 .270 -.421 -.496 .014 .288 .129 .576 -.553 .501 .279 -.012 -.341 -.357 .187 -.062 .133 .441 .238 -.132 .305 .068 -.142 .003 -.312 .081 .302 .281 .139 .283 -.369 .276 .215 .260 .308 -.251 .006 .083 .224 .151 -.020 .342 .435 .640 -.628 .625 -.492 .452 .232 .583 -.547 .019 -.133 -.301 -.213 .286 .223 -.126 .004 .127 -.174 .410 -.210 -.250 .024 .059 .435 .198 .273 -.029 .092 -.092 -.326 -.054 -.222 .212 -.115 -.015 .011 -.117 .205 .329 -.070 -.068 .146 -.170 -.053 .278 .002 .763 .502 -.050 .132 .202 -.187 .094 -.129 -.044 酚.071 .763 .465 -.140 .221 .167 -.163 .050 -.034 -.150 -.462 -.450 .301 -.385 -.142 -.076 -.071 -.195 -.388 -.051 .282 .305 .113 .372 -.003 .135 .328 -.284 .265 -.055 宁.756 .721 .646 .592 -.577 -.576 .519 .472 -.189 -.073 .152 .111 .204 .478 .366 .372 -.097 .004 -.613 .181 -.231 .278 -.497 .231 .018 .164 .004 .532 .216 .226 -.071 -.134 -.346 -.273 .275 .061 .210 -.013 .357 -.211 .037 -.199 -.085 .126 -.057 -.167 -.019 .260 .082 .276 .044 -.060 .173 -.046 -.182 -.301 -.035 .245 -.188 -.159 -.301 -.138 -.145 .319 .169 -.028 -.078 .070 -.012 .057 -.208 -.143 -.143 .073 .107 .164 -.450 .179 .091 -.340 .802 -.300 -.028 -.041 -.274 .297 .067 -.034 .162 -.042 .835 2 -.175 3 .105 4 .155 5 -.062 6 -.091 7 .114 8 .222 9 -.137 10 -.067 9
褐变度 白藜芦醇(mg/kg) 柠檬酸 PH值
.215 .066 .223 .284
.149 .062 -.107 -.403
-.128 .235 .289 .355
-.591 .387 .066 -.127
.324 .127 .301 .012
-.193 -.607 .353 -.082
.395 -.247 .455 -.411
-.023 .241 .006 -.489
.278 .284 .000 .148
.157 .212 .097 -.201
与(1)采用相同的方法进行处理得出主成分数据。从而根据所得数据对酿酒白葡萄进行分级如下:
表(8):对酿酒白葡萄的分级 白葡萄 葡萄样品5 葡萄样品28 葡萄样品10 葡萄样品25 葡萄样品15 葡萄样品9 葡萄样品27 葡萄样品3 葡萄样品24 葡萄样品4 葡萄样品21 葡萄样品20 葡萄样品22 葡萄样品17 葡萄样品23 葡萄样品14 葡萄样品26 葡萄样品2 葡萄样品1 葡萄样品6 葡萄样品18 葡萄样品7 葡萄样品12 葡萄样品19 葡萄样品11 葡萄样品8 葡萄样品13 葡萄样品16 F 按酒质量按F排名 酒质量评分 排名 名次之和 综合排名 等级 178.7 254.5 140.9 158.1 179.5 129.6 166.4 337.7 206.3 140.3 104.5 137.5 98.0 78.5 102.4 103.7 139.4 125.8 86.0 124.2 86.7 115.8 115.9 55.0 105.4 85.6 44.7 66.7 5 2 8 7 4 12 6 1 3 9 18 11 21 25 20 19 10 13 23 14 22 16 15 27 17 24 28 26 81.5 79.6 79.8 79.5 78.4 80.4 77.0 75.6 76.1 76.9 79.2 76.6 79.4 80.3 77.4 77.1 74.3 75.8 77.9 75.5 76.7 74.2 72.4 76.4 71.4 72.3 73.9 67.3 1 5 4 6 9 2 13 20 18 14 8 16 7 3 11 12 22 19 10 21 15 23 25 17 27 26 24 28 6 7 12 13 13 14 19 21 21 23 26 27 28 28 31 31 32 32 33 35 37 39 40 44 44 50 52 54 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Ⅰ Ⅰ Ⅱ Ⅱ Ⅱ Ⅱ Ⅱ Ⅲ Ⅲ Ⅲ Ⅲ Ⅲ Ⅲ Ⅲ Ⅳ Ⅳ Ⅳ Ⅳ Ⅳ Ⅳ Ⅳ Ⅳ Ⅴ Ⅴ Ⅴ Ⅴ Ⅴ Ⅴ 5.3 问题3的模型建立与求解
画出酿酒葡萄与葡萄酒的相同指标的散点图,我们以单宁含量为例
10
单宁14红葡萄酒121086420051015酿酒红葡萄202530系列1图(1):酿酒葡萄和葡萄酒的单宁含量
不妨假设散点有线性关系,做一元线性回归分析,建立酿酒葡萄和葡萄酒的理化指标之间的函数关系。把酿酒葡萄的理化指标作为自变量,葡萄酒的理化指标作为因变量,建立线性回归的数学模型:
yi?aixi?bi
运用SPSS统计功能,分别对每一组指标进行求解,求得每一组指标之间的函数关系,下面以酿酒红葡萄和红葡萄酒的单宁含量对比值为例
表(9)模型汇总b
模型
R
1
.718a
R 方
.516
调整 R 方
.496
标准 估计的误差
2.06150
Durbin-Watson
1.577
R方(拟合优度):是线性回归的决定系数,说明自变量和因变量形成的散点与回归曲线的接近程度,数值介于0和1之间,这个数值越大说明回归越好,也就是散点越集中于回归线上。
表(10)方差分析表
模型 1
回归 残差
平方和 113.084 106.245
df
1 25
均方 113.084 4.250
F 26.609
Sig.
.000a
总计 219.329 26
此表时所用的模型的检验结果,一个标准的方差分析表。Sig值是回归关系的显著性系数,Sig是F值实际显著性概率即P值。当Si g<=0.05的时候,说明回归关系具有统计学意义。如果Sig>0.05,说明二者之间用当前模型进行回归没有统计学意义,应该换一个模型来进行回归。
11
由表可见所用的回归模型F统计量值26.609,P值为0.000,因此我们用的这个回归模型是有统计学意义的。
表(11) 系数
模型 非标准化系数 B 1 (常量) 酿酒葡萄 2.891 .315 标准 误差 .936 .061 标准系数 试用版 t 3.088 .718 5.158 Sig. .005 .000
此表给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还会给出标化/未标化系数。
表(12) 残差统计量
预测值 残差 标准 预测值 标准 残差 极小值 4.0812 -6.91305 -1.527 -3.353 极大值 10.8980 3.94995 1.742 1.916 均值 7.2661 .00000 .000 .000 标准 偏差 2.08552 2.02147 1.000 .981 N 27 27 27 27
上面的回归分析结果表明:酿酒红葡萄的单宁含量与红葡萄酒的单宁含量关系极为密切,有显著的线性关系。
综合以上得出回归方程为:
y?2.891?0.315x
??
图(2):回归 标准化残差的标准P-P图
12
由以上结果及图(2)的标准化残差的线性关系可以验证出假设的合理性,所以可以用线性回归对各个指标进行线性回归。用同样的方法可以得出各有效指标(Sig小于0.05)的回归分析结果(见附表)和回归方程:
酿酒红葡萄与红葡萄酒的总酚回归方程:y?1.362?0.333x 酿酒红葡萄与红葡萄酒的DPPH回归方程:y??0.08?0.886x 酿酒红葡萄与红葡萄酒的花色苷回归方程:y?14.335?2.386x 酿酒红葡萄与红葡萄酒的总黄酮回归方程:y?0.763?0.503x 酿酒白葡萄与白葡萄酒的单宁回归方程:y?0.964?0.237x 酿酒白葡萄与白葡萄酒的总酚回归方程:y?0.722?0.099x 酿酒白葡萄与白葡萄酒的DPPH回归方程:y?0.016?0.124x 酿酒白葡萄与白葡萄酒的总黄酮回归方程:y??0.442?0.533x 5.4 问题4的模型建立与求解
问题4要求分析酿酒葡萄和葡萄酒的理化指标对葡萄质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。以白葡萄为例,根据问题2中对酿酒白葡萄的理化指标的分析方法,对白葡萄酒的理化指标进行同理分析,得出以下两组分析结果:
表(13) 白葡萄G值和白葡萄酒的G值及质量
白葡萄 葡萄样品1 葡萄样品2 葡萄样品3 葡萄样品4 葡萄样品5 葡萄样品6 葡萄样品7 葡萄样品8 葡萄样品9 葡萄样品10 葡萄样品11 葡萄样品12 葡萄样品13 葡萄样品14 葡萄样品15 G 白葡萄酒 86.022 酒样品1 125.805 酒样品2 337.697 酒样品3 140.250 酒样品4 178.731 酒样品5 124.203 酒样品6 115.762 酒样品7 85.613 酒样品8 129.603 酒样品9 140.912 酒样品10 105.366 酒样品11 115.935 酒样品12 44.713 酒样品13 103.698 酒样品14 179.483 酒样品15 G 白葡萄酒质量 0.330 0.251 0.409 0.411 0.325 0.262 0.280 0.308 0.375 0.419 0.288 0.470 0.308 0.269 0.515 81.5 77.1 74.3 74.2 73.9 72.4 72.3 71.4 67.3 80.4 80.3 79.8 79.6 79.5 79.4 ???????????????? 13
葡萄样品16 葡萄样品17 葡萄样品18 葡萄样品19 葡萄样品20 葡萄样品21 葡萄样品22 葡萄样品23 葡萄样品24 葡萄样品25 葡萄样品26 葡萄样品27 葡萄样品28 66.698 酒样品16 78.490 酒样品17 86.737 酒样品18 54.991 酒样品19 137.525 酒样品20 104.495 酒样品21 98.016 酒样品22 102.377 酒样品23 206.320 酒样品24 158.071 酒样品25 139.414 酒样品26 166.438 酒样品27 254.548 酒样品28 0.260 0.315 0.271 0.400 0.545 0.245 0.386 0.271 0.911 0.307 0.319 0.687 0.413 79.2 78.4 77.9 77.4 77 76.9 76.7 76.6 76.4 76.1 75.8 75.6 75.5
因为酿酒白葡萄的G值远大于白葡萄酒的G值,为了避免白葡萄酒的G值在综合评价中不起作用,把酿酒白葡萄的G值按照降序排列得出的序号作为第一个变量t1,把白葡萄酒的G值按照降序排列得出的序号作为第二个变量t2。定义一个量E,令
E?t1?t2,算出E值并按升序排序将其作为第三个变量t3,把葡萄酒的质量按打分结果进行降序排列,排出的序号作为变量t4,结果如下:
表(14) 白葡萄和白葡萄酒的各项排名
白葡萄 葡萄样品13 葡萄样品17 葡萄样品24 葡萄样品18 葡萄样品9 葡萄样品6 葡萄样品3 葡萄样品28 葡萄样品22 葡萄样品1 葡萄样品4 葡萄样品21 葡萄样品8 葡萄样品12 葡萄样品25 葡萄样品27 葡萄样品26 葡萄样品5 G1排名t1 28 25 3 22 12 14 1 2 21 23 9 18 24 15 7 6 10 5 白葡萄酒 酒样品13 酒样品17 酒样品24 酒样品18 酒样品9 酒样品6 酒样品3 酒样品28 酒样品22 酒样品1 酒样品4 酒样品21 酒样品8 酒样品12 酒样品25 酒样品27 酒样品26 酒样品5 G2排E排白葡萄酒质名t2 E 名t3 量排名t4 17 45 25 1 16 41 21 2 1 4 1 3 23 45 26 4 12 24 11 5 25 39 19 6 9 10 5 7 7 9 4 8 11 32 14 9 13 36 15 10 8 17 8 11 28 46 27 12 18 42 22 13 5 20 10 14 19 26 13 15 2 8 2 16 15 25 12 17 14 19 9 18 14
葡萄样品10 葡萄样品11 葡萄样品14 葡萄样品7 葡萄样品15 葡萄样品20 葡萄样品2 葡萄样品16 葡萄样品19 葡萄样品23 8 17 19 16 4 11 13 26 27 20 酒样品10 酒样品11 酒样品14 酒样品7 酒样品15 酒样品20 酒样品2 酒样品16 酒样品19 酒样品23 6 20 24 21 4 3 27 26 10 22 14 37 43 37 8 14 40 52 37 42 7 17 24 18 3 6 20 28 16 23 19 20 21 22 23 24 25 26 27 28 将表(14)按照白葡萄酒质量进行降序排列,对白葡萄酒质量排名t4与综合因子E的排名t3做双样本方差的F检验,检验结果如下表:
表(15) 双样本方差分析
F-检验 双样本方差分析
平均 方差 观测值 df F
P(F<=f) 单尾 F 单尾临界
25
14.11111111 65.87179487
27 26
1.045584046 0.455192025 1.929212675
1
15 63 27 26
查F分布表得(??0.05,n1?27,n2?27):
F?(n1?1,n2?1)?F0.025(27?1,27?1)?2.1943
2则有:
F1??(n1?1,n2?1)?21?0.456
F0.025(27?1,27?1)从表的检验结果可得: 0.456?F?1.0456?2.1943
认为总体方差相等,即白葡萄酒质量与综合因子E相比,波动没有显著变化,可认为酿酒白葡萄和白葡萄酒理化指标对白葡萄酒质有影响,即可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
6.模型结果的分析与检验
问题1中对显著性差异的求解,用到了F检验,得出的F测量值可以直接和临界值比较,从而判断两组评酒员的评价结果无显著性影响。这种方法用起来很方便,也很实用。在可信度方面,由方差越小水平越稳定的评判标准,判断得出第二组的结果更可信。
15
问题2中的模型求解,用主成分分析法把多因素进行了简化,但是由于主成分的选取严格遵守了特征值大于1的原则,所以具有很强的代表性,说明了求解方法的合理性和很强的实用性。
问题3中的模型,先做出了假设,在假设的基础下求解,然后把求出的解和假设比较,发现它们是一致的,从而对假设做出了检验。
7.模型的推广与改进方向
模型一用到的方差分析法可用于假设检验求测量值,模型二利用的综合评价模型,可以对一些具有多种影响因素的指标进行评价,例如在对各大学诸多影响因素进行综合排名方面的应用等。
在模型一的可信度求解方面,综合考虑方差、残差等因素,减少误差,提高精确度。针对模型三的反复重复操作,可以编写一个小程序把多组值的比较结果一次求出,简化运算过程。
8.模型的优缺点
模型一 优点:采用方差分析法,可以用多种软件进行求解,其中用Excel的求解简单实用,容易上手。缺点是在对可信度的评判上仅参照方差这一个指标,不够精确。
模型二 优点:用主成分分析法对多种指标重新分类,将分析过程简化,在对等级的划分方面,创新性的采用对排名之和再排名的方法来避免在综合排名时,两个指标中因某一指标数值上远远大于另一指标而使另一指标对排名不起作用的现象的发生。
模型三 优点:选取相同指标进行单独比较,做出线性回归函数,从细微方面反映酿酒葡萄和葡萄酒的理化指标之间的关系。缺点也是太零碎,同样的方法要重复做11次。
模型四 优点:同模型二,对单因素排名之后再排名,使之具有一定的客观性。此外对所得的综合排名进行的F检验,从数值上说明了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
参考文献
[1] 姜启源. 数学模型(第三版)[M]. 北京:高等教育出版社,1999.
[2] 韩中庚. 数学建模方法及其应用(第二版)[M]. 北京:高等教育出版社,2009.
[3] 盛骤、谢式千、潘承毅. 概率论与数理统计(第四版). 北京:高等教育出版社,2011. [4] 赵丹亚、邵丽.Excel2000应用案例—Excel2000应用案例之二十四. http://www.ltyz.gx.cn/excel/lesson/Ex2k/Ex2k_23.htm, 2012-9-9
[5] 王双虎.一元线性回归模型http://www.doc88.com/p-395940508313.html 2012-9-8
16
附录
附录1.各组评酒员对各种样品酒评分的平均值 红葡萄酒 白葡萄酒 样品 第一组 第二组 样品 第一组 第二组 1 62.7 68.1 1 82 77.9 2 80.3 74 2 74.2 75.8 3 80.4 74.6 3 85.3 75.6 4 68.6 71.2 4 79.4 76.9 5 73.3 72.1 5 71 81.5 6 72.2 66.3 6 68.4 75.5 7 71.5 65.3 7 77.5 74.2 8 72.3 66 8 71.4 72.3 9 81.5 78.2 9 72.9 80.4 10 74.2 68.8 10 74.3 79.8 11 70.1 61.6 11 72.3 71.4 12 53.9 68.3 12 63.3 72.4 13 74.6 68.8 13 65.9 73.9 14 73 72.6 14 72 77.1 15 58.7 65.7 15 72.4 78.4 16 74.9 69.9 16 74 67.3 17 79.3 74.5 17 78.8 80.3 18 60.3 65.4 18 73.1 76.7 19 78.6 72.6 19 72.2 76.4 20 78.6 75.8 20 77.8 76.6 21 77.1 72.2 21 76.4 79.2 22 77.2 71.6 22 71 79.4 23 85.6 77.1 23 75.9 77.4 24 78 71.5 24 73.3 76.1 25 69.2 68.2 25 77.1 79.5 26 73.8 72 26 81.3 74.3 27 73 71.5 27 64.8 77 28 81.3 79.6
附录2:酿酒红葡萄理化指标的主成分系数 酿酒红葡萄 1 2 3 4 5 6 7 1 0.327 -0.077 -0.092 0.133 -0.013 0.139 -0.009 2 0.321 -0.048 -0.055 -0.179 0.069 0.149 -0.078 3 0.286 -0.207 -0.007 0.128 -0.016 0.086 0.178 4 0.286 -0.068 -0.145 -0.04 -0.117 0.186 0.204 8 0.078 0.056 0.101 -0.051 17
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0.272 0.233 0.221 -0.214 0.211 0.206 -0.202 0.142 0.097 0.03 0.093 0.142 0.024 -0.126 -0.097 -0.052 -0.114 0.226 0.102 0.148 0.119 -0.13 -0.054 0.15 0.144 0.116 -0.129 -0.225 -0.095 -0.148 0.01 -0.081 -0.16 0.385 0.353 0.346 0.342 0.244 -0.027 0.125 -0.111 0.22 0.206 -0.04 -0.126 0.144 0.039 -0.207 -0.179 -0.023 0.045 0.085 -0.102 0.094 0.089 0.158 0.014 -0.14 -0.244 -0.098 -0.078 -0.058 -0.163 0.008 0.423 0.382 -0.317 0.311 -0.308 0.028 0.095 0.086 -0.111 -0.114 0.049 0.223 0.19 0.207 0.169 0.161 -0.128 -0.023 -0.042 0.1 0.047 0.056 0.155 0.076 0.087 0.27 0.045 0.031 -0.066 -0.014 -0.002 -0.42 0.413 -0.392 -0.352 0.04 -0.005 -0.001 0.229 -0.218 0.022 0.137 -0.291 0.035 -0.122 0.011 0.19 0.067 0.073 0.082 0.086 -0.17 -0.153 -0.014 0.23 0.135 -0.233 -0.014 0.092 0.062 0.166 0.423 -0.386 0.378 0.221 0.252 0.225 -0.098 -0.307 -0.233 -0.38 0.302 0.113 -0.018 -0.03 -0.082 -0.036 -0.225 0.125 0.223 -0.061 0.345 0.167 -0.043 -0.087 0.278 -0.257 0.033 0.1 -0.079 -0.11 -0.055 0.104 0.068 0.074 0.064 0.4 -0.121 0.186 0.045 -0.06 -0.042 -0.021 0.14 0.246 0.216 0.401 0.248 0.249 -0.068 -0.24 -0.096 -0.006 0.191 -0.018 -0.266 0.17 0.245 0.051 -0.112 0.035 0.306 0.192 0.013 0.172 0.03 0.264 0.065 0.236 -0.008 0.261 0.189 0.196 0.08 -0.122 0.098 0.213 0.104 0.146 0.083 0.142 0.198 -0.458 -0.38
附表3:酿酒白葡萄理化指标的主成分系数 酿酒白葡萄 1 2 3 4 5 1 0.346 -0.079 0.055 0.107 -0.045 2 0.332 -0.135 -0.02 -0.028 -0.199 3 0.313 -0.085 -0.05 0.012 -0.252 4 0.299 -0.033 0.002 0.114 -0.199 5 0.268 0.068 -0.32 0.003 0.2 6 0.245 0.05 0.095 0.369 0.044 7 -0.239 0.092 -0.12 0.15 0.153 8 -0.239 0.215 0.146 0.157 -0.009 9 0.215 0.165 -0.26 -0.049 0.26 10 0.195 0.168 0.121 -0.093 -0.153 11 -0.191 0.136 -0.08 -0.049 -0.282 6 -0.07 0.231 0.029 -0.15 -0.07 0.098 -0.04 -0.13 -0.02 0.202 0.219 7 0.09 0.05 0.07 0.22 0.04 -0.05 0.14 -0.04 -0.15 -0.24 0.09 8 0.2 -0.03 -0.03 0.22 -0.17 -0.14 -0.27 -0.12 -0.13 0.28 0 9 -0.12 0.14 0.15 -0.02 -0.07 0.06 -0.01 0.05 -0.18 -0.13 0.29 10 -0.07 -0.04 -0.14 0.07 0.11 0.16 -0.45 0.18 0.09 -0.34 0.26 18
12 -0.186 -0.173 -0.04 -0.135 -0.037 0.237 0.3 0.12 -0.25 13 0.029 0.344 0.244 -0.097 0.161 0.13 -0.13 0.04 -0.03 14 0.001 0.344 0.263 -0.035 0.096 0.157 -0.15 0.08 -0.11 15 0.093 0.288 0.122 -0.209 0.003 -0.19 0.22 -0.05 0.01 16 0.063 -0.283 0.306 -0.148 0.092 0.019 -0.02 -0.2 -0.1 17 -0.008 0.281 -0.29 0.198 -0.127 0.046 0.07 0.19 0.18 18 0.142 -0.222 0.01 0.155 0.298 0.338 -0.07 -0.1 0.29 19 0.18 0.204 -0.07 -0.087 -0.153 0.154 -0.26 -0.01 -0.06 20 -0.157 -0.19 0.068 0.193 0.136 0.185 -0.12 0.27 -0.33 21 -0.116 -0.223 0.302 -0.008 -0.045 -0.1 0 0.25 0.24 22 -0.121 0.006 -0.29 -0.236 0.097 0.237 -0.25 0.12 0.19 23 0.112 0.13 0.263 -0.248 0.321 0.053 0.07 0.25 0.23 24 -0.07 -0.176 -0.25 0.081 0.249 0.05 -0.16 0.28 0.3 25 -0.108 0.166 0.195 0.153 -0.241 0.272 0.1 -0.23 0.26 26 0.055 0.174 0.053 0.423 0.283 0.116 0.23 -0.01 -0.03 27 0.089 0.067 -0.07 -0.41 0.236 -0.15 0.32 -0.02 0.25 28 0.027 0.028 0.123 0.268 0.092 -0.47 -0.2 0.21 0.25 29 0.092 -0.048 0.152 0.046 0.219 0.274 0.37 0.01 0 30 0.118 -0.182 0.186 -0.088 0.009 -0.06 -0.33 -0.43 0.13
附录4:主成分总值的原始中间数据 白葡萄酒 F1 F2 F3 G 酒样品1 0.8812216 -0.108533 0.16036937 0.329806 酒样品2 0.670982 -0.082639 0.12210886 0.2511217 酒样品3 1.0931025 -0.134628 0.19892859 0.4091046 酒样品4 1.0970753 -0.135118 0.19965157 0.4105914 酒样品5 0.8674965 -0.106842 0.15787161 0.3246693 酒样品6 0.7011228 -0.086352 0.12759403 0.2624022 酒样品7 0.7474717 -0.09206 0.13602886 0.2797488 酒样品8 0.8229543 -0.101357 0.14976558 0.3079989 酒样品9 1.0030531 -0.123538 0.18254092 0.3754027 酒样品10 1.1195876 -0.13789 0.20374849 0.4190169 酒样品11 0.7699841 -0.094833 0.14012578 0.2881742 酒样品12 1.2552144 -0.154594 0.22843056 0.4697765 酒样品13 0.8242786 -0.10152 0.15000658 0.3084945 酒样品14 0.7183381 -0.088472 0.13072697 0.2688452 酒样品15 1.3764933 -0.169531 0.25050154 0.5151664 酒样品16 0.6958257 -0.085699 0.12663005 0.2604197 酒样品17 0.8428181 -0.103803 0.15338051 0.3154331 酒样品18 0.7236351 -0.089124 0.13169095 0.2708277 酒样品19 1.0679417 -0.13153 0.19434968 0.3996878 -0.05 -0.15 -0.04 -0.07 0.15 -0.17 -0.05 0.28 0.31 -0.25 0.01 0.08 -0.06 0.18 -0.15 0.16 0.21 0.1 -0.2 19
酒样品20 酒样品21 酒样品22 酒样品23 酒样品24 酒样品25 酒样品26 酒样品27 酒样品28
1.4559487 0.6547738 1.0321868 0.7236351 2.4332496 0.8189815 0.8534122 1.8360101 1.1036966 -0.179317 -0.080643 -0.127126 -0.089124 -0.299683 -0.100867 -0.105108 -0.226126 -0.135933 0.26496125 0.1191592 0.18784281 0.13169095 0.44281564 0.1490426 0.15530847 0.33412685 0.20085655 0.5449033 0.2450556 0.3863062 0.2708277 0.910668 0.306512 0.319398 0.6871452 0.4130695 20
正在阅读:
2012数学建模A葡萄酒的评价 - 图文01-04
魏晋南北朝山水画发展和传统隐逸思想之关系05-23
燃气锅炉招标文件04-05
FWK-F型失步振荡解列装置原理及使用说明书 - 图文06-12
人物外貌片断描写作文500字02-04
抗菌药物培训考试试题及答案11-15
3.民工业余学校台帐02-03
JOA腰痛疾患疗效评定01-12
突出危险性评估报告(最新)06-10
3.1.2 文本信息的加工与表达105-25
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 数学建模
- 葡萄酒
- 评价
- 图文
- 2012