2012年全国数学建模竞赛A题全国优秀论文

更新时间:2023-11-18 05:00:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2012高教社杯全国大学生数学建模竞赛

承 诺 书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名):

日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛

编 号 专 用 页

评 阅 人 评 分 备 注 赛区评阅编号(由赛区组委会评阅前进行编号):

赛区评阅记录(可供赛区评阅时使用):

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进行编号):

A题 葡萄酒的评价

摘要

随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。

针对问题一,本文拟采用离散点检验、F检验、?检验建立综合检验模型,首先利用残差绝对值法剔除原始评分中的异常数据,得出各葡萄酒样品的两组平均得分,然后对两组数据进行F检验知F值大于F分布临界值,确定两组评价结果间存在显著性差异,最后进行?检验知两组数据间系统误差相当,综合F检验和?检验知两组评价结果间系统误差相当精密度不同,且第一组标准差大于第二组,因此确定第二组评价结果更可信。

针对问题二,对酿酒葡萄进行分级,采用主成分分析法建立主成分分析模型,首先降多个理化指标为累计贡献率达73.537%的六个互不相关的主成分,对主成分累计贡献率进行归一化处理得各主成分权重,进而确定葡萄样品的主成分理化指标加权综合评分,由matlab数据拟合知理化指标与葡萄酒的质量互不相关,因此根据表2-4准则把酿酒葡萄分为三个等级。

针对问题三,分析酿酒葡萄与葡萄酒的理化指标间的联系,本文拟建立典型相关性分析模型,利用spss软件求出各指标间的相关系数,由第一、二典型相关系数皆大于各组内部理化指标间任一相关系数,因此典型相关分析模型能更好反映出酿酒葡萄与葡萄酒的理化指标间的联系。

针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键字:理化指标 综合检验模型 主成分分析 线性回归 spss

1

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题:

1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信; 2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系;

4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二、问题分析

葡萄酒起源于埃及,并在欧洲得到得到了长足的发展,是人们最喜爱的酒品之一。近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。 2.1 对问题一的分析

问题要求对两组评酒员的评价结果有无显著性差异进行检验,在葡萄酒的感官评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价存在差异,两组评酒员的评价结果的精确度不同,因此有必要对评价结果进行统计分析,判定出哪一组评酒员的评价结果更能真实的反映出葡萄酒样品的质量。首先应进行离群值检验,主要目的是剔除异常数据,这种异常数据不是系统误差,也不是随机误差,而是由过失误差引起的,这种数据应一律舍去。然后进行F检验和?检验可以判断出两组判定结果有无显著性差异。 2.2 对问题二的分析

问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;主成分分析法是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法,其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,采用这种方法可以克服单一的理化指标不能真实反映酿酒葡萄的全面特征,引进多方面的理化指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的酿酒葡萄的信息。对酿酒葡萄进行分级,可以通过将由主成分分析法得到的主成分贡献率进行归一化处理,得到各主成分之间的相对重要性,进而确定各葡萄样品的加权综合评分。由以上根据酿酒葡萄的理化指标得到的优劣取值,再加以问题一中得到的葡萄酒的质量取值,设定分级标准,对这些酿酒葡萄进行分级。 2.3 对问题三的分析

要求分析酿酒葡萄与葡萄酒的理化指标间的联系,首先根据模型假设可以舍去二级指标,由问题二可以确定酿酒葡萄与葡萄酒的理化指标的主成分,对此可以建立典型相

2

关分析模型,典型相关分析是研究两组变量之间相关关系的一种多元计方法。它能够揭示出两组变量之间的内在联系,也是一种运用于多元统计中的降维技术。其目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析,利用spss软件求出各指标间的相关系数,进而确定各指标间关联度的大小。 2.4对问题四的分析

问题要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由问题二、三得知酿酒葡萄和葡萄酒的理化指标是存在关联的,因此可以建立多元线性回归模型,求出回归方程,然后对回归方程的显著性进行检验,若回归方程显著则能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,否则,不能。

三、模型假设

1、本文所涉及的置信度均取a?0.05; 2、两组品酒员的评分服从正态分布;

3、对葡萄样品设置的分级标准客观合理;

4、附录中所给数据真实有效,品酒员评分不受其他客观因素的影响;

5、理化指标中二级指标对酿酒葡萄和葡萄酒质量影响较小,可以忽略不计;

四、符号定义与说明

符号

定义与说明

vi 残差 yi 残差绝对值 s 试验标准差 df 自由度 M1 加权综合评分 rij xi和xj的相关系数 zi 主成分

这里只给出主要符号的意义,其他符号将在文中给出,在此不再一一赘述。

五、模型的建立与求解

3

主成分 特征值 5.723 3.417 3.233 2.552 1.927 贡献率/% 22.894 13.668 12.893 10.209 7.710 累计贡献率/% 22.894 36.562 49.455 59.664 67.374 主成分 特征值 1.238 1.079 0.797 0.651 0.573 贡献率/% 4.953 4.316 3.188 2.604 2.290 1.944 累计贡献率/% 78.491 82.807 85.994 88.598 90.889 92.83 z1 z2 z7 z8 z9 z10 z11 zz3 z4 z5 z6 12 1.541 6.163 73.537 0.486 注:本表只给出部分特征值及主成分贡献率,详见附录9.5。 由表2-1知主成分z1~z6的累计贡献率已经达到73.573%?70%,所以选取主成分z1~z6为主要理化指标,主成分z1~z6的特征值对应的特征向量e1,e2,?,e25,再用上述步骤4中的公式计算各变量在主成分z1~z6上的载荷, 可以得出:

第一主成分z1与x4呈现出较强的正相关,与x24呈现出较强的负相关; 第二主成分z2与x23呈现出较强的正相关,与x17呈现出较强的负相关; 第三主成分z3与x20呈现出较强的正相关,与x14呈现出较强的负相关; 第四主成分z4与x19呈现出较强的正相关,与x6呈现出较强的负相关; 第五主成分z5与x21呈现出较强的正相关,与x3呈现出较强的负相关; 第六主成分z6与x15呈现出较强的正相关,与x26呈现出较强的负相关; 对主成分z1~z6的贡献率进行归一化处理:

Wi?zi?zi?16?i?1,2,?,6?

i得到主成分z1~z6之间的相对重要性,即各主成分占的权重,如表2-2:

主成分

表2-2 主成分权重 权重 主成分 9

权重

z1 z2 z3 0.31 0.19 0.18 z4 z5 z6 0.14 0.10 0.08

由各主成分对应的具有较强相关性的理化指标及各主成分占的权重,可得到只考虑理化指标时红葡萄样品的优劣情况,如表2-3:

表2-3 只考虑理化指标时红葡萄样品排名 葡萄样品 总分 葡萄样品 总分 葡萄样品 总分 26 295.295 14 196.799 27 162.022 24 276.353 25 189.913 6 160.451 5 262.597 19 177.012 7 153.228 1 260.973 18 175.975 21 153.209 17 251.603 3 175.125 15 151.671 23 231.837 2 174.910 13 151.328 8 230.959 10 171.180 11 136.301 20 223.927 12 165.709 22 135.197 9 207.440 4 162.604 16 125.062

由问题一知道第二组评酒员的可信度较高,为综合考虑酿酒葡萄的理化指标和葡萄酒的质量进行分级,首先运用Matlab软件(源代码见附录9.6)[4]进行数据拟合,求取两个指标分别占有的权重; 拟合结果如图2-1:

图2-1 红葡萄的理化指标与葡萄酒质量的关系30028026024022020018016014012060红葡萄样品总得分6264666870评分7274767880

由图2-1可以看出,红葡萄的理化指标与葡萄酒的质量不相关;

根据红葡萄理化指标总得分和第二组评酒员平均评分的密集程度设定分级标准:

10

设红葡萄理化指标的总得分为m1,葡萄酒质量评分为m2;则:

m1 m2 表2-4 红葡萄样品分级标准 一级红葡萄 二级红葡萄 三级红葡萄 m1?200 m2?70 150?m1?200 65?m2?70 m1?150 m2?65

则根据以上分级标准,可得到红葡萄样品分级结果如表2-5:

表2-5 红葡萄样品分级结果 一级红葡萄 二级红葡萄 三级红葡萄 5,9,17,20,23,1,2,3,4,6,7,8,111,16,22 葡萄样品 24,26 0,12,13,14,15,18,19,21,25,27

5.2.3 白葡萄样品分级

与对红葡萄的处理相同,对附录9.4中白葡萄的一级理化指标用spss软件进行处理得到相关系数矩阵,由相关系数矩阵计算特征值,得到各主成分的贡献率及累计贡献率,如表2-6:

表2-6 特征值及主成分贡献率 贡献率累计贡贡献率累计贡主成分 特征值 /% 献率/% 主成分 特征值 /% 献率/% z1 z2 4.397 3.624 2.704 2.000 1.742 17.590 17.590 14.497 32.087 10.818 42.905 8.001 6.967 50.906 57.872 z7 z8 z9 z10 z11 1.416 1.161 1.133 0.961 0.897 0.817 5.663 4.646 4.531 3.846 3.586 3.268 69.547 74.193 78.724 82.570 86.157 89.425 z3 z4 z5 z6 z12 1.503 6.012 63.884 注:本表只给出部分特征值及主成分贡献率。 从表2-6中可以看出,主成分z1~z8的累计贡献率已经达到74.193%?70%,计算主成分z1~z8的特征值对应的特征向量e1,e2,?,e25,再用上述步骤4中的公式计算各变量在主成分z1~z8上的载荷,

11

可以得出:

第一主成分z1与x12呈现出较强的正相关,与x8呈现出较强的负相关; 第二主成分z2与x23呈现出较强的正相关,与x5呈现出较强的负相关; 第三主成分z3与x29呈现出较强的正相关,与x3呈现出较强的负相关; 第四主成分z4与x6呈现出较强的正相关,与x9呈现出较强的负相关; 第五主成分z5与x15呈现出较强的正相关,与x16呈现出较强的负相关; 第六主成分z6与x7呈现出较强的正相关,与x14呈现出较强的负相关; 第七主成分z7与x17呈现出较强的负相关; 第八主成分z8与x19呈现出较强的负相关; 对主成分z1~z8的贡献率进行归一化处理:

Wi?zi?zi?18?i?1,2,?,8?

i得到主成分z1~z7之间的相对重要性,即各主成分占的权重,如表2-7:

主成分 表2-7 主成分权重 权重 主成分 0.24 0.20 0.15 0.11 权重 0.09 0.08 0.07 0.06 z1 z2 z5 z6 z7 z3 z4 z8

由各主成分对应的具有较强相关性的理化指标及各主成分占的权重,可得到只考虑理化指标时白葡萄样品的优劣情况,如表2-8:

表2-8 只考虑理化指标时白葡萄样品排名 葡萄样品 总分 葡萄样品 总分 葡萄样品 总分 21 189.608 6 114.576 5 80.994 27 175.866 18 111.957 19 80.675 23 174.175 20 105.383 9 78.518

12

15 14 11 8 1 12 16 146.232 130.281 126.749 122.962 118.303 116.619 114.785 13 25 24 10 7 3 28 104.639 101.865 93.985 93.967 93.930 87.459 81.452 17 4 26 2 22 75.795 68.760 68.589 67.615 67.063 由问题一知道第二组评酒员的可信度较高,为综合考虑酿酒葡萄的理化指标和葡萄酒的质量进行分级,首先运用matlab软件(源代码见附录9.7)进行数据拟合,求取两个指标分别占有的权重; 如图2-2:

图2-2 白葡萄的理化指标与葡萄酒质量的关系200180160白葡萄样品总得分14012010080606668707274评分76788082

由图2-2可以看出,白葡萄的理化指标与葡萄酒的质量不相关;

根据白葡萄理化指标总得分和第二组评酒员平均评分的密集程度设定分级标准:设白葡萄理化指标的总得分为m3,葡萄酒质量评分为m4;则:

m3 表2-9 白葡萄分级标准 一级白葡萄 二级白葡萄 三级白葡萄 m3?120 m4?75 80?m3?120 m3?80 m4 70?m4?75 m4?70

则根据以上分级标准,可得到红葡萄分级结果如表2-10:

表2-10 白葡萄分级结果

13

本文来源:https://www.bwwdw.com/article/qgvv.html

Top