葡萄酒质量的评价模型全国数学建模-毕设论文

更新时间:2023-10-10 21:43:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

2012高教社杯全国大学生数学建模竞赛

承 诺 书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 长 江 师 范 学 院

参赛队员 (打印并签名) :1. 李 蓉

2. 马 艳

3. 周 成 楷 指导教师或指导教师组负责人 (打印并签名): 廖 江 东

日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛

编 号 专 用 页

评 阅 人 评 分 备 注 赛区评阅编号(由赛区组委会评阅前进行编号):

赛区评阅记录(可供赛区评阅时使用):

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进

葡萄酒质量的评价模型

摘要

本文围绕葡萄酒的质量评价问题进行讨论,主要应用数据的统计原理以及数据的处理方法对酿酒葡萄的分级、葡萄酒和葡萄的理化指标的联系、以及葡萄酒质量评价问题建立了模型,并对模型做了较详细的模型检验,客观地实现了问题的解决。

问题(1),是一个数据统计问题,首先对红、白葡萄酒每类酒的样本数据建立了两独立样本的T检验模型,通过对比T统计量t值与T分布表给出的相伴概率值之间的大小,得出两组数据样本具有显著性差异。对于两数据样本的可信度问题,本文巧妙通过对每类的两个数据样本的均值方差的图像分析和对客观的评价准则考虑,得出结果:第二组评酒员给出的分数更具有可信性。

问题(2),属于多方案排序问题,首先利用问题(1)中的结果得到两组样品的有效性较高的评分数据样本,并借以建立了排序模型。同时本文还应用逼近理想解排序法(TOPSIS法),得出了两类葡萄酒质量的排序,然后通过权重法筛选出氨基酸、糖、蛋白质作为核心理化指标。最后基于“层次分析法”评价模型建立分级评价模型,通过权重算法得到以核心量化指标的贴近度作为分级的标准,确定出了对酿酒葡萄的四个等级:(见表4-15、4-16)。 问题(3),对附件2中一级指标下的多重数据进行求平均值处理获得该级指标的最优值,建立了多元线性回归模型,首先对酿酒红、白葡萄的30种一级指标进行筛选,筛选出众多核心理化指标的最优值,并采用“逐步回归”的方法,针对多重数据下的多种指标进行分别拟合,从中抽出拟合最好的一组数据和结果进行图像分析,得出整体的酿酒葡萄与葡萄酒的理化指标成正相关的关系。 问题(4),本文基于问题(1)、问题(2)和问题(3)的研究结果,首先针对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响问题,建立了多元回归分析模型,并运用逐步回归方法对这里的最优值进行有效而合理的筛选,之后将筛选得到的多个理化指标给与拟合,并对其进行图像分析,得出筛选出来的5个一级指标就可以反映出整体的关系,最后应用这个结果论证出:用葡萄和葡萄酒的理化指标来判断葡萄酒的质量是不全面的。

关键词:葡萄酒的评价 T检验 层次分析法 多元线性回归分析 逐步回归法

1

1 问题重述

目前在现实生活中,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

题目中附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

现需完成以下任务:

(1)要分析出两组评酒员评价结果的显著性差异,并确定出哪一组结果更可信;

(2)在解决问题(1)的基础上,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;

(3)在解决完问题(1)与(2)之后,还要对酿酒葡萄与葡萄酒的理化指标进行分析,从而确定他们之间的联系;

(4)结合上面三个问题的结果,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

2 问题分析

2.1 问题(1)的分析

该问题要求通过对附件1两组评酒员的葡萄酒品尝评分表中的数据作出综合性评价。题目给出了两组评酒员(每组10人)分别对27种红葡萄酒和28种白葡萄酒的评价分数,该问题旨在从给出的评价分数中找出差异的显著程度,并从中确定出哪一组评酒员的结果更具可信性。

对于解决评价结果是否具有显著差异性问题实质是一个两独立样本的T检验问题,他满足检验的前提条件,考虑到方差是表示一组数据分布的离散程度,方差越大,说明变量值的差异越大,距离平均数这个“中心”的离散趋势越大,我们通过建立两独立样本的T检验模型,很好的解决了两组评价结果有误显著差异性问题。而对于两组评酒员给出的评分结果的可信程度问题,我们通过简单计算得到两组样本的平均值的方差,并作出两个葡萄酒样品评价结果分析折线图,通过对图形反映出来两个评分样本的波动剧烈程度可以知道该样本对应的评酒员打分的可信性。对于这个问题,也可采用信度分析法,通过SPSS进行数据分析,得到两组数据的可信度值,进而得到哪一组数据更可信。 2.2 问题(2)的分析

该问题是一个根据所给的数据特点进行综合的分析,研究对各种酿酒葡萄的多个方案的分级问题。我们应该对评价对象的各个指标的联系进行综合性评价。

综合评价的方法有多种,诸如模糊综合评判、灰色关联等,对与此种多属

2

性问题,可以借助“空间距离”概念的角度来解决,这样就可以通过逼近理想解排序法(TOPSIS法)建立“逼近理想解的排序模型”,其过程为:首先从问题(1)中数据的可信性判断模型中找出一组可行性较高的样品酒质量的排序结果,并对该组评价对象的各个评酒员的评价指标均找出最优值,设成正理想值;对该组评价对象的各个评酒员的评价指标均找出最劣值,设为负理想解,分别计算每一个评价对象到正理想解和负理想解的距离,从而得到每种酒的各个评价指标的贴近度,应用数据中的权重,计算出最终各酒品种的贴近度,进而排名,得到各个酒品种的贴近值。同时对附件2中的酿酒葡萄各指标数据整合,并筛选出成分含量相对较多的几种指标,结合各个酒品种的贴近值,通过“层次分析法”中的排序模型计算各个指标的权重,进而计算出最终的各个酿酒葡萄的指标总值,进而对其分级。

2.3 问题(3)的分析

问题(3)要求对建立酿酒葡萄和葡萄酒的理化指标之间的联系。首先,我对附件2的各个理化指标进行整体的分析得出二级理化指标的总和近似等于相应的一级指标,因此我们就只用一级理化指标来建立多元回归模型,并采用“逐步回归(stepwise regression)”的方法,对众多理化指标有效的选出核心的理化指标,并通过对这些核心指标进行适当的拟合,最后得出酿酒葡萄和葡萄酒之间的相对关系。 2.4 问题(4)的分析

问题(4)主要是要求我们对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响的分析。我们采用了问题(3)的处理方法——多元回归分析中的“逐步回归(stepwise regression)”法,分别对酿酒葡萄和葡萄酒的理化指标与葡萄酒质量进行数据拟合,进而得出对葡萄酒影响成正相关和负相关的相应物质的分类,得出结论。

3 模型的假设及符号说明

3.1 模型的假设

(1)假设两组样本之间彼此独立,且来自两个服从正态分布的总体;

2(2)假设两组样本数据的总体方差相等,即?12=?2;

(3)假设所调查到的数据真实可靠,能很好的反映出大部分人的看法; (4)假设所有的评酒员评酒时的外部环境相同,评酒时不考虑外界因素的影响; (5)假设问题中提供的每个评酒员所打的分数能够充分地反映出每个酒样品的真实情况;

(6)假设每个评酒员在评价每个酒样品时互不影响,而且具有互补性,即每个组的评分员的评分水平相当;

(7)假设计算时附件3中空白处数据默认为0;

3

本文来源:https://www.bwwdw.com/article/5xsf.html

Top