数学建模葡萄酒问题二的分析

更新时间：2023-07-18 07:29:01 阅读量：实用文档文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

数学建模葡萄酒问题二的分析

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分，然后求和得到其总分，从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系，葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果，附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题：

1. 分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？ 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量？

附件1：葡萄酒品尝评分表（含4个表格）附件2：葡萄和葡萄酒的理化指标（含2个表格）附件3：葡萄和葡萄酒的芳香物质（含4个表格）

二、问题分析

问题二的分析

问题二要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。题目对葡萄酒样品给出了葡萄酒品尝评分表、理化指标分析表和芳香物质分析表。由于葡萄酒理化指标分析表和芳香物质分析表没有一个可行的分析方法对葡萄酒的质量进行判断。因此，把葡萄酒品尝评分表作为对葡萄酒质量的评定。

由问题一，得到第二组评酒员的评价结果更可信。先对葡萄酒评分求平均值。再用主成分分析法处理酿酒葡萄的理化指标，将30个指标缩减为几个主成分。由于数据的计量单位不同，对葡萄酒的平均分和酿酒葡萄的理化指标量纲化处理。通过spss求出葡萄样本各指标与主成分的相关系数矩阵。从而求出各葡萄样本与主成分的关系矩阵Y=(yij)

最后用综合主成分分析法，将各葡萄酒的平均值（量纲化处理）与各葡萄样本跟主成分的关系矩阵建立一个线性关系。通过这个线性关系对葡萄样品进行打分，再用分值对葡萄进行分级。

数学建模葡萄酒问题二的分析

三、模型假设

1、葡萄酒的质量仅由葡萄酒的评分决定。

2、葡萄酒的二级理化指标的信息全部反应在相对应得一级理化指标中。

四、符号说明

表示综合得分的数学期望，

i 表示第i组评分与总平均值之差，

ij 表示第i组第j个评酒师的评分与第i组评分均值的偏差；

xijk 表示第i组的第j号评酒师对第k号酒的综合评分

ijk 表示第i组第j个评酒师弟K号样品酒分析结果与第j号评酒师评

分的偏离；

SSA 称为因素A的离差平方和， SSE 称为因素E的离差平方和， SSB 称为因素B的离差平方和 Xi 酿酒葡萄的不同的理化指标

Y 各葡萄样本与主成分的关系矩阵

ai 酿酒葡萄理化指标提取的主成分对应理化指标中的贡献率 bi 各葡萄酒评分量纲化处理后的数值

Zi 主成分Y与其贡献率ai的乘积加上葡萄酒评分数值构成线性组合

五、模型建立及求解

5.1.1问题一模型的建立及求解

葡萄酒历史悠久，在葡萄酒诞生之初，人类就给予了它对于其它任何食物与饮品都没有的偏爱。然而即使是极品葡萄酒不同的人对他的评价也不可能完全一样，本问就是要讨论两组评酒员的评价结果有无显著性差异，及哪一组结果更可信。对于要分析无显著性差异，这里是通过用三因素（酒类，品酒员，组号）方

数学建模葡萄酒问题二的分析

差分析及T检验法，T检验当中的值小于0.05则说明

而对于要判断哪一组结果更可信，则是通过计算出每组样品酒方差的平均来判断，平均值越小则说明越稳定，结果就更可靠。首先建立三因素方差分析的数学模型三因素方差分析的数学模型：

xijk i ij ijk (i 1,2j;

1,......10; 1,

表示综合得分的数学期望，

i表示第i组评分与总平均值之差，

ij表示第i组第j个评酒师的评分与第i组评分均值的偏差；

xijk表示第i组的第j号评酒师对第k号酒的综合评分

ijk表示第i组第j个评酒师弟K号样品酒分析结果与第j号评酒师评分的偏

离；

三因素方差分析的计算步骤

根据数理统计原理，计算各离差平方和：

SSA

1 ( x

i 1

j 1k 1

abc

2ijk

)

1( xijk)2

i 1j 1k 1

abc

SSE xijk

i 1j 1k 1a

abc

1 ( x

i 1j 1

k 1a

ijk

2SSB c ( xijk) bc ( xijk)

i 1j 1

k 1

i 1

j 1k 1

SSA称为因素A的离差平方和，反映因素A对试验指标的影响。 SSE称为因素E的离差平方和，反映因素E对试验指标的影响。 SSB称为因素B的离差平方和，反映因素B对试验指标的影响

计算样本方差

MSA SA2

SSAfA

SSAa 1

数学建模葡萄酒问题二的分析

MSB SB2 MSE SE2

SSBBSSEfE

SSB

SSEab(c 1)

Sig 单总体T检验

。

如果样本是属于大样本（n>30）也可写成：

。

在这里，t为样本平均数与总体平均数的离差统计量；

X为样本平均数；为总体平均数； X为样本标准差；n为样本容量。

以0.05为显著性水平， t>0.05则说明无显著性差异。反之说明有显著性差异。

可信度分析的数学模型

Mijn表示第i组的第j号评酒师对第n个评分项目的分值（n=1……10，分别

表示澄清度，色调，香气分析当中的纯正度，香气分析当中的浓度，香气分析当中的质量，纯正度，浓度，持久性，质量，整体评价）

xijk Mij1 Mij2 ......Mij10

E(X)ik xi1k xi2k ......xi10k

var(x)ik (xi1k E(x)ik)2 (xi2k E(x)ik)2 ......(xi10k E(x)ik)2

Q var(x)i1 var(x)i2...... var(x)i27

E(X)ik表示第i组中第j号酒的综合得分期望。

var(x)ik表示第i组j号酒的综合得分方差。

Q表示该组方差的平均值

方差的平均越小说明越稳定，则可信度越高。数据的处理及结果

根据附表一中的数据通过excel可以算出白酒第一组中毎位评酒师对各样品酒的综合得分，例如第26号酒的综合得分如表一所示：

数学建模葡萄酒问题二的分析

表一

外观分析

香气分析

口感分析

总分：100

项目满酒样品分 26

5 澄清度 10 色调 6 纯正度 8 浓度 16 质量 6 纯正度 8 浓度 8 持久性 22 质量

品酒员1

4 6 5 7 14 4 7 7 13

… … … … … … … … … … …

品酒员10

4 8 5 7 14 4 6 7 19

平衡/整体评价 11 8 … 10 75 … 84 如表一所示算出第一组及第二组每种样品酒的综合得分，将所有白酒的数据整理得到下表二：

综合得

组别品酒员酒样品

分

1 品酒1号 26 75 1 品酒2号 26 66 … … … … 2 26 80 品酒员1号 ... … … … 全表为附录表一

将附录表一当中的数据导入到SPSS，分析综合得分与酒类，品酒员，组号的关系，得到数据如表三：

数学建模葡萄酒问题二的分析

T检验当中组别的t小于0.05可得知白酒的两组评价员的结果有显著性差异。同样的方法用SPSS对红酒进行三因素分析得到表四：

表四

T检验当中组别的t小于0.05可得知白酒的两组评价员的结果有显著性差异。不管是白酒还是红酒，两组评价员的结果都有显著性差异。

附录表一当中已经算出来所有样品酒的综合得分利用excel可以很容易的算出每组综合得分的方差平均值，结果如表五所示：

表五

从表五中可以看出不管是白酒还是红酒，第二组方差的平均值都小于第一组的方差平均值，可得出结论第二组的稳定性更好，结果更可靠。

数学建模葡萄酒问题二的分析

5.3.1问题三模型的建立及求解

为了研究酿酒葡萄与葡萄酒的理化指标之间的联系，将葡萄酒的理化指标定义为Y,把酿酒葡萄的理化指标定义为X，

先利用相关性分析，可以分别算出每一个Y关于所有X的相关系数矩阵。取出其中相关系数大于0.35的X,在利用多元线性回归，分别算出每一个Y关于相关系数大于0.35的X的R2，及各X的系数与置信区间。根据R2的值把Y分成三类：A类为R2大于0.8。B类为R2介于0.5到0.8之间C类为R2小于0.5.

对于A类如果置信区间包含0，则把相应的变量踢除。根据这些新的变量，从新做一次线性回归如果R2的值与剔除变量之前相差不大，就取剔除变量之后的变量。若相差较大则取没有剔除变量的那些X来表示Y。

对于B类可直接得出Y关于X的线性方程，对于C类，模型的建立与求解：

问题二的模型

葡萄酒的理化指标分为一级指标和二级指标。由于二级指标都在一级指标中进行反应，剔除二级指标。对多次测试的项目取平均值，精简得到酿酒葡萄的理化指标分析表，共30个指标。由于指标太多，并且多指标之间往往存在着一定程度的相关性。为了把指标复杂的关系进行简化，对理化指标做主成分分析。

由于理化指标中的指标不同，其计量单位不同，所以数据量纲也不一致。因此，在进行主成分分析前，先对数据进行量纲化处理。统计学原理告诉我们，要对多组不同量纲数据进行比较，可以先将它们标准化转化成无量纲的标准化数据。而综合评价就是要将多组不同的数据进行综合，因而可以借助于标准化方法来消除数据量纲的影响。

无量纲标准化法：

数学建模葡萄酒问题二的分析

xi s

上式中： yi

1n1n

(xi )2 xi s n 1i 1ni 1

无量纲化处理葡萄样品的评分、葡萄酒的理化指标结果（以下仅是表的一部

分）如下：

氨基酸

得分平均均值蛋白质VC含标

红葡萄总量标

标准化标准准

准

葡萄样品

-0.607044289 -0.23 -0.05 -0.13

葡萄样品

0.876117601 -0.16 1.56 -0.22

葡萄样品

1.026947623 3.84 0.65 -0.09

氨基酸

得分平均值标蛋白质VC含标

白葡萄总量标

准化标准准

准

葡萄样品1 0.431372889 -0.73 -0.18 2.2 葡萄样品2 -0.230891494 -0.08 0.55 -0.75 葡萄样品3 -0.293964293 3.37 -0.69 -0.29

主成分分析模型：

酿酒葡萄的无量纲化理化指标有30个，设为X1,X2,X3 X

。令

X=(X1,X2,X3 X30),假定存在二阶矩阵，其均值和协方差分别记为

E(X), D(X)。每个主成分的系数平方和为1。主成分之间相互独立，即

无重叠信息。主成分分析的目的是减少变量的个数，所以一般不会使用所有的变量，忽略一些带有较小的主成分将不会给总方差带来太大的影响。主成分的方差依次递减，重要性依次递减，即Var(Y1) Var(Y2) Var(Yp)。如果第一主成分表达的信息不够，这依次往下找。主成分对整个数据的反应能力越强，则它对数据的贡献率越大。一般，累积贡献率达到85%左右就可以说对数据有了较好的反映。将数据带入SPSS，得出结果。综合评价模型：

酿酒葡萄的分级和酿酒葡萄的理化指标、葡萄酒的质量有关。葡萄的评分决定葡萄酒的质量，设评分量纲化数值为b1,b2,b3,,,bx。通过主成分分析酿酒葡萄的理化指标进行将变量缩减。由于以上数据都做了量纲化处理，所以这些数据可以进行比较。主成分Y1,Y2,Y3 Yn与其贡献率a1,a2,a3 an加上葡萄酒评分数

数学建模葡萄酒问题二的分析

值构成线性组合，其中ai的累积贡献率很大，这些主成分可代表理化指标的信息。考虑到酿酒葡萄与葡萄酒的质量、酿酒葡萄的理化指标有关。令综合数值Z：

即 Z1=a1*Y(1,1) a2*Y(1,2) a3*Y(1,3) an*Y(1,n)+b1

由于各样品的综合成分值各不相同。当得分越高时，样品葡萄的等级越高。将酿酒红葡萄的理化指标带入SPSS软件中，进行主成分分析。提取以下结果：

Extraction Sums of Squared Loadings

Component 1 2 3 4 5 6 7 8

Total 6.966 4.940 3.737 2.840 1.999 1.742 1.418 1.270

% of Variance

23.221 16.467 12.457 9.467 6.663 5.808 4.728 4.234

Cumulative %

23.221 39.687 52.144 61.611 68.274 74.082 78.810 83.044

Rotation Sums of Squared Loadings Total 5.196 4.458 3.135 2.712 2.690 2.565 2.257 1.900

% of Variance

17.318 14.859 10.451 9.039 8.968 8.552 7.523 6.333

Cumulative %

17.318 32.177 42.629 51.668 60.636 69.187 76.711 83.044

上图表给出了各个因子的贡献率，第1个因子的贡献率是23.221%，第2个因子的贡献率是16.467%，第3个因子的贡献率是12.457%，第3、4、5、6、7、8因子的贡献率分别是9.467%、6.663%、5.808%、4.728%、4.234%，这8个因子的累积贡献率达到83.044%，则这8个因子能反应足够的信息。

数学建模葡萄酒问题二的分析

图上为30个指标与8个因子之间的相关系数图。通过SPSS分析，即将30个指标精简为8个主成分。从图上可以看出，不同的理性指标与各因子的相关系数不相同。例如:将红葡萄样品1的各指标乘以图表上的相关系数，求到的是红葡萄样品1与因子1的相关系数。红葡萄样品1表达式为

Y(1,1) X(1,1)*( 0.534) X(1,2)*( 0.583) X(1,3)*( 0.545) X(1,30)*(0.313)Y(1,2) X(1,1)*( 0.355) X(1,2)*( 0.212) X(1,3)*( 0.181) X(1,30)*(0.87)Y(1,3) X(1,1)*( 0.472) X(1,2)*( 0.172) X(1,3)*( 0.271) X(1,30)*( 0.214)

Y(1,8) X(1,1)*(0.194) X(1,2)*(0.40) X(1,3)*(0.15) X(1,30)*(0.165)

红葡萄样品2······红葡萄样品27。

Y1=(yij)27 8

矩阵如下：见附录。

用矩阵Y1与8个主成分的贡献率、评分数值来求综合数值Z。

综合评价方程如下：

Z1=a1*Y(1,1) a2*Y(1,2) a3*Y(1,3) an*Y(1,n)+b1

数学建模葡萄酒问题二的分析

Z2=a1*Y(2,1) a2*Y(2,2) a3*Y(2,3) an*Y(2,n)+b2

Zm=a1*Y(m,1) a2*Y(m,2) a3*Y(m,3) an*Y(m,n)+bm

得到27个葡萄样品的得分红葡萄得分红葡萄得分红葡萄得分

-2.16363 -0.4975183 0.3501305 葡萄样品11 葡萄样品12 葡萄样品19 -1.66461 -0.4274949 0.6392122 葡萄样品7 葡萄样品16 葡萄样品5 -1.44279 -0.2411962 0.6962257 葡萄样品18 葡萄样品4 葡萄样品14 -1.40382 -0.15253 1.2188329 葡萄样品15 葡萄样品27 葡萄样品20 -1.1349 -0.0330426 1.2380468 葡萄样品25 葡萄样品1 葡萄样品2 -1.02062 0.19987594 1.3808782 葡萄样品10 葡萄样品26 葡萄样品17 -0.99605 0.2176509 1.4740503 葡萄样品6 葡萄样品22 葡萄样品3 -0.72034 0.25860596 2.2283205 葡萄样品13 葡萄样品21 葡萄样品23 -0.6507 0.33750222 2.309916 葡萄样品8 葡萄样品24 葡萄样品9

从以上图表，对葡萄样品进行分类。第一类，得分大于2，葡萄样品9、葡萄样品23。

第二类，得分2～1，葡萄样品3、葡萄样品17、葡萄样品2、葡萄样品20。第三类，得分1～0，葡萄样品14、葡萄样品5、葡萄样品19。第四类，得分0～-1，葡萄样品8，葡萄样品13、葡萄样品6。

第五类，得分-1～-2，葡萄样品10、葡萄样品25、葡萄样品15、葡萄样品18、葡萄样品7。

第六类，得分小于-2，葡萄样品11. 酿酒白葡萄的主成分分析法如上：将表二带入SPSS进行主成分分析,

数学建模葡萄酒问题二的分析

从上图可得，第1个因子的贡献率为19.434%，第2个因子的贡献率是16.422%，第3个因子的贡献率是12.102%，第3、4、5、6、7、8、9、10因子的贡献率分别是6.935%、6.297%、5.516%、5.077%、4.266%，4.127%，3.340%。前10个因子的累积贡献率为83.516%，能反映足够的信息。

图上为30个指标与10个因子之间的相关系数。

数学建模葡萄酒问题二的分析

白葡萄样品1表达式为

Y(1,1) X(1,1)*( 0.577) X(1,2)*( 0.261) X(1,3)*( 0.519) X(1,30)*( 0.170)Y(1,2) X(1,1)*(0.204) X(1,2)*(0.368) X(1,3)*(0.366) X(1,30)*( 0.390)Y(1,3) X(1,1)*( 0.231) X(1,2)*(0.371) X(1,3)*( 0.497) X(1,30)*( 0.480)

Y(1,10) X(1,1)*( 0.450) X(1,2)*(0.177) X(1,3)*(0.091) X(1,30)*( 0.058)

白葡萄样品2······白葡萄样品28。 Y2=(yij)28 10

的矩阵见附录。

用矩阵Y1与8个主成分的贡献率、评分数值来求综合数值Z。得到28个白葡萄样品的分值，如下：白葡萄得分白葡萄得分白葡萄得分葡萄样品葡萄样品

-3.55127 -0.4803603 葡萄样品1 0.812696

16 19 葡萄样品葡萄样品葡萄样品

-2.39328 0.03380824 1.012145

11 24 27

葡萄样品

葡萄样品8 -2.3848 葡萄样品3 0.20140592 1.022047

葡萄样品葡萄样品葡萄样品

-2.02182 0.22233295 1.067077