2012年全国大学生数学建模大赛一等奖论文
更新时间:2024-06-18 07:00:01 阅读量: 综合文库 文档下载
- 全国大学生数学建模网站推荐度:
- 相关推荐
葡萄酒的评价
摘要
随着人民生活水平的提高,葡萄酒开始走进千家万户,而葡萄酒的优劣评定也成了人们热议的话题。葡萄酒的优劣评价一般通过聘请有经验的评酒员进行品评并做出评分。本文围绕葡萄酒的评价问题进行研究分析。
针对问题一,首先我们对附录1数据进行整理分析。先利用matlab编程对数据进行正态性检验,得出样本均满足正态分布这一条件之后进一步运用SPSS对数据进行配对样本T检验,检验得出的两组p值都小于标准0.05,判定两组品酒员的评价结果存在显著性差异。接着,对所给评分数据进行方差分析,并进一步运用组间离均平方和方法比较第一、二组P值和F值的波动性,并最终得出结论:第二组评酒员所给的评分更为可信。
针对问题二,我们结合原问题附件中的数据,先采用因子分析方法提炼出对葡萄总体理化指标有显著影响的因子,分红葡萄和白葡萄两类之后采用聚类分析方法将葡萄分为五类。在问题一的基础上,利用可信度高的品酒员所评分数作为葡萄酒质量的衡量标准,为五类葡萄划分好坏。最终我们将红白葡萄都分为五个级别,分别是A级(极好),B级(较好),C级(普通),D级(较差),E级(最差)。
图-红葡萄的分类
针对问题三,由于葡萄的理化指标众多,首先利用sas软件分析葡萄与葡萄酒的理化指标之间的相关系数,选取与葡萄酒理化指标相关性较显著的葡萄理化指标,做典型相关分析。并对典型相关分析的结果进行分析。红葡萄和红葡萄酒间的典型相关分析结果说明:两组变量间,花色苷、苹果酸、褐变度、色泽L*相关密切,特别是葡萄与葡萄酒间的花色苷指标可见显著相关;白葡萄与白葡萄酒的结果说明:白葡萄指标的黄酮醇、褐变度、单宁指标与白葡萄酒的总黄酮、单宁、总酚可见显著相关。
针对问题四,针对问题四,利用酿酒葡萄和葡萄酒的理化指标与葡萄酒的质量构建多元线性回归模型,从而分析出哪些理化指标对葡萄酒的质量有显著影响。在最后,我们将酿酒葡萄和葡萄酒的感官指标当作变量引入回归方程,得到回归方程的拟合度为98.62%,而没加上感官指标时的拟合度为78.89%,所以加上感官指标后回归方程的拟合度明显变高,而且各个参数都通过了显著性检验,论证了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:样本T检验、聚类分析法、典型相关分析、多元线性回归
1
一、 问题重述
1.1 问题背景
葡萄酒是用鲜葡萄酿制成的发酵酒,具有增进食欲、滋补、助消化等作用,适量饮用葡萄酒,对维持和调节人体的生理机能,都起到良好的作用。随着人们社交活动的增加、生活水平的提高,葡萄酒越来越受到人们的青睐,而对葡萄酒的评价也因此显得尤为重要。 1.2 基本信息
本文旨在对葡萄酒的好坏进行评价。确定葡萄酒的质量。通过聘请一批有资质的评酒员进行品评后,让其各酒品分指标进行打分。打分共100分制。酿酒葡萄的好坏与所酿葡萄酒之间有直接关系,同时葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 1.3 有关信息
附件给出了评价结果、酿酒葡萄与葡萄酒的成分数据。包括: 附件1:葡萄酒品尝评分表
附件2:葡萄和葡萄酒的理化指标 附件3:葡萄和葡萄酒的芳香物质 1.4 问题提出
1) 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可
信。
2) 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3) 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4) 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡
萄和葡萄酒的理化指标来评价葡萄酒的质量。
二、 问题分析
2.1 问题一:
本小题要求我们对附件1中两组评酒员的评价结果是否存在显著性差异进行分析,并检验哪组结果更可信。故我们可将评酒员对红/白葡萄酒的各项评分项目作求平均值处理并将其结果相加得到不同酒种的分数,再运用matlab软件对数据进行正态性检验判断数据是否满足进行T检验的基本条件,在确认满足条件之后,我们对数据进行T检验得出最终所需结果。 2.2 问题二:
题目要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级处理。对于附录中众多理化指标,我们利用spss软件进行因子分析,提炼出几个对葡萄总体理化指标有显著影响的因子。以这些因子代表原来的众多指标,接着对酿酒葡萄样本进行系统聚类分析得出样本的聚类谱系图,即可得出酿酒葡萄的分类情况。再结合葡萄酒的质量,这里需要注意的是,我们要用到问题一较为可信那一组的评分情况作为质量的标准,再用其来衡量几类葡萄的好坏 2.3 问题三:
分析题意不难发现,这是两个有较多变量的指标样本。那么不能用多元线性回归来解决问题。由于葡萄的理化指标过多,直接进行典型相关分析无法实现,我们考虑用因子分析进行降维,之后利用降维后的指标进行系统聚类分析,在这里我们
2
考虑用离差平方法进行聚类。再找出能够衡量葡萄酒质量的标准来对聚类的结果进行分析,充实。 2.4 问题四:
题目要求我们找出哪些酿酒葡萄和葡萄酒的理化指标对葡萄酒质量有影响,并且论证能否用葡萄和葡萄酒的理化指标来直接评价葡萄酒的质量。我们运用酿酒葡萄和葡萄酒的理化指标与葡萄酒的评分建立多元线性回归模型,得出通过了显著性检验的参数,从而判断出哪些理化指标对葡萄酒质量有显著影响。最后我们将酿酒葡萄和葡萄酒的感官指标当作变量引入回归方程,得到新回归方程的拟合度和显著性检验,然后判断出能否用葡萄和葡萄酒的理化指标来直接评价葡萄酒的质量。
三、 模型假设
1.品酒员之间的打分不会相互影响。
2.品酒员个人对各酒品的打分标准保持不变。 3.酿酒工艺对不同葡萄酒的质量的影响保持一致。
4. 葡萄酒和酿酒葡萄的理化指标在短期内是稳定、保持不变的。
四、 符号说明 x1:氨基酸总量(mg/100gfw) x2:蛋白质(mg/100g) x3:VC含量(mg/L) x4:花色苷(mg/100g) x5:酒石酸(g/L) x6:苹果酸(g/L) x7:柠檬酸(g/L) x9:褐变度(ΔA/g*g*min*ml) x10:DPPH自由基(g/L) x11:总酚(mmol/kg) x21:固酸比 x22:干物质含量(g/100g) x23:果穗质量(g) x24:百粒质量(g) x25:果梗比(%) x26:出汁率(%) x27:果皮质量(g) x29:果皮颜色a* x30:果皮颜色b* y1: 花色苷(mg/L) y2: 单宁(mmol/L) y3: 总酚(mmol/L) y4: 酒总黄酮(mmol/L) y5:白藜芦醇(mg/L) y6:DPPH半抑郁体积(uL) y7:色泽L*(D65) y8:色泽a*(D65) y9:色泽b*(D65) x8:多酚氧化酶活力E(A/min·g·ml) x28:果皮颜色L* x12:单宁(mmol/kg) x13:葡萄总黄酮(mmol/kg) x14:白藜芦醇(mg/kg) x15:黄酮醇(mg/kg) x16:总糖(g/L) x17:还原糖(g/L) x18:可溶性固形物(g/L) x19:PH值 x20:可滴定酸(g/L) 3
五、 模型的建立与求解
5.1问题一模型
5.1.1问题一模型的准备 1.样本配对T检验的理论
两独立样本T检验就是根据样本数据对两个配对样本本来自的辆配对总体的均值是否有显著差异进行推断。
两配对样本T检验的前提条件:两样本应该是配对的(两样本的观察值数目相同,两样本的观察只的顺序不能随意更改);样本来自的两个总体应该服从正太分布。⑴提出原假设
两配对样本T检验的原假设H0为:两总体均值无显著差异,表述为H0:
?1??2?0。?1,?2分别为第一个和第二个总体的均值。 要检验的假设为:
H0:?1??2 H1:?1??2
记
S1??(Xi?X)(Xi?X)T
i?1nS2??(Yi?Y)(Yi?Y)Ti?1m
采用统计量为
T2?mn(m?n?2)(X?Y)T(S1?S2)?1(X?Y)m?n
2. 在此我们将会用到matlab工具箱的一个命令:
h=normplot(x)
此命令显示数据矩阵X的正态概率图,如果数据来自于正态分布,则图形显示出直线型形态,而其它概率分布呈现曲线形态。
有了以上知识我们利用matlab编程对数据进行正态性检验(程序见附录)
5.1.2问题一模型的建立
首先,我们对数据进行处理。附录1给出了10位品酒员分别对27种红葡萄酒和28种白葡萄酒关于外观分析、香气分析、口感分析和平衡/整体四方面数据的评分数据。我们首先将红葡萄酒与白葡萄酒的种类编号按从小到大顺序排好以便后续数据处理工作的顺利进展,通过观察我们可以发现,编号为3的白葡萄酒在第7位品酒员在口感分析中的持久性一项中数据出现明显偏差,故我们将这一项剔除,所以最后均剩下27种红葡萄酒和27种白葡萄酒。接着,我们对10位品酒员对27种红/白葡萄酒的各项评分项目(其中包括外观分析的澄清度、色调,香气分析的纯正度、浓
4
度、质量,口感分析的纯正度、浓度、持久性和质量)作求平均值处理,再将各平均值相加,得到不同编号不同种类葡萄酒的各自分数,结果如下表1所示:
表1 品酒员品酒得分表 第一组红酒 第二组红酒 第一组白酒 第二组白酒 1 62.7 68.1 82.0 77.9 2 80.3 74.0 74.2 75.8 3 80.4 74.6 79.4 76.9 4 68.6 71.2 71.0 81.5 5 73.3 72.1 68.4 75.5 6 72.2 66.3 77.5 74.2 7 71.5 65.3 71.4 72.3 8 72.3 66.0 72.9 80.4 9 81.5 78.2 74.3 79.8 10 74.2 68.8 72.3 71.4 11 70.1 61.6 73.3 72.4 12 53.9 68.3 65.9 73.9 13 74.6 68.8 72.0 77.1 14 73.0 72.6 72.4 78.4 15 58.7 65.7 74.0 67.3 16 74.9 69.9 78.8 80.3 17 79.3 74.5 73.1 76.7 18 60.1 65.4 72.2 76.4 19 78.6 72.6 77.8 76.6 20 79.2 75.8 76.4 79.2 21 77.1 72.2 71.0 79.4 22 77.2 71.6 75.9 77.4 23 85.6 77.1 73.3 76.1 24 78.0 71.5 77.1 79.5 25 69.2 68.2 81.3 74.3 26 73.8 72.0 64.8 77.0 27 73.0 71.5 81.3 79.6 考虑以上表格,第一组红酒与第二组白酒配成第一对,第二组红酒与第二组白酒配成第二对,满足配对样本T检验的前提条件,在此我们利用matlab编程对数据进行正态性检验(程序见附录1),得到图1。
5
图1 正态性检验
可以看出,除少数异常点外,图形基本呈现直线型形态,这说明这四个样本都满足正态分布,满足进行T检验的基本条件。到此样本完全满足进行配对样本T检验的所有前提条件,我们利用SPSS软件进行,得到下表:
表2-成对样本检验
成对差分 均值 标准差 均值的差分的 95% 置信区间 标准误 下限 上限 .4489 -4.3038 4.6918 t df Sig.(双侧) .019 .021 第一对 2.5704 5.3628 1.0321 第二对 -2.3444 4.9531 .9532 2.490 26 -.3851 -2.459 26 根据以上输出结果我们可以得到第一组红酒 - 第二组红酒pearson值为0.019<0.05,第一组白酒 - 第二组白酒pearson值为0.021<0.05。两组红酒和白酒的评分都存在明显的差异。由此我们可以得出结论:两组评酒员的评价结果存在显著性差异。
因此,以上我们通过matlab编程对数据进行正态性检验后再用spss进行配对T检验。可以看出,两组品酒员的评价结果存在显著性差异。这说明两组品酒员的评价结果中有一组并不准确可信。因此我们对问题进一步深入研究,通过可信度分析
6
方法分析两组品酒员品酒结果的可信度。 5.1.3 可信分析
在葡萄酒的感官评价中, 由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异, 导致不同品酒员对同一酒样的评价差异很大, 从而不能真实地反映不同酒样间的差异。所以我们认为,品酒员给的评分波动值越大时,说明此品酒员的可信度越低。【1】下面我们将分别对附件1中两组评酒员所给出的评分进行方差分析,然后再去分析哪一组的评酒员可信度比较高。(方差分析表见附录2)
由上面的方差分析结果可以知道,第一组和第二组的P值和F值都相差不大,所以我们只能用组间离均平方和去比较他们的波动性。第一组红葡萄酒评分的组间离均平方和为3172.573,第一组白葡萄酒评分的组间离均平方和为18023.93,第二组红葡萄酒评分的组间离均平方和为3060.774,第二组白葡萄酒评分的组间离均平方和为6645.781。很显然,第二组评酒员所给的评分的波动性比较小,所以第二组评酒员所给的评分是更可信的。
表3-各组葡萄组间离均平方和对比 组间离均平方和 组间离均平方和 第一组红葡萄 3172.573 第二组红葡萄 3060.774 第一组白葡萄 18023.93 第二组白葡萄 6645.781 5.2问题二模型
5.2.1问题二模型的准备
聚类分析的理论:
系统聚类的步骤一般是首先根据一批数据或指标找出能度量这些数据或指标之间相似程度的统计量;然后以统计量作为划分类型的依据,把一些相似程度大的指标(项目)首先聚合为一类,而把另一些相似程度较小的指标(项目)聚合为另一类,直到所有的指标(项目)都聚合完毕,最后根据各类之间的亲疏关系,逐步画成一张完整的分类系统图,又称谱系图。进行类别合并的准则是使得类间差异最大,而类内差异最小为了将一些指标(项目)进行分类,就需要研究指标(项目)之间关系。是将一个指标看作P 维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。 5.2.2问题二模型的求解
根据系统所附表格—葡萄和葡萄酒的理化指标表格,葡萄的理化指标分为一级指标和二级指标,从数据中也不难发现,对于大多数一级指标来说,它是由旁副的几个二级指标的加和得到的。为了计算简便,我们只选用一级指标来进行分析,以一级指标概括描述二级指标。分析数据后,得知总共划分为30个指标,对于红葡萄和白葡萄两个样本,我们选择将它们分开来进行分析。考虑到指标众多,我们先选取红葡萄的理化指标进行因子分析,利用因子分析法进行降维,达到简化数据的目的。该过程利用SPSS软件实现。通过对葡萄的指标进行评价,提炼出几个对葡萄总体理化指标有显著影响的因子,见表4。
表4-因子分析
7
氨基酸总量 蛋白质 花色苷 酒石酸(g/L) 苹果酸(g/L) 柠檬酸(g/L) 多酚氧化酶活力 褐变度 总酚(mmol/kg) 葡萄总黄酮(mmol/kg) 黄酮醇(mg/kg) 总糖g/L 可溶性固形物g/l 果梗比(%) 出汁率(%) 初始 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 提取 0.958 0.828 0.892 0.864 0.890 0.825 0.701 0.904 0.898 0.826 0.660 0.878 0.920 0.803 0.612 在进行因子分析后,我们发现原本的30个指标只被采用了15个,由此达到一个缩减指标的目的,但剩下的15个指标能很好地反映原本样本模型,接下来我们利用这15个指标对红葡萄进行聚类分析【2】,得到图2。 图2-红葡萄的聚类分析谱系图 8
对红葡萄的27个样本聚类谱系图。依据谱系图聚成5类。接着,我们对这五类红葡萄所对应的葡萄酒的质量进行量化。【3】选取第一问模型得出的较可靠的第二组评酒员的打分作为葡萄酒质量的衡量标准。我们得到下表。从五类红葡萄所对应的葡萄酒得分均值及方差表中,不难发现每一类葡萄的均值呈递增趋势,在表的基础上我们制定标准,将葡萄分为A、B、 C、D、E五个级别。第一类葡萄所酿葡萄酒质量评分均值明显最低,我们将其划为E级红葡萄,这种葡萄质量最差。同样的,第二类、第三类、第四类、第五类红葡萄分别定为D、C、B、A四个等级,分别代表质量较差,质量一般,质量较好,质量最好的四种酿酒葡萄。这样我们就实现了对葡萄的分级。
表5-红葡萄酒的聚类分析表 葡萄酒编号 质量评分均值 方差 61.6 0 第一类 11 66.325 1.94 第二类 6、7、12、18 68.9 11.37 第三类 1、8、14 4、5、10、13、15、16、17、19、70.96923 7.283 第四类 20、22、24、25、26、27 75.22 5.852 第五类 2、3、9、21、23 表6-红葡萄的分级 分级 葡萄酒编号 A级酿酒红葡萄 2、3、9、21、23 B级酿酒红葡萄 4、5、10、13、15、16、17、19、20、22、24、25、26、27 C级酿酒红葡萄 1、8、14 D级酿酒红葡萄 6、7、12、18 E级酿酒红葡萄 11 对于白葡萄,我们采用同样的方法,做出来的分级如下:
表7-白葡萄的分级 分级 葡萄酒编号 A级酿酒白葡萄 5、9、15、17、28 B级酿酒白葡萄 1、10、14、22、25、27 C级酿酒白葡萄 4、12、18、19、20、23、24、26 D级酿酒白葡萄 2、3、6、7、8、13 E级酿酒白葡萄 11、16 白葡萄也分为A、B、C、D、E五个等级,分别代表质量最好,质量较好,质量一般,质量较差,质量最差的五种酿酒葡萄。其中,编号为5、9、17、15、28的酿酒白葡萄为A级酿酒葡萄,编号为27、14、1、22、25、10的酿酒白葡萄为B级酿酒葡萄,编号为12、26、19、4、23、24、18、20的酿酒白葡萄为C级酿酒葡萄,编号为2、3、6、7、8、13的酿酒白葡萄为D级酿酒葡萄,编号为11、16的酿酒白葡萄为E级酿酒葡萄。
9
5.3 问题三模型
5.3.1 问题三模型的准备
典型相关分析的理论依据
首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此继续下去,直到两组变量之间的相关性被提取完毕为此。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。 5.3.2 问题三模型的建立 图3-酿酒红葡萄与红葡萄酒的理化性指标之间的相关系数 根据相关性挑选出了15红葡萄酒个理化指标相关性较强的指标,分别是x1、
x2、x4、x6、x9、x10、x11、x12、x13、x14、x15、x25、x28、x29、x30。接下来用
这些15酿酒红葡萄的指标与红葡萄酒的指标进行典型相关分析。我们利用sas软件中的“分析家”实现典型相关分析。接下来我们将一步一步讲解运行的结果所代表的意思。
(1)典型相关系数及显著性检验
第一部分的四列依次是:典型相关系数、修正的典型相关系数、近似的标准误一级典型相关系数的平方。从图7-10中可以看出,本例选取了九个典型相关系数,第一个典型相关系数CanR1=0.999636,其修正值为0.999341,标准误为
10
0.000143,CanR12 =0.999273,第一点行相关系数表示的是第一对典型相关变量之间的相关性。第二个典型相关系数为0.987962,以此类推。 图4-典型相关系数 第二部分是特征跟以及相应的统计量,如图5所示。 图5-特征根以及典型相关系数的检验 左边四列依次是:特征跟、向另两个特征跟之差、特征跟所占方差信息量的比例和累计方差信息量的比例。从中可以看出,第一对典型变量所能解释的变异已占总变异的95.36%,其他八个典型相关变量的作用很小,一共只解释了总变异的5%,可以不予考虑。
第三部分输出的是用四种多元统计方法进行的所有典型相关系数均为0的F检验结果,如图6所示。四种方法中一般参照WILKS’ LAMBDA检验的结果,检验结果表明至少有一个典型相关系数在a=0.0635的显著水平下非0。 图6-对典型相关系数均为0的F检验 11
(2)典型变量系数与典型结构
第四部分给出的是用原始变了表达的典型变量系数(典型权重),如图7所示。
图7-原始变量表达的典型变量系数 因为24个变量没有使用相同单位进行测量,因此考虑分析标准化后的系数。第五部分给出的是用标准化变量(对原始变量标准化)表达的典型变量系数,如图8所示。利用典型变量系数可以给出典型变了和标准化变量间的换算公式。
图8-标准化变量的典型变量系数 12
来自红葡萄的理化指标第一典型变量V1为:
V1?0.2104x1?0.0742x2?0.4395x4?0.4058x6?0.1236x9?0.4625x10?0.2124x11?0.1740x12?0.3420x13?0.0307x14?0.0427x15?0.0943x25?0.3084x28?0.6583x29?0.2943x30V1近似地是x4、x6、x10、x29的加权差,在x29上的权重更大些。 来自红葡萄酒的理化指标的第一典型变量W1为:
(1)
W1?0.8452y1?0.2050y2?0.2968y3?0.0484y4?0.1111y5?0.2122y6?0.3971y7?0.0988y8?0.0366y9
(2)
W1在y1上的系数最大。这一对典型变量主要是反映x4、x6、x10、x29与y1的正相关关系。 图9-典型结构1 13
图10-典型结构2 第六部分为典型结构,分别是各族原始变量与典型变量两两之间的相关系数矩阵,如图7-15所示。可以看出:在原始变量与本组的典型变量的相关关系(典型载荷)中,红葡萄的理化指标的第一典型变量V1与x4(花色苷)、x6(苹果酸)、
x9(褐变量)的相关系数最大,说明这个典型变量主要反映第一组典型变量主要
是由花色苷和苹果酸、褐变量所决定,尤其是花色苷的影响更加显著;反映红葡萄理化指标的第一组典型变量主要是由花色苷、褐变度所决定;红葡萄酒的第一典型变量W1与y1、y7(花色苷)的相关系数最大,且与y7(L*)是负相关关系,说明W1主要反映红葡萄酒的理化指标的颜色类别,且y1(花色苷)、y7(L*)有反相关关系,意味着当花色苷增多时,色泽L*变浅。在原始变量与配对组的典型变量的相关关系(典型交叉载荷)的分析结果中,X4与V1的相关性较强,V1与Y1的相关性较强,这些都说明了红葡萄的颜色类别(包括花色苷、褐变度)、苹果酸的量都会对对红葡萄酒的理化指标产生影响,例如引起红葡萄酒的花色苷、L*指标的变化,尤其是花色苷指标的影响尤为显著。
结果表明:红葡萄和红葡萄酒间的典型相关分析结果说明:两组变量间,花色苷、苹果酸、褐变度、色泽L*相关密切,特别是葡萄与葡萄酒间的花色苷指标可见显著相关。
对于白葡萄,我们采取同样的方法进行典型相关分析,这里我们给出典型相关分析后的结论:
白葡萄的理化指标的第一典型变量V1与x15(黄酮醇)、x9(褐变度)、x12(单宁)的相关系数最大,且之间是正相关关系,以为着三者之一的任一变量增加
14
时都会引起其他变量的增加。另一方面,白葡萄酒的理化指标W1与就y4(总黄酮)、y2(单宁)、y3(总酚)的相关系数最大。特别是白葡萄与白葡萄酒之间的单宁指标可见显著相关。
5.4问题四模型
5.4.1问题四模型的建立:
先分析酿酒葡萄指标和葡萄酒指标对葡萄酒质量的影响: 建立逐步回归模型
z??0??1x1??2x2???nxn?? (i?1,2....n) (3)
其中?i称为回归系数
运用SAS软件,解出酿酒红葡萄和红葡萄酒的理化指标与葡萄酒质量的回归方程(结果见图11):
z?63.2691-0.4547*x6?0.4506*x13?0.2134*x21?0.5866*x29?? (4)
拟合统计量
回归方程检验
回归系数检验
回归诊断
图11-回归分析1
从结果可以分析得出,回归方程的拟合度达到了78.99%,而且各参数都通过了显著性检验,所以所建立的模型是比较合理的。从回归方程中可以看出,理性指标x6-苹果酸,x13-葡萄总黄酮,x21-固酸比,x29-果皮颜色的a*(+红;-绿)对葡萄酒质量的影响比较大的。
运用SAS软件,解出酿酒白葡萄和白葡萄酒的理化指标与葡萄酒质量的回归方程(结果见图12):
z?59.2737?0.50*b5?9.4051*b10?0.8416*b20?0.4811*b29?0.4766*b30?? (5)
15
拟合统计量
回归方程检验
回归系数检验
回归诊断
图12-回归分析2
结果分析:
从结果可以分析可以分析出,回归模型中各参数都通过了显著性检验,而且模型整体的拟合效果也不错,所以我们所建立的回归方程是合理的。从回归方程中可以看出,b5-酒石酸、b10-DPPH自由基1/IC50、b20-可滴定酸、b29=果皮颜色a*(+红;-绿)、b30-果皮颜色b*(+黄;-蓝)对葡萄酒质量的影响比较大。
5.4.2 论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量:
查找了相关文献,葡萄酒的质量可以用理化指标和感官指标进行评价,所以我们将酿酒葡萄和葡萄酒的感官指标当做变量引入方程,从而去验证能否只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,如果添加了感官指标后的拟合度比没有添加的拟合度高,各参数都通过显著性检验,则说明感官指标对葡萄酒的质量的评价也有影响。 建立回归模型:
z??0??1x1??2x2???nxn??n?1a1??n?2a2???2nan?? (6) 其中an为感官指标
运用SAS软件,利用附录的理性指标和感官指标对葡萄酒质量解出回归方程结果:
16
图13-回归分析3
上面是红葡萄和红葡萄酒的理性指标和感官指标对葡萄酒质量解出回归方程结果,回归方程的拟合度为98.62%,拟合度明显比没加上感官指标时78.89%高出很多,而且模型中的各参数都通过了显著性检验,所以上面的结果论证了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
六、 模型评价与检验
6.1 模型的优点:
本文从题意出发,充分运用SPSS、SAS、MATLAB等程序并绘制了较多图表,在解题过程中采用了多种算法,包括配对样本T检验、聚类分析、因子分析、典型相关分析等法。使得模型叙述较为流畅。 6.2 模型的缺点:
由于时间紧迫,数据量巨大,我们在计算的过程中忽略了二级指标进行分析,这不免使得模型相对来说比较粗糙,同时由于数据量较大的关系使得计算过程中难免存在误差。 6.3 模型的检验
经检验证实模型均基本符合模型建立初衷。
七、 参考文献
【1】 李华等,运用多元统计分析确定葡萄感官特性的描述符,中国食品学报第七
卷第四期,2007.8
【2】 刘曙东等,葡萄酒感官评价结果的统计分析方法研究,中国食品学报第六卷
第二期,2006.4
【3】 李运等,统计分析在葡萄酒质量评价中的应用,酿酒科技2009年第四期,
2009
【4】 王英臣,基于主成分分析和人工神经网络的酒类辨识,河北工程大学学报第
26卷第2期,2009.6
17
八、 附录
附录1
正态性检验的Matlab程序:
x1=[62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 60.1 78.6 79.2 77.1 77.2 85.6 78 69.2 73.8 73];
x2=[68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5];
x3=[82 74.2 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 73.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3];
x4=[77.9 75.8 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6]; subplot(2,2,1);h=normplot(x1); title('第一组红酒的正态性检验'); subplot(2,2,2);h=normplot(x2); title('第二组红酒的正态性检验'); subplot(2,2,3);h=normplot(x3); title('第一组白酒的正态性检验'); subplot(2,2,4);h=normplot(x4); title('第二组白酒的正态性检验')
18
附录2
各组葡萄酒平常评分表: 酒样品1 酒样品2 酒样品3 酒样品4 酒样品5 酒样品6 酒样品7 酒样品8 酒样品9 酒样品10 酒样品11 酒样品12 酒样品13 酒样品14 酒样品15 酒样品16 酒样品17 酒样品18 酒样品19 酒样品20 酒样品21 酒样品22 酒样品23 酒样品24 酒样品25 酒样品26 酒样品27
评酒员1 51 71 80 52 74 72 63 64 77 67 73 54 69 70 69 72 70 63 76 78 73 73 83 70 60 73 70 评酒员2 66 81 85 64 74 69 70 76 78 82 60 42 84 77 50 80 79 65 84 84 90 83 85 85 78 80 77 第一组红葡萄酒品尝评分 评酒评酒评酒评酒员3 员4 员5 员6 49 54 77 61 86 74 91 80 89 76 69 89 65 66 58 82 72 62 84 63 71 61 82 69 76 64 59 84 65 65 76 72 76 82 85 90 83 68 75 73 72 63 63 71 40 55 53 60 79 59 73 77 70 70 80 59 50 58 51 50 80 71 69 71 91 68 97 82 49 55 52 57 84 66 68 87 76 68 82 79 96 71 69 60 72 68 93 72 86 80 95 93 90 68 90 84 81 62 70 67 71 61 78 71 63 64 80 76 评酒员7 72 83 73 76 68 69 72 69 76 75 70 47 77 76 56 80 69 62 80 76 79 75 81 70 64 72 73 评酒员8 61 79 83 63 84 64 59 85 92 68 66 61 76 76 60 74 80 58 78 76 73 77 91 75 62 76 67 评酒员9 74 85 84 83 81 81 84 75 80 76 90 58 75 76 67 78 81 70 82 86 86 79 84 78 81 79 85 评酒员10 62 73 76 77 71 84 84 76 79 75 73 69 77 76 76 74 76 68 81 81 74 80 78 70 67 77 75 19
酒样品1 酒样品2 酒样品3 酒样品4 酒样品5 酒样品6 酒样品7 酒样品8 酒样品9 酒样品10 酒样品11 酒样品12 酒样品13 酒样品14 酒样品15 酒样品16 酒样品17 酒样品18 酒样品19 酒样品20 酒样品21 酒样品22 酒样品23 酒样品24 酒样品25 酒样品26 酒样品27 酒样28 评酒评酒员1 员2 85 80 78 47 85 67 75 77 84 47 61 45 84 81 75 46 79 69 75 42 79 46 64 42 82 42 78 48 74 48 69 49 81 54 86 44 75 66 80 68 84 49 65 48 71 66 82 56 86 80 75 66 58 40 66 75 第一组白葡萄酒品尝评分 评酒评酒评酒评酒评酒员3 员4 员5 员6 员7 88 61 76 93 83 86 54 79 91 85 89 75 78 75 136 80 65 77 83 88 77 60 79 62 74 83 65 78 56 80 83 66 74 80 80 81 54 81 59 73 81 60 70 55 73 86 60 87 75 83 85 60 74 71 86 75 52 67 62 77 83 49 66 65 76 84 67 79 64 78 87 71 81 61 79 86 65 70 91 87 90 70 78 71 87 83 71 72 71 85 83 68 73 64 80 82 71 83 81 84 85 59 76 86 83 90 58 72 77 76 80 69 80 82 78 79 73 67 59 68 82 69 74 67 77 82 75 93 91 81 79 67 59 55 66 89 69 88 87 85 评酒员8 80 68 79 78 74 67 68 77 81 73 62 56 62 68 67 62 74 64 63 62 70 70 71 78 78 76 74 76 评酒员9 95 73 90 85 79 65 77 85 76 91 88 68 65 81 74 84 92 74 73 87 88 80 87 86 77 90 73 88 评酒员10 79 81 79 86 74 84 82 83 85 71 72 70 69 73 82 77 91 81 77 80 84 74 75 85 81 84 77 90
20
酒样品1 酒样品2 酒样品3 酒样品4 酒样品5 酒样品6 酒样品7 酒样品8 酒样品9 酒样品10 酒样品11 酒样品12 酒样品13 酒样品14 酒样品15 酒样品16 酒样品17 酒样品18 酒样品19 酒样品20 酒样品21 酒样品22 酒样品23 酒样品24 酒样品25 酒样品26 酒样品27
评酒员1 68 75 82 75 66 65 68 71 81 67 64 67 74 71 62 71 72 67 72 80 80 77 79 66 68 68 71 评酒员2 71 76 69 79 68 67 65 70 83 73 61 68 64 71 60 65 73 65 65 75 72 79 77 69 68 67 64 第二组红葡萄酒品尝评分 评酒评酒评酒评酒员3 员4 员5 员6 80 52 53 76 76 71 68 74 80 78 63 75 73 72 60 77 77 75 76 73 75 61 58 66 68 65 47 70 78 51 62 69 85 76 69 80 82 62 63 66 67 62 50 66 75 58 63 73 68 65 70 67 78 64 67 76 73 54 59 71 78 70 64 73 75 74 75 77 80 55 62 64 82 61 64 81 80 66 70 84 75 72 62 77 75 62 68 69 80 83 67 79 72 73 73 68 84 62 60 66 83 64 73 74 72 71 69 71 评酒评酒评酒员7 员8 员9 71 73 70 83 73 73 72 77 74 73 73 60 72 72 74 70 67 67 57 74 72 73 59 68 83 77 75 66 72 65 64 51 67 67 72 69 70 76 69 74 80 73 71 70 68 66 75 68 79 76 76 62 74 60 76 80 74 79 83 71 63 70 73 73 71 69 80 71 81 72 76 76 69 73 66 77 78 63 82 73 73 评酒员10 67 71 76 70 68 67 67 59 73 72 64 71 65 72 69 69 68 65 71 70 78 73 74 70 66 73 69 21
酒样品1 酒样品2 酒样品3 酒样品4 酒样品5 酒样品6 酒样品7 酒样品8 酒样品9 酒样品10 酒样品11 酒样品12 酒样品13 酒样品14 酒样品15 酒样品16 酒样品17 酒样品18 酒样品19 酒样品20 酒样品21 酒样品22 酒样品23 酒样品24 酒样品25 酒样品26 酒样品27 酒样28
评酒员1 84 79 85 84 83 83 78 74 77 86 79 73 68 75 83 68 77 75 76 86 81 80 74 67 79 80 72 75 第二组白葡萄酒品尝评分 评酒评酒评酒评酒评酒评酒评酒评酒评酒员2 员3 员4 员5 员6 员7 员8 员9 员10 78 82 75 79 84 81 69 75 72 76 77 85 77 79 80 59 76 70 74 71 87 79 79 80 45 83 73 78 74 83 69 82 84 66 77 72 79 79 80 77 87 82 73 84 91 75 74 69 75 77 80 67 77 78 79 74 69 69 82 80 61 72 78 78 74 67 73 77 79 66 73 62 78 89 88 84 89 85 54 79 81 77 77 82 81 87 84 61 73 90 83 78 63 60 73 81 61 60 76 81 73 79 67 79 80 44 64 84 78 79 81 78 72 75 62 65 81 77 76 76 78 82 79 68 78 82 77 88 80 84 83 80 63 76 70 63 75 60 67 86 67 71 52 64 69 79 83 79 87 88 75 78 88 83 82 79 74 84 78 71 74 67 75 78 70 81 80 83 66 78 77 74 75 78 85 81 78 61 73 75 80 79 85 83 76 80 58 85 85 76 82 88 75 89 80 66 72 86 80 80 80 74 79 75 73 83 76 80 77 77 79 78 83 65 72 83 76 79 86 83 88 83 52 85 84 72 75 83 71 83 83 53 62 81 79 84 79 76 83 77 63 79 78 82 81 81 78 84 79 71 76 89
22
图14-第一组红葡萄酒的方差分析
图15-第一组白葡萄酒的方差分析
图16-第二组红葡萄酒的方差分析
图17-第二组白葡萄酒的方差分析
23
正在阅读:
加强网络阵地建设 创新网络思政教育工作新局面 12-1801-28
马上二小学生学籍管理制度12-26
脂质代谢、营养学特点及结构脂质的应用10-21
2015年初级电工考试试题及答案05-01
水质检测 水质检测价格 水质检测中心 废水污水循环水检测 哪能做04-26
国际商学院学生综合职业能力测评细则08-17
水污染及其成因08-19
假如世界上少样东西作文300字06-25
北京电力公司经营性收费项目与计价标准10-22
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 数学建模
- 一等奖
- 大赛
- 大学生
- 论文
- 全国
- 2012
- 2015-2016第二学期学校工作总结
- 2017结核病试题
- XX有限公司应收账款管理的现状问题及对策-毕业论文
- 1、干部人事档案专项审核培训
- 知识产权填空
- 大学物理C1、C2(University Physics C1、C2)
- 安全事故反思材料提纲(范本)
- 第七章练习题
- 社科红标模版
- 护理员操作流程41项
- 2013年11月(上半月)医药行业要闻综述
- 社区社会工作论述题
- 太极集团销售管理系统建设规划
- 课后作业
- 2015年6月金融专业投资学选择题
- 2018年中国轮胎模具行业运营态势分析报告目录
- 海南藏族自治州2016年国民经济和社会发展统计公报-青海统计局
- 东财《企业税收筹划》论文题目
- 如何解决农村养老问题
- 小学语文“逢考必出”的古诗词+国学常识