数学建模教师薪金问题

更新时间:2023-11-15 13:11:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数学建模

论文题目:教师薪金问题

教师薪金问题

摘要

本文是一个关于建立教师薪金影响因素的回归模型。在模型中我们考虑到了题目给出的所有因素,通过题目给出的数据,发现这七个变量之间与因变量均呈线性关系,因此我们初步的建立了一般的线性回归模型,然后我们用MATLAB软件求解。我们首先利用MATLAB软件作出薪金与老师工作时间的散点图,然后假设工作时间与教师薪金为线性关系,通过对解出的数据进行分析,我们发现模型存在缺陷,有些变量对因变量的影响不显著,这也就说明性别和婚姻状况上的差异对所调查的教师的薪金影响较小。经过对模型的各个变量的逐步回归和作残差图,从影响系数的表图中我们得出了工作时间和学历对教师的薪金的影响最大。

关键词:统计回归模型 MATLAB软件 残差分析法 逐步回归

一、问题提出

某地人事部门为研究中学教师的薪金与他们的资历,性别,教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人士策略的合理,特别是考虑女教师是否受到不公平的待遇,以及他们的婚姻状况是否会影响收入。为此,从当地教师中随机选了3414位进行观察,然后从中保留了90个观察对象,得到了下表给出的相关数据。尽管这些数据具有一定的代表性,但是仍有统计分析的必要。现将表中数据的符号介绍如下: Z~月薪(单位:元);X1~工作时间(以月计);X2=1~男性,X2=0~女性;X3=1~男性或单身女性,X3=0~已婚女性;X4~学历(取值0~6,值越大表示学历越高);X5=1~受雇于重点中学,X5=0~其它;;X6=1~受过培训的毕业生,X6=0~未受过培训的毕业生或受过培训的肄业生;X7=1~以两年以上未从事教学工作,X7=0~其他。注意组合(X2,X3)=(1,1),(0,1),(0,0)的含义。

(1) 进行变量选择,建立变量X1~X7与Z的回归模型(不一定包括每个自变

量),说明教师的薪金与哪些变量关系密切,是否存在性别和婚姻状况上的差异。为了数据处理上的方便,建立对薪金取对数后作为因变量。 (2) 除了变量X1~X7本身之外,尝试将他们的平方项或交互项加入到模型中,

建立更好的模型量。 Z X1 X2 X3 X4 X5 X6 Z X1 X2 X3 X4 X5 X6 X7 X7 1 998 7 0 0 0 0 0 46 2201 158 1 1 4 0 0 1 1 2 1015 14 1 1 0 0 0 47 2992 159 1 1 5 1 0 1 1 3 1028 18 1 1 0 1 0 48 1695 162 0 1 0 0 0 0 0 4 1250 19 1 1 0 0 0 49 1792 167 1 1 0 1 0 0 0 5 1028 19 0 1 0 1 0 50 1690 173 0 0 0 0 0 0 1 6 1028 19 0 0 0 0 0 51 1827 174 0 0 0 0 0 0 1 7 1018 27 0 0 0 0 0 52 2604 175 1 1 2 1 1 1 0 8 1072 30 0 0 0 0 0 53 1720 199 0 1 0 0 0 0 0 9 1290 30 1 1 0 0 0 54 1720 209 0 0 0 0 0 0 0 10 1204 30 0 1 0 0 0 55 2159 209 0 1 4 1 0 0 0 11 1352 31 0 1 2 0 1 56 1852 210 0 1 0 0 0 0 0 12 1204 31 0 0 0 1 0 57 2104 213 1 1 0 1 0 0 0 13 1104 38 0 0 0 0 0 58 0 14 1118 41 1 1 0 0 0 59 0 15 1127 42 0 0 0 0 0 60 0 16 1259 42 1 1 0 1 0 61 0 17 1127 42 1 1 0 0 0 62 0 18 1127 42 0 0 0 1 0 63 0 19 1095 47 0 0 0 0 0 64 1 20 1113 52 0 0 0 0 0 65 1 21 1462 52 0 1 2 0 1 66 0 22 1182 54 1 1 0 0 0 67 0 23 1404 54 0 0 0 1 0 68 0 24 1182 54 0 0 0 0 0 69 0 25 1594 55 1 1 2 1 1 70 0 26 1459 66 0 0 0 1 0 71 0 27 1237 67 1 1 0 1 0 72 0 28 1237 67 0 1 0 1 0 73 0 29 1496 75 0 1 0 0 0 74 0 30 1424 78 1 1 0 1 0 75 0 31 1424 79 0 1 0 0 0 76 0 32 1347 91 1 1 0 1 0 77 0 33 1343 92 0 0 0 0 0 78 1 34 1310 94 0 0 0 1 0 79 0 1852 220 0 0 0 0 0 1 1852 222 0 0 0 0 0 0 2210 222 1 1 0 0 0 0 2266 223 0 1 0 0 0 0 2027 23 1 1 0 0 0 0 1852 227 0 0 0 1 0 0 1852 232 0 0 0 0 0 1 1995 235 0 0 0 0 0 1 2616 245 1 1 3 1 1 0 2324 253 1 1 0 1 0 0 1852 257 0 1 0 0 0 1 2054 260 0 0 0 0 0 0 2617 284 1 1 3 1 1 0 1948 287 1 1 0 0 0 0 1720 290 0 1 0 0 0 1 2604 308 1 1 2 1 1 0 1852 309 1 1 0 1 0 1 1942 319 0 0 0 1 0 0 2027 325 1 1 0 0 0 0 1942 326 1 1 0 1 0 0 1720 329 1 1 0 1 0 0 2048 337 0 0 0 0 0 0 35 1814 103 0 0 2 1 1 80 0 36 1534 103 0 0 0 0 0 81 0 37 1430 103 1 1 0 0 0 82 0 38 1439 111 1 1 0 1 0 83 0 39 1946 114 1 1 3 1 1 84 0 40 2216 114 1 1 4 1 1 85 0 41 1834 114 1 1 4 1 1 86 1 42 1414 117 0 0 0 0 0 87 1 43 2052 139 1 1 0 1 0 88 0 44 2087 140 0 0 2 1 1 89 1 45 2264 154 0 0 2 1 1 90 1 2334 346 1 1 2 1 1 1 1720 355 0 0 0 0 0 1 1942 357 1 1 0 0 0 0 2117 380 1 1 0 0 0 1 2742 387 1 1 2 1 1 1 2740 403 1 1 2 1 1 1 1942 406 1 1 0 1 0 0 2266 437 0 1 0 0 0 0 2436 453 0 1 0 0 0 0 2067 458 0 1 0 0 0 0 2000 464 1 1 2 1 1 0 二、基本假设

假设1:教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响。 假设2:工作时间对教师薪金影响是成线性分布的。 假设3:其他因素对教师薪金的影响也是成线性的。 假设4:女性是否结婚与其工作能力无关。

假设5:该地区的人事部门对中学教师的薪金调查是可信的。

三、符号说明

符号 Z 月薪 意义 单位 元 x1 备注 工作时间 性别 婚姻状况 月 x2 x3 x4 x 5 学历 是否受雇于重点中学 是否受过培训 x 6 x 7 ?i 从事教育年限 回归系数 ? 随机误差 四、问题分析

本题要求我们分析教师薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系。按到日常生活中的常识,教师薪金应该与他们的资历、受教育程度有密切关系,资历高、受教育程度高其薪金也应该相应的要高,与其性别、婚姻状况应该没有必然的联系。为了说明教师薪金与各个因素之间的关系以及女教师是否受到不公正的待遇,她们的婚姻状况是否影响其收入。我们建立统计回归模型,通过各组数据来说明它们之间的关系,并进一步分析论证来确定影响教师薪金的因素。

五、模型的建立与求解

首先,我们把所有的相关变量都予以考虑,分别对 作散点图,分 别得到 与各个变量之间的关系,在下面 的散点图中我们可以很 清楚的看到 ,再根据题目的建议和运算的方便我

们开始对薪金取自然对数进行计算.由此,我们初步地得出了一个基本 的线性回归模型如下:

LN(z)??0??1*x1??2*x2??3*x3??4*x4??5*x5??6*x6??7*x7??

2800260024002200200018001600140012001000800050100150200250300350400450500

x1的散点图

然后我们用MATLAB求解此模型,直接在MATLAB中输入命令(见附录),我们

可以得到结果(如下图),我们可以得到?值

参数 参数估计值 置信区间 ?0 1.1311 [1.0268 1.2353] ?1 0.0027 [0.0023 0.0031] ?2 -0.0229 [-0.1432 0.0974] ?3 0.0094 [-0.1005 0.1193] ?4 0.1089 [0.0296 0.1882] ?5 0.0385 [-0.0670 0.1440] ?6 0.1817 0 F= 51.6934 [-0.0507 0.4142] ?7 [ 0 0] R2=0.7889 P=0

六、 结果分析

由上表中R2=0.7889可以知道薪金(z)的78.89%可由模型确定,由p?0远小于0.05,模型从整体上看是成立的,但是还可以看到一个问题,也就是说有些变量的置信区间是包含0点的,因此我们可以知道x2,x3,x5,x6,x7对因变量(z)的影响是不太显著的. 模型的改进;

我们可以把它们剔除掉,保留x1和x4建立逐步线性回归方程,根据题目的建议,我们尝试将它们的交互项和平方项加入其中,经过反复几次的尝试我们得到了相对较好的模型,得到如下方程:

ln(z)??0??1*x1??2*x4??3*x1*x4??4*x1^2??5*x4^2??

用MATLAB来解上式模型:在MATLAB中运行

),x1,x4,x1.*x4,x1.^2*x4,x4.^2*x1]; >> x?[ones(90,1>> [b,bint,r,rint,stats]?regress(y,x)

得到了?值和置信区间如下: 参数 参数估计值 6.9026 0.0043 0.1746 -0.0001 -0.0000 -0.0228 R2= 0.9008 ?0 ?1 ?2 ?3 ?4 ?5 置信区间 [6.8557 6.9496] [0.0037 0.0049] [0.1073 0.2419] [-0.0003 0.0001] [-0.0000 -0.0000] [-0.0371 -0.0085] P=0 F=152.6081 在上述改进的模型中,通过数据我们可以看到R2明显地得到了提高,也就是说薪金z的90.08&均可由模型确定.P远小于0.05,模型从整体上看是成立的 进行残差分析:在MATLAB中运行命令:

>> rcoplot(r,rint)

可以得到残差分析:

Residual Case Order Plot0.40.30.20.1Resduas0-0.1-0.2-0.310203040Case Number5060708090.

残差图

在残差图中我们可以看到,除个别数据(在图中用红色表示)外,其他数据的

残差离零点均较近,且残差的置信区间都包含零点.这说明回归模型

z?6.9026?0.0043x1?0.1746x4??0.0001x1*x4?0*x1^2??0.0228x4^2 能较好地符合原始数据.而个别异常点可以去掉.

七、模型的评价与推广

优点:

1. 该模型将现实中的人事策略问题用简单的线性规划问题进行分析计算.

结构简单,计算方便,有利于对相似问题进行求解和对模型进行扩充.比如教学评估问题,公司员工薪金问题等模型求解.

2. 根据已知的数据,从常识和经验进行分析,辅作散点图,决定取那几

个回归变量及它们的函数形式.

缺点:

该模型在处理此问题时有假设与理想化的思想,与实际问题的求解 还有一定的距离.比如所求模型结果只达到了模型设想的90%左右.

八、参考文献

姜启源 谢金星 叶俊 数学模型(第三版) 高等教育出版社

本文来源:https://www.bwwdw.com/article/z6jv.html

Top