工管论文-复杂网络可以用来预测计量NBA球队的行为吗?

更新时间:2023-05-25 14:28:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

工管论文 复杂网络 用来 预测计量 NBA球队 行为

复杂网络可以用来预测计量NBA球队的行为吗?

佩德罗.西亚瓦斯日达拉梅洛 米拉斯吉拉斯联邦大学31270-901 巴西,米拉斯吉拉斯州,贝洛奥里藏特

吉利奥达.楼阿尔梅达 米拉斯吉拉斯联邦大学31270-901 巴西,米拉斯吉拉斯州,贝洛奥里藏特

安东尼奥.楼洛雷罗 米拉斯吉拉斯联邦大学31270-901 巴西,米拉斯吉拉斯州,贝洛奥里藏特

摘要

美国国家篮球协会(NBA)是世界上最流行的体育联盟之一,同时人们也知道它是一个根据每场比赛后产生的无数的统计数据来下注的移动博彩市场。这导致丰富的历史数据库的存在,并促使我们发现隐含在数据下的信息知识。在本文中,我们使用复杂网络统计数据,来分析NBA的资料库,以建立模型的方式来分析NBA球队队员的行为。基于复杂网络模式和框评分统计进行比较的结果,如得分,篮板数和助攻数。我们通过方块评分统计会发现只有很少的一部分球员在联赛中发挥了重要作用。我们再用复杂网络模型的指标如聚类系数和节点度来预测球队成功的因素。在像NBA这样的强调抓住网络关系的社会系统中基于复杂网络模式的预测结果相比于框评评分统计结果效果要好得多。

分类和主题描述

H.2.8 [信息系统] :数据库管理-数据库应用程序,数据挖掘; G.3 [数学计算] :概率统计,统计计算

一般条款

1

工管论文 复杂网络 用来 预测计量 NBA球队 行为

理论

1. 引言

美国国家篮球协会(NBA)成立于1946年,众所周知,自那时以来,NBA一直以高效的组织和高水平的运动员而著称。每场比赛后,会产生大量的统计数据来描述参加比赛的每一个球员。在美国,这些统计数据,被使用使用于数以百万美元计的国家移动博彩市场。2006年,内华达州博彩管制局报24亿美元的合法体育赌注。同样的,在1999年,美国全国赌博影响研究委员会向国会报告,每年全国有超过三千八百亿美元非法押注运动 。那个生成的统计数据又被广泛的使用于互联网,许多赌博网站引以为援,使它们能对即将举行的比赛结果进行更可靠的预测。

随着时间的推移,这些数据也被用来描述每个球员的业绩,与他们的薪金以及鉴定的合同挂钩。凯文.加内特在2006/2007赛季中平均每场得分22.4分,12.8个篮板和4.1次助攻。这些数据使得他的工资在2007/2008赛季达到了全联盟最高:2375万美元。另一方面,在2006/2007赛季中安德森每场平均得6分,6个篮板和0.6次助攻,他要求签订为期6年6000万美元的请求被忽视。罗伯特.霍里,曾经为不同的三支球队,在7次全联盟排名赛中赢得NBA总冠军。他的职业生涯平均每场得7.2分4.9个篮板和2.2次助攻。这位昔日的冠军获得者,在2007年年薪331.5万美元。从上面这些可以看出两个简单的问题。一个是,安德森的请求如果被接受的话是不是过高,第二个是,罗伯特.霍里他为他效力的每一个球队取得冠军,他的薪资是不是过低。

2

工管论文 复杂网络 用来 预测计量 NBA球队 行为

对于第一个问题,的高级作家亨利.艾伯特在他的博客中做出了回答。他写道:得分、篮板、助攻的测量只是当一个球员投篮的一两秒的行动。而其他的时间得分和篮板都没有。他同时还说,这些统计数据说明安德森不是一个好的球员,但事实上他是调整加/减统计后全联盟最好的球员之一。那个加/减统计只是跟踪净变化评分,当一个球员上场或者下场,他不是由像得分、篮板、助攻那样的净数据决定。这表明,安德森可以要求6000万美元的合同。对于安德森的补充,我们看到他最后于骑士队签订合同成功。载安德森受伤之前,他一场均7.8分、8.5个篮板和1.2次助攻的成绩帮助骑士队的由原来的9胜11负变为15胜7负。

对于第二个问题,我们无法给出答案。霍里一共打了14个赛季的比赛,平均和每一支球队每两年就拿到一个总冠军头衔。他是一个幸运的球员总是和发挥最好的球队在一起呢还是他真的就是这个变化的制造者呢?至少有一件事是可以肯定的,那就是简单的统计数据比如得分、篮板、助攻不是评价一个球员或者一支球队成功的唯一指标。虽然统计资料分开处理和球员的个人待遇是否联系在一起不是很清楚,但我们可以从历史中看出,那些球员们能够发挥重要作用,取得好的统计数据通常球队能够取得胜利。

一个研究社会代理人集体行为的可能途径是运用复杂网络理论。复杂网络是由点集,有时称为节点,以及他们之间的连接,叫做边,所组成的集合。复杂网络是一个由大量的点和边遵循某些模式,如成立簇或者高度连接顶点叫中心节点,组成的网络。在一个简单的复杂网络中最多只有数百个节点,人眼就是分析它的合适工具,而在一个复杂的网络中,这种做法是没有用的。因此,要研究复杂网络有必要利用统计分析方法的方式来告诉我们网络的样子。

3

工管论文 复杂网络 用来 预测计量 NBA球队 行为

这项工作的目标是以NBA建立一个复杂网络模型,并根据网络的发展特性预测NBA球队的行为。这些指标要考虑到球员与球队之间的社会和工作的关系,以及能够预测一个球队取得成功的非框评数据。在展现这些指标之前,我们应该先指出那些在NBA历史上和在他所在的球队取得了重大影响意义的球员,如果我们只是基于那些分数统计数据的话。然后,我们研究NBA复杂网络中,理解随着时间推移,球员之间的关系发展的特点这个方向的特征。最后,我们展现并比较预测成功的球队的发展指标。

本文下面的安排如下。第2节介绍了复杂网络相关的工作。第3节中,我们展示方块评分统计只对联盟中的一小部分球员发挥了重要作用。第4 节介绍了一个NBA复杂网络模型。第5节中,我们运用复杂网络模型来对球队行为的预测进行讨论和评价。最后,第6节,总结和展望。

2. 复杂网络相关工作

随着人们对复杂网络的研究越来越有兴趣,已经获得了大量的真实数据记录,并在一些生物、社会、技术和通信领域存在着很好的运用。米尔格拉姆提出的“六度分离”理论和小世界现象是这个领域最热门的研究之一。其他的相关研究中,复杂网络调查是众所周知的,如因特网、世界万维网、在线社交服务网络、科学协作网、食物网、电力网、航线网、和铁路网。

从复杂网络的角度出发,一个体育联盟内的球员之间存在的关系的分析,已经在文学作品中有所展示。奥闹蒂和德卡斯特罗队1971年至2002年巴西全国足4

工管论文 复杂网络 用来 预测计量 NBA球队 行为

球锦标赛进行了统计分析。从复杂网络分析中,奥闹蒂和德卡斯特罗发现了一些其他的有趣结果,那就是随着时间的推移,球员之间的联系增加了,而这个集群系数却下降了。作者认为,导致这一现象的可能原因是离开巴西的球员的增加,国际球队间的球员交易越来越多,最后导致球员的职业生涯时间的增加。此外,还发现,随着时间的推移,这是一种好的现象,这表明在大多数情况下,选手之间的交流在不同的球对之间是差不多的。

最后,对在美国和英国的5个主要体育联盟的全部体育比赛,工作提出了量化统计分析的可预见性。为了展现游戏的可预测性,作者提出了“爆冷频率”(即弱胜强的概率)。篮球的爆冷频率低,这使得我们要通过篮球联赛数据库来找出模型对球队行为的预测。

3. 动机

在NBA进行的每一场比赛,都会产生大量的统计数据。这导致了一个丰富的历史资料库的存在,促使我们去发现隐含的信息。我们在这里所使用的NBA数据就是引用于篮球数据库网站,画报体育杂志就是被引用的最好的篮球参考网站。该网站的文本文献提供了从1946年到2006年之间的所有的NBA统计数据。在这些数据中,包括季节赛和职业联赛现有的3736个球员和97支球队的资料。我们的目标是从只写数据资料通过平常的数据记录发现那些方块评分统计所没有发现的新的信息。对这些数据分析是为了表明我们发现了比方块评分统计更好的评测方法。

5

工管论文 复杂网络 用来 预测计量 NBA球队 行为

在NBA,球员是根据各种方块评分统计来评价的。主要是球员在一场比赛中的得分、篮板和助攻次数记录。图1显示了球员在NBA职业生涯中的得分、篮板和助攻的分布情况。我们注意到,这些分布遵循冥率分布。这意味着在这个游戏历史上大多数曾经打过比赛或还在打比赛的球员只贡献很少的得分、篮板和助攻数据。此外,大多数的得分、篮板和助攻记录都只属于很少的一部分球员。图1表明,99%以上的球员相对于他的中段价值都只有很少的得分、篮板和助攻。有很重要的一点值得一提的是有的球员在其职业生涯中都没有他的得分、篮板和助攻评价。他们很可能是球员与球队签订了合同而在比赛上却没有让其上场,没有在NBA赛场上发挥作用。因此,这些球员对应的点在途1所示的冥率曲线上没有显示,所以他们不被认为是NBA球员。

图1:NBA球员的得分、篮板和助攻分布。

从方块评分统计中,我们还分析了球员每场比赛的平均表现。这个结果显示了在图1中没有显示的一些球员在几年内有着显著表现然后退役的信息。图2显示了球员在其NBA职业生涯中的效率分布。在这个工作中,我们定义的一个球员的效率是在这一期间他的得分、篮板和助攻的数量与总的数量的比值。在图2中的垂直线显示了中程和90百分位的分布。我们再次看到90%以上的球员在其职业生涯重效率低于中档的效率价值。

6

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图2:NBA中球员效率分布图

图1和图2使得我们认为从框评分统计分析来看只有少数几个球员在球队中有很大的作用。此外,如果我们认为框评分统计数字是预测一支球队成功的唯一方法,那么我们的分析就限制在了一小部分球员之内。图3就说明了这一点。它显示出一个球员从一支球队到另一支球队时他的平均排名会随着球员的标准偏差而增加。这个排名rty是一个表示在y年比球队t的表现糟糕的球队数。排名增益gm表明一支球队球员的离开和失去的数目tlost以及加入的球员的数目tin和交易数

y 1y-1y(rty r) (r r)目m。排名增益gm是由交易值m定义为:。这个数据tttininoutout

y 1y-1y(rty r)(r r)显示的是赢得交易的数量,而是输了交易数tlost。排名获得ttttinininoutout

的高价值表明,球队球员的离去会降低它的表现,而球员的加入则能对球队的表现有提升作用。如果增益值为0,那么就没有什么变化。我们观察图3,可以发现,排名增益基于球员效率是没有任何规则的,也就是说,所有的效率值都低于40的球的平均涨幅为0。效率值高于40,我们不能有任何排定。涉及球员的交易数量对效率值高于40的影响不明显,在NBA历史上也只有20个。

7

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图3:一场交易的平均排名增益

总之,我们已经看到,大多数球员比不对方块评分统计有助益;他们战士的价值与平均数没有什么不同。我们还看到,当只涉及球员效率时,所涉及的球队行为不遵循任何规则的交易影响。这表明,一个球队的成功不直接依赖于所签订的球员的效率。因此,在下一节我们将探索这个由球员和球队所形成的NBA复杂网络。这个复杂网络使我们能够制定出新的模型来预测团队成功。

4. NBA复杂网络

为了弄清这方面分析发展的认识,我们需要简单的解释一下NBA的历史。NBA成立于1946年,那时叫做篮球协会(BBA)并且有11支球队。在此之前,美国男篮甲A联赛和全国男篮甲A联赛早就尝试过建立职业篮球联赛。BBA是试图以大城市为主要舞台的第一个联盟。BBA是在1949年称为全国篮球协会的,当BBA与NBL合并后,特许经营权扩大到17。从1950年到1966年,NBA发起了一个减少团队的进程,并于1951年达到了它的最小尺寸,拥有8项特权。从此时起,我们把这段时间称之为PINI。从1966年到1975

年,开始了一个与前段8

工管论文 复杂网络 用来 预测计量 NBA球队 行为

时间相反的进程,NBA的经营特权有1966年的10项增加到1975年的18项。在此期间,联盟面临着ABA的威胁,ABA叫做美国篮球协会,成立于1967年拥有11项特许经营权,并成功的签约了一些篮坛巨星,比如欧文。ABA并没能够持续太久,在1976年两个联盟达成了解决协议,ABA转让了另外的4项专营权给NBA,使得NBA的专营权达到了22项。我们将1967年到1975年这段ABA存在的时间称之为PABA。从1976年到2006年,NBA的球队数量一直保持着增长,并且在2006年,NBA的专项经营权达到了30项。从此时起,我们将这段时间称之为PNBA。表一总结了NBA在这段时间的表现。三个时期的时间演化图形形成了两个互相垂直的线。

表1:NBA的历史时期

为了确认表1中的使其相关性,并帮助我们理解随着时间的推移NBA的历史演变,我们绘制了图4关于每年球员交易和现役球员数量。我们首先观察现役球员数量和球员交易增长数量这些因素之间的高度相关性(即相关系数为0.908)。我们也注意到存在着三个迥然不同的行为,在的三个时期代表了独特的特点,如表1所描述。

9

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图4:现役球员和每年交易球员数

这项工作地另外一个目标是研究NBA的演化像一个复杂网络模型一样。我们构建两个网络,NBA年度网络和NBA历史网络,建立方式如下,设定球员集合P,设定球队集合T,把他们连接在一起构成点集V。这样,就存在两种不同的节点:球员节点和球队节点。每个网络都因为每个y值的不同有不同的配置。在y年的NBA年度网络的顶点只包含在y年时在参加联赛的球员和球队。另一方面,在y年的NBA历史网络中包含的节点为在y年以前的联赛中的球员和球对。在这两个网络中,如果两个节点之间存在牢固的关系,那么这两个节点之间就有边连接。如果在y年或者y年以前球员节点p为球队节点t效力过,那么球员节点p和球队节点t之间就存在相互连接的边。如果两个球员在y年或y年以前曾共同效力于同一支球队,那么这两个球员节点之间有连接的边。显然任何两支球队之间都没有边连接。

我们分析的第一个复杂网络度量就是每一个球员节点的度分布p P,这在图5-a中有作说明。这表明显示出度分布呈指数衰减。图5-b显示在NBA年度网络中,平均节点度和最大节点度的发展水平。我们观察图5,发现在NBA球员节点度有一个重大变化。我们还发现,在NBA

网络中平均度和最大节点度与球员交易10

工管论文 复杂网络 用来 预测计量 NBA球队 行为

数量直接相关,如图4所示一样(即相关系数分别为0.92和0.93),在PINI期间具有最低的价值。

图5:球员节点度

聚类系数ci与顶点i相连接的各个顶点之间的联系相关。它测量的是与节点i相连的两个节点相互连接的概率。网络的聚类系数是节点聚类系数的平均值ci, i V。图6-a显示了NBA历史网络的聚类系数发展状况,最低的聚类系数ci, i V,并且NBA网络的这个聚类系数与ER随机网络相当。ER随机网络是由Erdos-Renyi提出的模型,生车一个具有相同节点、边和度分布的随机图。我们观察NBA的聚类系数,平均而言,要比ER

随机图的聚类系数要高一个数量级。我

11

工管论文 复杂网络 用来 预测计量 NBA球队 行为

们还看到NBA网络的聚类系数与最低聚类系数具有显著性的差异,这表明顶点网络的聚类系数具有高变异性。

一个重要的网络科学结构是小世界网络。它的特点是与一个与之相当的ER随机网络相比,它具有较高的聚类系数和较小的平均路径长度。图6-a显示了

NBA历史网络平均路径长度的演变相对于ER随机网络平均路径长度的演变比较。我们观察到NBA网络平均路径长度只在PNBA期间是稳定的,那时球员数量和交易数量一直保持增长。在此期间,NBA网络的平均路径和ER随机网络的平均路径基本上差不多。高聚类系数,小的平均路径长度,使得NBA网络特征就像一个小世界网络。作为实际效果,NBA球员之间的路径长度很短意味着新的篮球战术就像商业惯例一样将在NBA球员之间很快的传播开来。

图6:NBA就是一个小世界网络

12

工管论文 复杂网络 用来 预测计量 NBA球队 行为

总之,我们已经看到,节点在网络中的度和聚类系数存在着很大的变化。我们同时也看到了一些与现役球员数量高度相关的因素,如球员交易的数量以及节点的度。最后,我们已经看到,NBA网络是一个小世界的网络模型。在下一节,我们将展示如何应用这方面的知识构建模型,对球队行为进行预测。

5. 预测技术

5.1 评价指标

在分析不同的预测模型之前,我们先介绍我们的方法。每个模型为y年每个队t计算出一个预测因子 t。在这之后,我们对球队t在y年的预测因子y

y

t与y年该球队的排名是否存在联系进行确认。这个排名rty是一个从0到100的数字显示球队的百分比情况就是指在y年比球队t表现更差的。为了这个相关性的计算,我们要用到两个相关系数,即pearman’s b和Kendall Tb这两个相关系数。我们运用平均等级相关系数来衡量预测因子 t的价值和每一年y

的分析排名rty两者之间的联系。

核实这个关系以后,我们在确认是否对给定的模型选择成功的球队。球队t1代表最高价值(或者最低价值,取决于标准模型)的预测因子 t是y年可能

成功的球队所选择的模式。 的价值差异根据每一个模型的数据。经过挑选,我们看一下我们的数据库并核实在y年球队t1的排名。模型选择的球队t1的排名越高,这个模型就越好。另一个被用来衡量模式的成功与否的指标是偏斜,偏斜yy

13

工管论文 复杂网络 用来 预测计量 NBA球队 行为

是衡量等级分布的不对称程度的值。如果左尾分布比右尾分布更为明显,那么分布就产生了偏差。这个偏差越大,那么这个模型就越好,因为它集中发生在高排名的价值中。

5.2 5效率模型和1效率模型

我们先从简单的预测模型开始。5效率模型是完全基于框评分统计。5效率模型是一个非常简单的模型,包括计算给定的一支球队在过去的一年5个效率最高的球员的平均值。这个平均值是 t在y年球队t的价值,并且球队的最高价

值的 t是一个选定的模式。我们期望这个给定的球队球员的效率越高,这个

球队的表现越好。

图7显示了这个模型的审定。图7-a显示了在y年球队t的预测因子 tyyy

和球队的排名rty之间的两个相关系数 b和Tb。我们注意到,从PABA时期后开始,呈现出一种正相关的趋势。我们看到,在PNBA的后半段更显现出相关性。平均相关系数分别是 b0.15和Tb0.10。

图7-b显示了模型中选定的一个级别中的一支球队的次数。球队的排名为70备选定位11。也就是说,有11支球队的排名不低于70并且低于80.这个分布的偏态值为-0.35,这表明该模型选择的球队中排名高于50的比排名低于50的球队要多。观察这个分布,我们看到它非常正常,该模型选定的球队有34%排名低于50,34%的球队的排名高于80,并且选定的球队中有7%是真正的最好的球队。

14

工管论文 复杂网络 用来 预测计量 NBA球队 行为

我们已经看到,在框评分统计中,只有一小部分球员的统计数据对整个球队的成功产生了重大的影响。因此,现在我们来展示1效率模型,将y-1年t球队内具有最高效率价值的一个球员的价值设置为 t,限制了一小部分现役球员

的预测。图8-a显示了在y年t球队的预测因子 t与这一年里这支球队的排名

两者之间的联系。我们观察认为这个模型比5效率模型要好。平均系数分别为 b0.23和Tb0.16,这显示出一支球队的成功与最高效率球员的相关系数要比5个球

员的相关系数要大得多。我们同时看到,在20世纪80年代中期以后这个相关性更高了。这表明,在这期间,比此前的其他时期最高效率球员在球队具有更大的影响。这一时期恰逢几个高水平的球员出现在当时的联盟,像迈克尔.乔丹、麦杰克.约翰逊、内瑞.伯德和伊赛亚.托马斯。 yy

图7:5效率模型

15

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图8:1效率模型

图8-b显示1效率模型选定一个级别的一支球队的次数。这个分布的偏差为-0.82,显示出的偏差值比5效率模型的偏差值要高得多,一效率模型选择的球队比5效率模型选择的球队的排名要高,所选择的球队中,只有27%的球队排名低于50,而59%的球队排名都高于80,而且有25%的球队就是真正的最好的球队。在图8-b我们展示了每年1效率模型的排名情况。

值得注意的是,一小部分球员可以对一个球队的表象可以产生重大的影响。这些可能是NBA网络的小世界特性的后果,当新的篮球战术或者技巧产生后会迅速在NBA球员之间传播,使其更加协调。这看起来似乎不大可能,新的战术或技

巧对一支球队的表现有重大影响,因为差不多每个球员都知道它如何运作和如何16

工管论文 复杂网络 用来 预测计量 NBA球队 行为

在联赛中运用它们。然而,当新的战术或技术有人提出来后,它们不可能被球员平均的复制过去,这使得拥有天赋的球员与一般的球员之间的差距进一步的拉大。

5.3 循环模式

这个循环模式是完全基于NBA复杂网络指标的,而与框评分统计无关。这个循环模式是基于NBA历史网络中代表球队的节点的聚类系数提出的。一支球队拥有高的聚类系数,那么可能是这支球队有新球员的加入或者这支球队没有频繁的球员交易。另一方面,一个球队又很低的聚类系数,那么很有可能这支球队存在大量的球员交易现象,大多数时候,提升球队表现的球员都一直保持在册。这个预测因子 t是y年代表t球队的节点的聚类系数与y年最高聚类系数球队的

比值。

图9-a展现出了y年t球队的预测因子 t与概念此球队的排名的相互联系。

我们看到,很多年的记录显示球队的聚类系数和球队的排名呈现出负相关的联系。图9-b显示出这个模型选择一个级别内一支球队的次数。正如我们观察的那样,这种模式非常糟糕,平均相关系数分别为 b-0.12和Tb-0.09。它们都比前面的模型显示的相关系数要低得多,并且在这个模型选择的球队中有47%的球队排名都低于50,仅有15%的球队排名在80以上,只有3%的概率选中的球队就是最好的。 yy

17

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图9:循环模型

5.4 度模型

第二个以网络为基础的模型是度模型。它是基于NBA年度网络中的球员的度值生成的。一个拥有很高的度值的球员可能是到了他的职业生涯的最后,或者是该球员频繁的换球队,也就是他没能在一个球队保持很久。另一方面,一个球员的度值很低的时候为一个球员职业生涯的开始阶段,或者是这个球员从来都不更换球队或很少更换,也就是说,他一直保持在一支球队的名册上。在y年球队t的预测因子 t是指与球队t相关的球员的所有的度值的总和除以在y

年拥有y

18

工管论文 复杂网络 用来 预测计量 NBA球队 行为

最大度值的球队的度的值。这样的话,我们期望 t值越小的球队,有更好的

表现。

图10-a展现了y年球队t的预测因子 t与概念此球队的排名之间的关系。

我们可以看出,球队相关球员的度值总和与球队排名呈现出明显的负相关。平均相关系数分别为 b-0.35和Tb-0.27,显示出这个模型是以上介绍的模型中相关度

最好的。在途10-b中,我们展示出了在度模型中选择一个级别的球队次数。我们看到,在度模型中的这种情况与1效率模型有些类似,具有相同的分布偏差,31%的备选概率球队排名在50以下,61%的概率,球队排名高于80,有36%的概率所选球队就是最好的球队,也就是说,这种模式下选择的球队有超过1/3的概率就是最好的球队。这是一个有重要意义的结果,而且它不依赖与框评分统计数据。同时,很重要的一点是在20世纪80年代中期以前模型的效果更好。这一观察结果跟事实相符,在20世纪80年代以后的这一段时期内一些非常有天赋的球员与度分布的逻辑不相符。

yy

19

工管论文 复杂网络 用来 预测计量 NBA球队 行为

图10:度模型

5.5 混合模式

在这一节,为了获得更好的效果,我们结合前面几节的模型。首先我们尝试将循环模型和度模型进行结合称为循环-度模型。这个模型的预测因子产生于循环模型和度模型的预测因子 t。我们观察图11-a,这个模型展现出的相关系行

为略高于度模型。这个模型显示出的相关系数分别为 b-0.39和Tb-0.29,是迄今为止最高的。这个模型还显示出其在球队选择上的更好结果。在途11-b中,我们看到,其分布偏差是迄今为止最小的,-1.16,22%

的概率所选球队排名低于20 y

工管论文 复杂网络 用来 预测计量 NBA球队 行为

50,68%的概率球队排名高于80,31%的概率所选球队就是最好的球队。这是一个令人映像深刻的结果,而且这个模型只依赖于NBA复杂网络描述,而与框评分统计毫不相关。现在我们结合循环模型、度模型和1效率模型组成循环-度-效率模型来获得更好的结果。这个模型的预测因子 t由循环-度模型和逆1效率

模型共同产生,因为这些模型的相关性有相反的现象。这个模型是目前为止最好的。我们观察图12-a发现这个模型展示出的相关性较前几个模型更强。其平均相关系数分别为 b-0.41和Tb-0.30,比前面的模型具有更显著的相关性。同样的,

在图12-b中,我们看到这个模型分布具有最小的偏差,仅-1.21。它同时减小了所选球队排名低于50的概率,提高了排名高于80的概率,排名低于50的概率仅19%,68%的概率所选球队排名高于80,有29%的可能所选球队就是最好的球队。

最后,我们修改出的循环-度-效率模型是相对于单一模式来说的最好模型。循环-度模型在20世纪80年代中期以前更好,而1效率模型则在之后得到更好的应用。这样的话,我们将循环-度模型产生的预测因子 t只应用于20世纪

80年代以前,而之后的则运用1效率模型的预测因子。图13显示出了这个模式下选择的球队的排名分布。我们观察发现这个模型展现出了最好的结果,正如我们所预期的那样。平均相关系数分别为 b-0.45和Tb-0.34,在这个模型中,有46%的概率,所选择的球队就是最好的球队。这显然是有所偏颇的,但从此我们显示出,这些导致我们改进预测模型的门就像篮球运动员通常所说的那样,全开放。

结果表明:在这节预测一支球队的成功是基于复杂网络和框评分统计数据的。我们也评估预测球队在联赛中失利的模型,其结果几乎是一样的。这表明,这个模型不但可以预测球队在联赛中的成功,同时也可以预测出在联赛中失败的球队。

21 yy

本文来源:https://www.bwwdw.com/article/rn54.html

Top