虚高还是实力?从数据看足球运动员身价

  足球是如今当之无愧的第一运动,它所带来的商业价值是其他运动远远不能比拟的。欧洲五大联赛(英超、德甲、西甲、意甲和法甲)是世界上最高水平的足球联赛,几乎所有最高水平的足球运动员都云集在这里,诞生了像C罗和梅西这样的天王巨星,具有极其高的竞技水平和商业价值。近些年来,越来越多的资本家看到了足球的价值,无论是中东土豪,或是中国商人,开始纷纷涌入,大量资本开始进入到足球世界。这就使得球员转会费水涨船高,优秀足球运动员的身价一路飙升。

  在这些大资本家中,以法甲球队巴黎圣日耳曼的土豪金主卡塔尔王储为首,一掷千金,为球员开出了天价转会费,希望以巨星效应带来的流量,拉动经济利益,推广球队品牌,扩大自己商业市场,他们以2.2亿英镑的天价转会费,将巴西头牌内马尔从巴塞罗那带到了巴黎王子公园球场;接着又是豪砸1.35亿英镑,从摩纳哥买来了当红辣子鸡姆巴佩,开启了足坛转会费暴涨的金元足球时代。所谓转会费,是球员转入球队对转出球队进行的经济补偿;而身价则是专业足球转会网站对球员价值的一个评估;转会费与身价在政治经济学上讲即是价格与价值的关系,理论上来讲,价格应该围绕价值上下波动。但是近年来,天价转会费频频出现,转会费与身价严重脱节的现象比比皆是,足球市场泡沫巨大;这些资本虽然推动了足球运动的发展,但是也带了许多弊端。

  这一系列的天价转会费,导致了球员市场严重通货膨胀,被强行挖角的俱乐部手头握有大量现金,而他们又必将这些大量现金再次投入转会市场,购买原来球员的替代品。在卖方市场知道买方有大量资金而且有紧急需求的情况下,往往卖方会狠狠地“敲竹杠”。以此恶性循环下去,出现的多米诺骨牌效应严重影响了转会市场的正常交易,大大抬高了现有转会市场的物价水平,使得有钱的大型俱乐部和拮据的中小俱乐部两极分化日益严重,更容易导致中小俱乐部出现财政状况不良甚至破产的情况。除此之外,由于这些土豪俱乐部的强行挖角,中小俱乐部越来越难以留住自己的核心球员,从而丧失了竞争力,也使得个别联赛出现了冠军垄断、一家独大、竞技水平下降的不良现象(例如法甲)。

  以现今足坛转会费Top10为例(如表格1中所示),让我们来窥探一下如今转会市场的风头——还记得在2013年时,曾让世人震惊的热刺边锋加雷斯贝尔以1.01亿英镑转会皇马堪称天价,跻身足坛转会费历史第一人。然而时间仅仅过去了六年,当年的天价转会费如今却只能刚好勉强跻身Top10,让人唏嘘不已。这些转会费过亿的明星球员真的值这么多钱吗?在这前十榜单中,像内马尔、格列兹曼、博格巴以及阿扎尔均是属于已经在足坛证明了自己实力的明星球员,他们的转会费自然也高,在新东家的表现也能对得起这份高昂的转会费;像登贝莱、姆巴佩乃至是菲利克斯,他们仅仅是年轻的希望之星,还没有证明自己的实力,只能算是一张高级的“彩票”;库蒂尼奥和贝尔,这两位从英伦登陆西甲的球星,则没有打出自己的身价,他们在仅仅高光了一段时间后,便陷入沉沦,甚至沦为球队工资帽下的毒瘤。因此,球队经理在砸下巨资操作转会时,仍要加以甄别,并不是说,贵的东西除了贵就没有别的坏处了。

  而对于转会费低廉的球员,也并非是“便宜没好货”。相比于这些土豪俱乐部,有一些俱乐部被称为“黑店”,这些俱乐部精明老练的经理人有着一双火眼金睛,低买高卖,为球队博得巨大利润。例如德甲球队多特蒙德,当年他们仅以800万英镑左右的价格从曼城购入球员桑乔,而桑乔在这个赛季大爆发,贡献出了进球助攻均上双的两双数据,身价飙升至一亿英镑左右。对于这些没有经济实力来实施巨星政策的中小俱乐部来说,如何做到花小钱办大事,是他们所需要思考的问题。他们往往从大量比赛数据和比赛录像入手,配合实地考察,从更小的俱乐部挖掘出他们认为有着巨大潜力的年轻球员。

  因此,从以上分析可以看到,对于球队经理人,如何通过现有的数据资料来对球员身价进行评估,是他们所关心的问题。换言之,究竟有哪一些因素会影响球员的身价?而这些因素的影响效果又是如何呢?本文将从网上爬取的大量数据入手,通过足球运动员的各项特征,例如国籍、惯用脚、年龄、球员能力等指标,建立回归模型,对影响球员身价的因素进行探究。本文也力求做到像这些“黑店”经理人一样“慧眼识珠”,找到身价与转会费不匹配的原因,评估球员转会费的合理区间,分析出哪些球员可能是值得购入的潜力股,而哪些球员可能会成为球队毒瘤的未来水货,为足球俱乐部提供具有参考价值的意见。

  本案例从德国转会市场和足彩网站取了2018-2019赛季,欧洲五大联赛(英超、德甲、西甲、意甲、法甲)中2358名球员的33个变量指标,其中因变量为球员身价,自变量分为球员基本信息和球员比赛数据两个维度,变量详细说明如表2所示:

  根据获取的数据可以发现,球员身价的跨度较大,其分布呈一个极度右偏分布(如图1所示)。球员身价的中位数仅有540万英镑,而身价最高的姆巴佩达到了1.8亿英镑。五大联赛中大部分球员的身价在1500万英镑以下,这些球员是联赛中默默无闻的“绿叶球员”;而那些身价高昂的球员是联赛中的凤毛麟角,他们处于这个金字塔型分布的顶端。究竟是哪些因素使得球员的身价差别如此之大呢?接下来,我们将从数据入手进行分析。

  首先分析五大联赛中球员身价的差别:在五大联赛中,英超是当之无愧的第一联赛,它的商业价值、竞技水平和观赏性均远超于另外四大联赛。而从球员身价上来讲,同样如此。英超联赛的球员平均身价高达1623万英镑、总身价高达74亿英镑均甩出了第二名西甲联赛一大截。

  由于五大联赛均有针对非欧盟球员的限制政策,因此将这些球员的国籍分为了欧盟球员和非欧盟球员。在西甲、德甲、意甲联赛中,各队的非欧球员被限定在了四人;而英超对于非欧盟球员,则有更为严格的劳工证政策,这样就使得能够在这四大联赛踢上球的非欧球员成为了凤毛麟角,他们的能力和身价自然也要高出欧盟“户口本”球员;但法甲由于有大量非洲前法国殖民地地区球员,这些非洲球员为了获得欧盟护照,往往先选择加盟法甲,导致法甲非欧球员身价较低。

  球队若是冠军球队,所属球员身价必定更高;而若是保级队,身价也理应更低。这里爬取了这些球队的世界排名作为参考,根据各个世界排名区间,作出身价分布的箱线所示。可以看到,世界排名靠前的球队,球员身价普遍更高,排名在前25的球队虽然身价的中位数不是最高的,但是均值大幅高于排名靠后的球队;而排名靠后的球队,球员身价基本不超过2000万。

  年龄因素也是影响球员身价的一个重要因素。将球员年龄进行划分,从各个年龄段球员身价来看,如图7所示,25-28岁是球员的黄金年龄,在这个阶段的球员平均身价达到了顶峰;而大概将28岁作为一个分水岭,在这之前为成长期,球员身价随着年龄的增长而上涨;这以后则开始步入下滑期,球员身价随着年龄增长而下跌。

  曼朱基奇出生于1986年,在28岁以前他的身价一路飙升;2014年时,即他在28岁时达到身价的巅峰3000万英镑;而在2015年离开拜仁之后,他的身价略微有所下滑。大多数球员的身价走势和他一样,以28岁左右作为一个分水岭。

  对于一个球队而言,他们往往会给自己的核心球员奉上一份长约,以保证球队的战术打法具有一定的稳定性,自然身价也不菲;而那些自由球员,则往往是球队的弃儿,身价自然会暴跌。可以看到,那些和球队签下了5年以上长约的球员平均身价高达3593万英镑,而自由球员的平均身价仅仅只有485万英镑,还不及长约球员的零头。

  中前场球员身价高于后场球员。在当今足坛,身价top10均无一例外是中前场球员:刚满20岁的小将姆巴佩高居前锋球员的榜首,身价高达1.8亿英镑;中场球员中,内马尔独占鳌头,身价达1.62亿,内马尔和姆巴佩这一对巴黎双星分别占据了中前场的头名;而对于后场球员,后卫中身价最高的范戴克,尽管他在去年一年中打出了超神的表现,他的身价仍只有8100万英镑,仅有内马尔的一半;门将则更为寒酸,奥布拉克、特尔施特根和阿利松并列身价第一,达7200万英镑。图10分别展示了各个位置球员身价的箱线图以及各位置球员的最高身价:

  如图11所示,在这些球员当中,惯用脚为右脚的球员最多,他们的平均身价为1144万英镑;而能够左右开弓的双脚球员,身价则要高出许多,他们的平均身价达到了1890万英镑,这些球员拥有更佳的平衡性和更为丰富的进攻手段,他们的身价自然要高。

  比赛数据“好看”,是指这个球员在比赛中关键数据非常出色,另一方面来讲,也就是这名球员在比赛中表现突出。本文获取了球员进攻、防守和传球三个维度的比赛数据,根据相关系数图可以发现,这些变量之间具有较强的相关关系,因此考虑对这些指标进行主成分降维处理。而在这些指标当中,与身价的正相关性较强的指标有进球数、射门数、射正数、关键传球、助攻数、长传数、带球摆脱次数这些指标。

  如图12所示,这些指标之间有着极强的线性关系;利用主成分的方法,提取前两个主成分,解释比达到了68%,得到主成分的因子载荷矩阵如表3所示:

  主成分1主要包括了射正、射门、偷球等指标,我们将它命名为球员进攻能力因子;而主成分2主要包括了解围、拦截等指标,将其命名为球员防守能力指标。图13展示了球员身价随着主成分得分上升的均值柱状图。自然,能力越高的球员身价越高,球员身价随着主成分1和主成分2的增加而增加,且身价随主成分1上升的趋势非线得分越高,身价上涨越快。

  接下来我们将进一步建立回归模型,衡量这些因素的影响效果,为球队甄别哪些球员可能是水货,而哪些球员拥有巨大的潜力,为球队转会操作提供建设性意见。

  根据计算得到的主成分1(PCA1)和主成分2(PCA2),以及球员惯用脚、是否为欧盟、年龄、合同剩余时间、位置、联赛、球队世界排名这9个自变量,对因变量球员身价进行回归建模。1

  在进行初步回归建模后,对模型进行调整。本案例的建模分为三个步骤层层推进:

  (2)考虑到进球和助攻数对于球员身价的极大影响,将这两个变量从主成分中单独提出来进行回归;而年龄因素对于球员身价的影响是非线性的,随着年龄的增加,球员身价先增后减,故加入(年龄-28)^2项进行回归;考虑到联赛与是否为欧盟国家的交互影响,加入二者的交互项进行回归;

  (3)使用AIC对模型进行变量选择,选取AIC最小的模型。得到参数估计如表格4所示:

  绘制残差的QQ图如图14-左下所示,该图形几乎分布在同一条直线上,故通过正态性检验。

  cook距离图如图14-右下所示,没有大量高杠杆值的点,cook距离图表现良好。

  (1)对于球员比赛数据,将进球数单独作为一个因变量后,PCA1、PCA2和进球数对于身价的影响是显著的,与身价均成正相关:PCA每增加1,身价平均提升3%;PCA2每增加1,身价平均提升5%;进球数每增加一个,身价平均增加5%。

  (2)(年龄-28)^2对于身价的影响显著,参数估计值为-0.01,球员年龄离28岁越远,球员身价越低;28岁时为球员的巅峰时期。

  (3)对于球员场上位置,四个位置球员的身价没有显著差异,守门员的身价略高;这一点似乎与先前的描述分析相悖。但是换一个角度,若一个守门员与一个其他位置球员身价相同的情况下,守门员的主成分得分小于其他位置球员。这是由于球员的比赛数据没有专门统计守门员数据,例如扑救等,导致守门员的主成分得分普遍偏低。

  (4)对于五大联赛,以英超联赛作为基准组,英超联赛球员身价最高。西甲联赛球员平均身价最低,仅有英超联赛的45%。

  (5)合同剩余时间越久的球员身价估计值越高,剩余合约时间每增加一年,球员身价平均上升27%。

  (6)对于球员所在球队世界排名,所属球队排名越靠前,球员身价越高;在其他因素不变的情况下,世界排名每往后一名,球员身价平均下降1%。

  (7)是否为欧盟球员在AIC变量选择时被删除掉,可以说该变量对于球员身价的影响并不是特别重要。

  将球员在德国转会市场上的参考身价和回归模型预测的身价进行对比,将预估身价与德转身价的比值作为指标,来衡量球员是否被高估或者低估,选取德转身价在2000万英镑以上的球员进行分析:

  在表格5这份球员“红榜”中,热刺球员小卢卡斯高居榜首,这也得益于上赛季小卢卡斯在欧冠中的抢眼表现,他在逆转阿贾克斯的半决赛中发挥出色,在热刺当家球星哈里凯恩却真的情况下,可以说是扛着球队进了决赛;第二名的沙奇里来自欧冠冠军利物浦,他低价从降级的斯托克城投奔利物浦,屡屡担当替补奇兵的角色,对曼联的关键比赛梅开二度,身价自然有所上涨。这些球员所属球队大多在上赛季表现不错,这些球员打出了高出自己身价的超长表现。

  而另外一些球员则没有那么幸运,他们要么饱受伤病困扰,要么球队整体表现不佳,不幸被列入了“黑榜”:

  在表格6这份“黑榜”中不幸高居榜首的,是在今年夏天刚以6000万英镑价格从多特蒙德转会到切尔西的普里希奇,这位美国小将在上赛季饱受伤病困扰,与同位置球员的竞争处于下风,没有发挥出预期表现,切尔西这般操作颇有被多特蒙德敲竹杠的感觉;第二名维尼修斯在被皇马引进时,被当作是C罗的接班人,而他在齐达内二进宫之后,出场次数越来越少,也没有打出预期的表现。这些黑榜中的球员一部分比较年轻,缺乏稳定性,是球队在转会操作时需要密切注意的。

  最后,对于这个夏天颇受关注的几名球员进行分析:与皇马巴萨深陷转会传闻的内马尔,当年以2.22亿的天价转会巴黎圣日耳曼,可在上赛季,他因伤病困扰,仅出场15场,且球场外风波不断,球队在欧战也未能更进一步,导致他的预估身价大幅低于他的转会费,仅有7000万英镑,渴望购入内马尔的俱乐部需要谨慎考虑;与内马尔相似的,还有库蒂尼奥,当年1.45亿转会的他,德转身价如今只有8000万,而预估身价更是只有2330万英镑,可谓是严重缩水,最近有消息称,巴萨将用他加上现金交易内马尔,不知道这笔交易究竟算不算止损呢?

  而中国球迷关心的西班牙人队中国前锋武磊,德转身价仅315万英镑,但由于上赛季的出色发挥,他的预估身价达到了715万英镑,可以说,武磊的留洋生涯前景十分光明;但是同样是亚洲球星,热刺前锋孙兴民德转身价4500万,预估身价更是高达6650万,跻身Top10球员行列,仍然是武磊需要学习的。

  当然,在俱乐部实际进行转会操作时,也不应该仅仅拿着数据纸上谈兵,应该从更为广泛的角度来考虑,比如俱乐部的财政状况、球员背后的市场(比如武磊身后巨大的中国市场)、球员对于球队战术的契合程度。这些因素有着更为复杂的衡量方式,因此对于球员身价的预测还有着巨大的提升空间。

Leave a Reply

您的电子邮箱地址不会被公开。 必填项已用*标注

Related Post