昨天写了一篇邓利维上任后是如何尝试再次构建争冠阵容的文章,有很多朋友对其中使用的赛季贡献估值数据有好奇和质疑,今天这边文章与大家分享我是如何计算球员单赛季的贡献估值的,同时与大家分享我是如何看待高阶影响力数据和一体化数据的。
一.常规赛贡献估值原理
首先是我目前使用的估值模型,最开始的启发源自于微博“篮圈即是原点”每年做的球员评分和排名,在球员卡里会附注一名球员过去几个赛季的“产出价值”,而这个价值的计算方式为该球员的EPM胜场贡献在该赛季工资帽下的转化价值。我在实际使用这个“产出价值”数据时发现了一个问题,在于中锋位置的EPM价值普遍较高,以至于23赛季EPM值前50的球员里有多达15名球员是中锋,这显然与实际情况是不符合的,因为中锋打到季后赛时往往时间会锐减,如果他真的影响力如此之大又为何会被弃用呢?同时中锋在NBA里拿到的整体薪水往往较低,如果影响力强又为何拿不到高薪呢?
为了解决这个问题,我的思路是将所有球员按照位置来进行分类,分别统计每个位置的EPM贡献和以及每个位置在当赛季拿的薪水和,用总薪水除以总的EPM胜场贡献就能得出该位置每1场胜场贡献值多少的薪水,通过这种方法来修正EPM对中锋位置的潜在高估以及其他位置的潜在低估。这种计算方式出来的结果还能帮助我们了解当下联盟什么位置最值钱、各球队愿意给什么类型的球员高薪。以下图2023年我的统计结果为例:
上图是我个人对于6位置的具体定位,薪水越高意味着该位置越稀缺、好球员越少,越低意味着该位置好球员越多、可替代性越强。目前市场最缺的是会投3分的大个子,但凡有空间属性往往就能拿到不错的薪水,每1场胜场贡献可以拿419万;其次是侧翼和前锋,他们主要在进攻端提供空间、防守端提供换防价值和协防价值,但真正能做到3D兼备的很少;双能卫和控卫相对不值钱的原因是库里崛起让这个位置受到了前所未有的重视,以至于每赛季都有大量后卫球员进入NBA、人才的井喷导致这个位置除了头部的几个人、其它球员都有很强的替代性,这导致该位置整体的薪资水平在下降,因为很容易在市场中找到更便宜的替代品;中锋位置是类似的道理,护框好但不会投3分的中锋有很多,常规赛影响力高但季后赛容易被DNP的中锋同样很多,以至于中锋位置可替代性强,很难拿到高薪。
计算出每个位置的单位贡献对应薪水后,就可以结合EPM胜场数据对每个球员当赛季的表现进行估值了。由于EPM胜场我采用的是常规赛数据,因此得出的结果自然只反映常规赛的价值。比如库里23赛季的EPM胜场贡献为12.2,乘以他双能卫位置每1胜场贡献价值310.6609的薪水,对应库里23赛季的常规赛贡献=12.2*310.6609=3790万元。
用类似的方法我还用LEBRON数据的胜场贡献同样换算成了薪水价值,并且把两个薪水价值进行平均,得出了该名球员本赛季常规赛贡献的评估结果。
也就是说,在我设计的常规赛贡献估值模型里,一名球员的常规赛贡献主要与胜场贡献和位置两个因素有关。而胜场贡献是基于高阶数据(EPM\LEBRON)、出场时间和球队胜场数三个因素综合计算的,也就是说贡献高低与该名球员的单位影响力、出勤率、球队整体胜率、该球员功能的稀缺性有关。记住这一点,就可以对一些看似不合理的现象进行分析了:
二.昨天文章里一些问题的解释
1.为何库里24赛季下滑却比23赛季贡献更大?
答案很简单,就是因为库里24赛季的出勤率比23赛季好很多。若论平均每场的影响力,23赛季库里的EPM值为6.4,其中进攻6.5、防守-0.1,而本赛季库里的EPM值为5.1,其中进攻5.3、防守-0.2;防守端的影响力与23赛季一致、但进攻影响力下滑严重。但从出勤率上看,23赛季库里仅出战56场、场均34.7分钟,而24赛季库里出战74场、场均32.7分钟,出场时间多了24.5%。结合出场时间后,库里23赛季的胜场贡献为12.2场,24赛季则由13.3场。所以常规赛打出的价值高≠他的水平比上赛季高,也可能是出勤率等因素。但是我们更需要关注的是,库里这赛季多打了18场胜场贡献却仅仅增加了1,所以或许让库里在背靠背的比赛中轮休、或体力不支时缺席一两场比赛,大概率对库里在比赛中的整体贡献更有帮助。特别是本赛季库里明显出现体力问题的背景下,在常规赛阶段选择性地放弃几场比赛休息,对老将的帮助很大。
2.梅尔顿38场打出1690万的价值,如果出勤翻一倍就是三千万级别的球员?
要想回答这个问题,首先我们需要知道他的高价值原因是什么、是否能够维持。23赛季梅尔顿EPM值0.9,其中进攻-0.8、防守1.7,而24赛季梅尔顿EPM值高达1.7,其中进攻0.3、防守1.4,可以看到梅尔顿在防守端的影响力依然强悍,但相比于23赛季、24赛季的梅尔顿进攻影响力大大增强。
同样的结论也可以在LEBRON值中观察到:23赛季梅尔顿LEBRON值-0.5,其中进攻-0.9、防守+0.4,最终胜场贡献为2.5场;到了24赛季梅尔顿LEBRON值提升至1,其中进攻0.3、防守0.7,攻防两端皆有提升,尤其是进攻。
也就是说,梅尔顿24赛季在进攻影响力的部分取得了显著的提升,具体来看他在进攻端的助攻率更高、助失比显著提升,这帮助他担任更重的进攻角色的同时还完成的非常出色。另一方面,梅尔顿也打出了夸张的进攻on-off值,他在场时全队的进攻效率要高出8.7,但这个数据受同时出场的队友影响较高。
梅尔顿本赛季搭档得最多的阵容是马克西+梅尔顿+哈里斯+巴图姆+恩比德的五外阵容,该阵容是76人本赛季用得最多的阵容,共计使用219分钟,每百回合要多得33.2分;而上赛季梅尔顿出场最久的阵容为哈登+梅尔顿+哈里斯+塔克+恩比德,出战518分钟,每百回合只多赢7.9分;把他替换成马克西的336分钟,每百回合可赢12.4分,这导致上赛季梅尔顿的进攻on-off值为-0.9。所以我认为梅尔顿本赛季的高进攻影响力更依赖于出场阵容本身的更加合理,能充分发挥他组织串联+拉开空间的属性,后续能否维持得看新赛季融入勇士的具体情况,未必能够维持。
不过好消息是,除新秀赛季和23赛季外,梅尔顿的进攻影响力均为正值,而防守影响力一直是精英水平且波动不大,所以25赛季在没有伤病影响的前提下,个人认为梅尔顿打出2000万以上的常规赛贡献问题不大,但是真要复制上赛季38场的球场影响力,需要勇士体系恢复正常运转。
3.23赛季的普洱出勤高,为何只有900万的价值
23赛季普洱保持全勤,却在常规赛阶段打出了极低的贡献,这似乎与上面库里的结论相矛盾。但事实上,这主要是因为普洱当赛季的防守端表现实在太差,EPM值-0.5、LEBRON值-1.6,以至于出勤累积下他的EPM胜场贡献只有4.2场,LEBRON胜场贡献只有1.3场。防守端的崩盘是他高阶数据如此之低的主要原因,而这种崩盘在本赛季同样延续,高出勤率情况下本赛季普洱EPM胜场贡献1.5、LEBRON胜场贡献0.1,对球队常规赛的帮助连300万都不到……
三.我个人对于数据的理解
随着各种高阶数据的引入和流行,大家对于数据的争议也越来越大,数据无用论和数据至上论都有各自的支持者。我个人对于高阶数据的看法是只要它的产生原理是逻辑解释得通、站得住脚的,那么它就有一定的作用,但是评价一个球员、一支球队绝对不能只用单一的高阶数据,因为任何一个处理过的数据都会损失原始数据的很多信息、从而存在很多缺陷。只有多个数据相互印证同一个观点/结论时,该观点才更能被采信。
此外,在看待数据时不能只看数值大小,而要去探究数据变动背后的原因,是自身的提升?与队伍体系的契合?亦或是小样本下很难维持的好表现?只有正确解读数据,数据本身才有价值,特别是当数据与观感不符合时,更需要关注原因是什么、哪个环节出了问题。最后,数据是客观的,但是解读数据的人是主观的,所以不同人解读同一份数据必然会有所不同,因此欢迎所有的讨论和质疑,只要不是毫无逻辑的无脑喷,每次的争论都是进步的养分。
昨天写了一篇邓利维上任后是如何尝试再次构建争冠阵容的文章,有很多朋友对其中使用的赛季贡献估值数据有好奇和质疑,今天这边文章与大家分享我是如何计算球员单赛季的贡献估值的,同时与大家分享我是如何看待高阶影响力数据和一体化数据的。
一.常规赛贡献估值原理
首先是我目前使用的估值模型,最开始的启发源自于微博“篮圈即是原点”每年做的球员评分和排名,在球员卡里会附注一名球员过去几个赛季的“产出价值”,而这个价值的计算方式为该球员的EPM胜场贡献在该赛季工资帽下的转化价值。我在实际使用这个“产出价值”数据时发现了一个问题,在于中锋位置的EPM价值普遍较高,以至于23赛季EPM值前50的球员里有多达15名球员是中锋,这显然与实际情况是不符合的,因为中锋打到季后赛时往往时间会锐减,如果他真的影响力如此之大又为何会被弃用呢?同时中锋在NBA里拿到的整体薪水往往较低,如果影响力强又为何拿不到高薪呢?
为了解决这个问题,我的思路是将所有球员按照位置来进行分类,分别统计每个位置的EPM贡献和以及每个位置在当赛季拿的薪水和,用总薪水除以总的EPM胜场贡献就能得出该位置每1场胜场贡献值多少的薪水,通过这种方法来修正EPM对中锋位置的潜在高估以及其他位置的潜在低估。这种计算方式出来的结果还能帮助我们了解当下联盟什么位置最值钱、各球队愿意给什么类型的球员高薪。以下图2023年我的统计结果为例:
上图是我个人对于6位置的具体定位,薪水越高意味着该位置越稀缺、好球员越少,越低意味着该位置好球员越多、可替代性越强。目前市场最缺的是会投3分的大个子,但凡有空间属性往往就能拿到不错的薪水,每1场胜场贡献可以拿419万;其次是侧翼和前锋,他们主要在进攻端提供空间、防守端提供换防价值和协防价值,但真正能做到3D兼备的很少;双能卫和控卫相对不值钱的原因是库里崛起让这个位置受到了前所未有的重视,以至于每赛季都有大量后卫球员进入NBA、人才的井喷导致这个位置除了头部的几个人、其它球员都有很强的替代性,这导致该位置整体的薪资水平在下降,因为很容易在市场中找到更便宜的替代品;中锋位置是类似的道理,护框好但不会投3分的中锋有很多,常规赛影响力高但季后赛容易被DNP的中锋同样很多,以至于中锋位置可替代性强,很难拿到高薪。
计算出每个位置的单位贡献对应薪水后,就可以结合EPM胜场数据对每个球员当赛季的表现进行估值了。由于EPM胜场我采用的是常规赛数据,因此得出的结果自然只反映常规赛的价值。比如库里23赛季的EPM胜场贡献为12.2,乘以他双能卫位置每1胜场贡献价值310.6609的薪水,对应库里23赛季的常规赛贡献=12.2*310.6609=3790万元。
用类似的方法我还用LEBRON数据的胜场贡献同样换算成了薪水价值,并且把两个薪水价值进行平均,得出了该名球员本赛季常规赛贡献的评估结果。
也就是说,在我设计的常规赛贡献估值模型里,一名球员的常规赛贡献主要与胜场贡献和位置两个因素有关。而胜场贡献是基于高阶数据(EPM\LEBRON)、出场时间和球队胜场数三个因素综合计算的,也就是说贡献高低与该名球员的单位影响力、出勤率、球队整体胜率、该球员功能的稀缺性有关。记住这一点,就可以对一些看似不合理的现象进行分析了:
二.昨天文章里一些问题的解释
1.为何库里24赛季下滑却比23赛季贡献更大?
答案很简单,就是因为库里24赛季的出勤率比23赛季好很多。若论平均每场的影响力,23赛季库里的EPM值为6.4,其中进攻6.5、防守-0.1,而本赛季库里的EPM值为5.1,其中进攻5.3、防守-0.2;防守端的影响力与23赛季一致、但进攻影响力下滑严重。但从出勤率上看,23赛季库里仅出战56场、场均34.7分钟,而24赛季库里出战74场、场均32.7分钟,出场时间多了24.5%。结合出场时间后,库里23赛季的胜场贡献为12.2场,24赛季则由13.3场。所以常规赛打出的价值高≠他的水平比上赛季高,也可能是出勤率等因素。但是我们更需要关注的是,库里这赛季多打了18场胜场贡献却仅仅增加了1,所以或许让库里在背靠背的比赛中轮休、或体力不支时缺席一两场比赛,大概率对库里在比赛中的整体贡献更有帮助。特别是本赛季库里明显出现体力问题的背景下,在常规赛阶段选择性地放弃几场比赛休息,对老将的帮助很大。
2.梅尔顿38场打出1690万的价值,如果出勤翻一倍就是三千万级别的球员?
要想回答这个问题,首先我们需要知道他的高价值原因是什么、是否能够维持。23赛季梅尔顿EPM值0.9,其中进攻-0.8、防守1.7,而24赛季梅尔顿EPM值高达1.7,其中进攻0.3、防守1.4,可以看到梅尔顿在防守端的影响力依然强悍,但相比于23赛季、24赛季的梅尔顿进攻影响力大大增强。
同样的结论也可以在LEBRON值中观察到:23赛季梅尔顿LEBRON值-0.5,其中进攻-0.9、防守+0.4,最终胜场贡献为2.5场;到了24赛季梅尔顿LEBRON值提升至1,其中进攻0.3、防守0.7,攻防两端皆有提升,尤其是进攻。
也就是说,梅尔顿24赛季在进攻影响力的部分取得了显著的提升,具体来看他在进攻端的助攻率更高、助失比显著提升,这帮助他担任更重的进攻角色的同时还完成的非常出色。另一方面,梅尔顿也打出了夸张的进攻on-off值,他在场时全队的进攻效率要高出8.7,但这个数据受同时出场的队友影响较高。
梅尔顿本赛季搭档得最多的阵容是马克西+梅尔顿+哈里斯+巴图姆+恩比德的五外阵容,该阵容是76人本赛季用得最多的阵容,共计使用219分钟,每百回合要多得33.2分;而上赛季梅尔顿出场最久的阵容为哈登+梅尔顿+哈里斯+塔克+恩比德,出战518分钟,每百回合只多赢7.9分;把他替换成马克西的336分钟,每百回合可赢12.4分,这导致上赛季梅尔顿的进攻on-off值为-0.9。所以我认为梅尔顿本赛季的高进攻影响力更依赖于出场阵容本身的更加合理,能充分发挥他组织串联+拉开空间的属性,后续能否维持得看新赛季融入勇士的具体情况,未必能够维持。
不过好消息是,除新秀赛季和23赛季外,梅尔顿的进攻影响力均为正值,而防守影响力一直是精英水平且波动不大,所以25赛季在没有伤病影响的前提下,个人认为梅尔顿打出2000万以上的常规赛贡献问题不大,但是真要复制上赛季38场的球场影响力,需要勇士体系恢复正常运转。
3.23赛季的普洱出勤高,为何只有900万的价值
23赛季普洱保持全勤,却在常规赛阶段打出了极低的贡献,这似乎与上面库里的结论相矛盾。但事实上,这主要是因为普洱当赛季的防守端表现实在太差,EPM值-0.5、LEBRON值-1.6,以至于出勤累积下他的EPM胜场贡献只有4.2场,LEBRON胜场贡献只有1.3场。防守端的崩盘是他高阶数据如此之低的主要原因,而这种崩盘在本赛季同样延续,高出勤率情况下本赛季普洱EPM胜场贡献1.5、LEBRON胜场贡献0.1,对球队常规赛的帮助连300万都不到……
三.我个人对于数据的理解
随着各种高阶数据的引入和流行,大家对于数据的争议也越来越大,数据无用论和数据至上论都有各自的支持者。我个人对于高阶数据的看法是只要它的产生原理是逻辑解释得通、站得住脚的,那么它就有一定的作用,但是评价一个球员、一支球队绝对不能只用单一的高阶数据,因为任何一个处理过的数据都会损失原始数据的很多信息、从而存在很多缺陷。只有多个数据相互印证同一个观点/结论时,该观点才更能被采信。
此外,在看待数据时不能只看数值大小,而要去探究数据变动背后的原因,是自身的提升?与队伍体系的契合?亦或是小样本下很难维持的好表现?只有正确解读数据,数据本身才有价值,特别是当数据与观感不符合时,更需要关注原因是什么、哪个环节出了问题。最后,数据是客观的,但是解读数据的人是主观的,所以不同人解读同一份数据必然会有所不同,因此欢迎所有的讨论和质疑,只要不是毫无逻辑的无脑喷,每次的争论都是进步的养分。