(3)RAPM
RAPM(Regularized Adjusted Plus Minus)极其重要,因为这是第一个正负值模型,是后续几乎所有高阶数据的基础。正负值模型特殊在于,它完全从比赛结果出发(赢分或者输分),一定程度上我们可以认为它反应的了球员在场的全部影响,无论这些影响有没有被数据记录到(比如库里的无球跑动吸引防守让队友上空篮,体现在数据上只有正负值的变化。)单场的正负值参考价值不高,因为阵容搭配的影响很大,但是大量正负值数据中我们可以得到一个球员的影响力。
我们来看看RAPM怎么计算的:
比如,A B C与D E F进行2v2比赛。从队伍一的角度,有如下回归方程:
其中,A~F均为01变量。每两次换人间我们可以得到一个样本,比如:
放到NBA的背景下,我们将得到的大量样本进行回归估计,便能得到每个球员对赢分的影响。值得注意的是,NBA有几百个现役球员,对应几百个变量,对样本量的要求是非常高的。因此单年的RAPM往往因为样本量不够多而不可靠,但是放在多年的背景下则有较高的参考价值。RAPM的缺陷除了对样本量要求高以外,还来自一个非常强的假设,即认为球员在场的每一分钟的表现都是恒定不变的,这与实际情况是不相符的,但当样本量足够大的时候我们认为球员表现是稳定的。
以上来源于:https://bbs.hupu.com/52508660.html
简单说岭回归就是比OLS加了一个L2正则化项,通过梯度下降求解模型拟合的较好的一组参数,这组参数的拟合效果是使所有测试样本的整体误差最小。再说明白点就是计算机不断尝试模型的各个参数,来让每个球员的模型预测值与真实之间的差距加总后最小。岭回归得到的结果不一定是最优的,你可以认为结果是先验的,但说是把某个球员作为模型的基准设定那就是扯淡了,难道模型训练时还能有自主意识分得清哪个是詹姆斯的数据从而给他的数据增加权重?
(3)RAPM
RAPM(Regularized Adjusted Plus Minus)极其重要,因为这是第一个正负值模型,是后续几乎所有高阶数据的基础。正负值模型特殊在于,它完全从比赛结果出发(赢分或者输分),一定程度上我们可以认为它反应的了球员在场的全部影响,无论这些影响有没有被数据记录到(比如库里的无球跑动吸引防守让队友上空篮,体现在数据上只有正负值的变化。)单场的正负值参考价值不高,因为阵容搭配的影响很大,但是大量正负值数据中我们可以得到一个球员的影响力。
我们来看看RAPM怎么计算的:
比如,A B C与D E F进行2v2比赛。从队伍一的角度,有如下回归方程:
其中,A~F均为01变量。每两次换人间我们可以得到一个样本,比如:
放到NBA的背景下,我们将得到的大量样本进行回归估计,便能得到每个球员对赢分的影响。值得注意的是,NBA有几百个现役球员,对应几百个变量,对样本量的要求是非常高的。因此单年的RAPM往往因为样本量不够多而不可靠,但是放在多年的背景下则有较高的参考价值。RAPM的缺陷除了对样本量要求高以外,还来自一个非常强的假设,即认为球员在场的每一分钟的表现都是恒定不变的,这与实际情况是不相符的,但当样本量足够大的时候我们认为球员表现是稳定的。
以上来源于:https://bbs.hupu.com/52508660.html
简单说岭回归就是比OLS加了一个L2正则化项,通过梯度下降求解模型拟合的较好的一组参数,这组参数的拟合效果是使所有测试样本的整体误差最小。再说明白点就是计算机不断尝试模型的各个参数,来让每个球员的模型预测值与真实之间的差距加总后最小。岭回归得到的结果不一定是最优的,你可以认为结果是先验的,但说是把某个球员作为模型的基准设定那就是扯淡了,难道模型训练时还能有自主意识分得清哪个是詹姆斯的数据从而给他的数据增加权重?