约基奇的存在，证明了高阶数据的价值-NBA-掘金专区-虎扑社区

社区 » NBA » 掘金专区 » 约基奇的存在，证明了...

约基奇的存在，证明了高阶数据的价值 196回复/ 50亮78140 浏览

到第页GO

全部回帖

收起

LowerMer1on332024-04-29 13:20:02发布于四川

点灭只看此人举报181楼

引用内容由于违规已被删除

哈哈，那正好。我没有理解错原文，apm有过拟合，rapm改善了过拟合，在多大程度上改善？知乎你的文章写的比较细，大部分观点我是认同的，但我很好奇的是，你在基本逻辑都ok的情况下，怎么能推出来一个离谱的结论。当你用一个模型，或者多个模型，去“判定”一个人的时候，是不是要先证明这个模型的有效性？论文只给出了能把误差降低，400名球员作为自变量建模，就十几万条数据，要证明有效性，是不是应该拉上球员，教练，媒体，球迷，给这400个球员排名，再给出模型的综合排名，然后算top5, top10,top30,看一看模型的预测和大家的“主流”判断在多大程度上接近，这样可以大概知道模型的水平，工作量是有点大，但参考价值更高。比如要评估自动驾驶，除了模型损失，是不是还得做路段测试，大样本下，人类车祸率万分之一，模型车祸率百万分之一，这样才能说明可靠性的问题呢？你的知乎昨天我给你留言了，正好可以探讨下。

亮了(0)

愤怒的大脸猫2024-04-29 13:36:57发布于天津

点灭只看此人举报182楼

引用 @斩猫焚佛发表的:

只看此人

高阶贬科我能接受，但是捧詹不能接受，因为詹的很多行为就是为了提升高阶去做的，这就和统计相互影响了。还有也有为了老詹调系数的高阶数据。而且像詹姆斯走步得分，享受判罚利益这些，高阶肯定体现不出来。不是高阶不行，是遇到了老詹太离谱。正常来说高阶肯定是反应球员水平的。

[图片]

你干脆就说只要能踩詹姆斯，贬你都无所谓吧

亮了(16)

LowerMer1on332024-04-29 13:40:19发布于四川

点灭只看此人举报183楼

引用内容由于违规已被删除

我从头到尾只有一个核心逻辑：nba这么多信息和细节的一场比赛里，如果目标是量化一场比赛每个球员的贡献，而手里又只有统计数据，通过统计数据建模，会丢失太多的过程和细节信息，导致模型精准度不高。所以我从来都是说，高阶作为参考，提供一个视角，就够了，作者原文也这样聊的。以前了解了一下per，ws人为设定参数，就觉得挺搞笑，没当回事。昨天去看了下rapm和bpm，无非是每场让专家给球员打分和排序是一件很难，工作量大的事情，所以无监督的思路，把正负值作为label建模，这样最方便，也剔除了主观因素。但是稍微一想就能知道噪声在哪，典型场景，奥运会科比牛皮糖贴防压迫，对方持球手传球不好，对面没接住，韦德抢断扣篮一条龙，这里面基础数据贡献科比0，韦德1抢断➕2分，高阶数据正负值全队+2，另外三人几乎没做什么，但是在高阶上和科比贡献一致。以及更多的协防补防，内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大，而视频建模目前的手段又做不到那么好，所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱，但你不能把他的输出作为世界的客观真理吧，乱说的时候也不少。在引入视频信息建模前，我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至，考虑每个球员的基础数据，结合虎扑的赛后评分（角色球员打的好容易高分）以及抽取评论引入nlp综合判定这个模型应该都不会太差。

亮了(0)

查看评论(2)

三重门I特2024-04-29 13:42:14发布于浙江

点灭只看此人举报184楼

引用 @贺儿哥发表的:

只看此人

现在高阶数据又加进来很多种，高阶数据越来越完善。以后高阶数据也能体现出球员的实力了。

基础数据是比赛的初步反馈，高阶数据是比赛的真实反馈。某种意义上来说高阶数据能概括一个球员的真实实力表现（也可以说是绝大部分），有的人会说不要看excel，要多看比赛。这倒也不假，最靠谱的肯定是看比赛，但看完整个球员生涯所有比赛并不现实。你如果只是抽个几场比赛录像，几个GIF就妄图来概括一个球员的生涯，那还不如看高阶，至少高阶是统计了所有场次的比赛，而你的某场录像，几个GIF只是某个时刻的表现罢了。

亮了(12)

四点是你的谎言2024-04-29 13:52:53发布于中国香港

点灭只看此人举报185楼

引用 @LowerMer1on33 发表的:

只看此人

首先，剩下三个人并不是什么都没做，他们盯住了自己对位球员，否则对手直接一个长传过去对手不就上空篮了吗？

其次，你应该一直没太理解RAPM，是回归分析不是加减乘除。
假如科比贡献很大，如果科比下场了队友不能做出同样额贡献，那么RAPM就会识别出科比是那个让球队多赢分的人。
假如你RAPM低，说明你下场后球队照样赢分，只不过紧贴抢断的人从科比变成了老鱼，意思是你做的活别人也能做，说明你不够强。
这就是回归的意义。

然后没人把高阶数据当真理，只不过它比人的主观评价队伍印象流强多了而已。评分就算了吧，饭圈大战。

亮了(0)

四点是你的谎言2024-04-29 14:04:34发布于中国香港

点灭只看此人举报186楼

引用 @LowerMer1on33 发表的:

只看此人

你要知道噪声最大的就是人类的主观感受，这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小，比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了，DPM和EPM目前是最好的。

至于啥球星评价看看就得了，球星真永远懂球也不至于当教练各个一塌糊涂，篮球本来就是天赋占大头。

亮了(0)

查看评论(1)

骄傲科库给我力量2024-04-29 14:05:23发布于宾夕法尼亚

点灭只看此人举报187楼

引用 @LowerMer1on33 发表的:

只看此人

但凡看一下定义和算法就知道噪声有多大，我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。

数据永远比印象流客观

亮了(12)

查看评论(2)

LowerMer1on332024-04-29 14:28:32发布于四川

点灭只看此人举报188楼

引用 @四点是你的谎言发表的:

只看此人

你要知道噪声最大的就是人类的主观感受，这是无数血泪的教训。真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小，比如RMSE什么的… 而不是看啥主流评价去。事实上也有人这么干了，DPM和EPM目前是最好的。至于啥球星评价看看就得了，球星真永远懂球也不至于当教练各个一塌糊涂，篮球本来就是天赋占大头。

[图片]

我说球星懂球是指，首先他自己是高水平球员，大家都是天才，他大概能够评估跟他交手多年的明星球员的实力，因为他们在对抗，有些事情自己做不到，别人能做到，会有深刻的印象。而不是说他的技战术水平，人员布置，战术规划比教练要强。

亮了(0)

蓝篮篮2024-04-29 14:41:02发布于河北

点灭只看此人举报189楼

引用 @指尖红蝶发表的:

只看此人

曾经我还挺相信高端数据的，直到我看了高端数据的算法我就觉得这东西有问题，然后是威少打爆了高端数据导致高端数据的算法又改了，这件事更是让我觉得可笑。

bpm作者修改的原因很简单，威少很多数据甚至排不进联盟前十，唯独bpm历史第一，你是作者你也得改。。

如果威少把所有算法全都打爆了，那bpm还改个鸡毛。。

亮了(0)

LowerMer1on332024-04-29 14:47:58发布于四川

点灭只看此人举报190楼

引用 @青云志不坠发表的:

只看此人

首先数据分析都是依赖数据集的。。。没有基础数据的统计谁也说不出来高阶数据，无论什么公式什么算法都一样

他是这样的。rapm之类的，把每个球员作为多元变量，一个回合的正负值作为label，一个赛季几百个自变量，十几万的样本。首先是样本少，其次虽然跟基础数据无关，但噪声比较大，所以也很不稳定。只是很多人很迷信高阶数据，没有批判性意识。我的观点是：不依靠视频建模，只依靠统计数据建模，想要精准衡球员的贡献，无异于天方夜谭。

亮了(0)

一豹还一豹2024-04-29 15:02:05发布于江西

点灭只看此人举报191楼

质疑高阶数据含金量的只有一种人吧