约基奇的存在,证明了高阶数据的价值 196回复/ 5078140 浏览

全部回帖

收起

引用内容由于违规已被删除

哈哈,那正好。我没有理解错原文,apm有过拟合,rapm改善了过拟合,在多大程度上改善?知乎你的文章写的比较细,大部分观点我是认同的,但我很好奇的是,你在基本逻辑都ok的情况下,怎么能推出来一个离谱的结论。当你用一个模型,或者多个模型,去“判定”一个人的时候,是不是要先证明这个模型的有效性?论文只给出了能把误差降低,400名球员作为自变量建模,就十几万条数据,要证明有效性,是不是应该拉上球员,教练,媒体,球迷,给这400个球员排名,再给出模型的综合排名,然后算top5, top10,top30,看一看模型的预测和大家的“主流”判断在多大程度上接近,这样可以大概知道模型的水平,工作量是有点大,但参考价值更高。比如要评估自动驾驶,除了模型损失,是不是还得做路段测试,大样本下,人类车祸率万分之一,模型车祸率百万分之一,这样才能说明可靠性的问题呢?你的知乎昨天我给你留言了,正好可以探讨下。

哈哈,那正好。我没有理解错原文,apm有过拟合,rapm改善了过拟合,在多大程度上改善?知乎你的文章写的比较细,大部分观点我是认同的,但我很好奇的是,你在基本逻辑都ok的情况下,怎么能推出来一个离谱的结论。当你用一个模型,或者多个模型,去“判定”一个人的时候,是不是要先证明这个模型的有效性?论文只给出了能把误差降低,400名球员作为自变量建模,就十几万条数据,要证明有效性,是不是应该拉上球员,教练,媒体,球迷,给这400个球员排名,再给出模型的综合排名,然后算top5, top10,top30,看一看模型的预测和大家的“主流”判断在多大程度上接近,这样可以大概知道模型的水平,工作量是有点大,但参考价值更高。比如要评估自动驾驶,除了模型损失,是不是还得做路段测试,大样本下,人类车祸率万分之一,模型车祸率百万分之一,这样才能说明可靠性的问题呢?你的知乎昨天我给你留言了,正好可以探讨下。

亮了(0)
回复
引用 @斩猫焚佛 发表的:
只看此人

高阶贬科我能接受,但是捧詹不能接受,因为詹的很多行为就是为了提升高阶去做的,这就和统计相互影响了。还有也有为了老詹调系数的高阶数据。而且像詹姆斯走步得分,享受判罚利益这些,高阶肯定体现不出来。不是高阶不行,是遇到了老詹太离谱。正常来说高阶肯定是反应球员水平的。

[图片]

查看更多

高阶贬科我能接受,但是捧詹不能接受,因为詹的很多行为就是为了提升高阶去做的,这就和统计相互影响了。还有也有为了老詹调系数的高阶数据。而且像詹姆斯走步得分,享受判罚利益这些,高阶肯定体现不出来。不是高阶不行,是遇到了老詹太离谱。正常来说高阶肯定是反应球员水平的。

你干脆就说只要能踩詹姆斯,贬你都无所谓吧

你干脆就说只要能踩詹姆斯,贬你都无所谓吧

亮了(16)
回复

引用内容由于违规已被删除

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

亮了(0)
回复
查看评论(2)
引用 @贺儿哥 发表的:
只看此人

现在高阶数据又加进来很多种,高阶数据越来越完善。以后高阶数据也能体现出球员的实力了。

现在高阶数据又加进来很多种,高阶数据越来越完善。以后高阶数据也能体现出球员的实力了。

基础数据是比赛的初步反馈,高阶数据是比赛的真实反馈。某种意义上来说高阶数据能概括一个球员的真实实力表现(也可以说是绝大部分),有的人会说不要看excel,要多看比赛。这倒也不假,最靠谱的肯定是看比赛,但看完整个球员生涯所有比赛并不现实。你如果只是抽个几场比赛录像,几个GIF就妄图来概括一个球员的生涯,那还不如看高阶,至少高阶是统计了所有场次的比赛,而你的某场录像,几个GIF只是某个时刻的表现罢了。

基础数据是比赛的初步反馈,高阶数据是比赛的真实反馈。某种意义上来说高阶数据能概括一个球员的真实实力表现(也可以说是绝大部分),有的人会说不要看excel,要多看比赛。这倒也不假,最靠谱的肯定是看比赛,但看完整个球员生涯所有比赛并不现实。你如果只是抽个几场比赛录像,几个GIF就妄图来概括一个球员的生涯,那还不如看高阶,至少高阶是统计了所有场次的比赛,而你的某场录像,几个GIF只是某个时刻的表现罢了。

亮了(12)
回复
引用 @LowerMer1on33 发表的:
只看此人

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

首先,剩下三个人并不是什么都没做,他们盯住了自己对位球员,否则对手直接一个长传过去对手不就上空篮了吗?

其次,你应该一直没太理解RAPM,是回归分析不是加减乘除。
假如科比贡献很大,如果科比下场了队友不能做出同样额贡献,那么RAPM就会识别出科比是那个让球队多赢分的人。
假如你RAPM低,说明你下场后球队照样赢分,只不过紧贴抢断的人从科比变成了老鱼,意思是你做的活别人也能做,说明你不够强。
这就是回归的意义。

然后没人把高阶数据当真理,只不过它比人的主观评价队伍印象流强多了而已。评分就算了吧,饭圈大战。

首先,剩下三个人并不是什么都没做,他们盯住了自己对位球员,否则对手直接一个长传过去对手不就上空篮了吗?

其次,你应该一直没太理解RAPM,是回归分析不是加减乘除。
假如科比贡献很大,如果科比下场了队友不能做出同样额贡献,那么RAPM就会识别出科比是那个让球队多赢分的人。
假如你RAPM低,说明你下场后球队照样赢分,只不过紧贴抢断的人从科比变成了老鱼,意思是你做的活别人也能做,说明你不够强。
这就是回归的意义。

然后没人把高阶数据当真理,只不过它比人的主观评价队伍印象流强多了而已。评分就算了吧,饭圈大战。

亮了(0)
回复
引用 @LowerMer1on33 发表的:
只看此人

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。

你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。

至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。

你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。

至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。

亮了(0)
回复
查看评论(1)
引用 @LowerMer1on33 发表的:
只看此人

但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。

但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。

数据永远比印象流客观

数据永远比印象流客观

亮了(12)
回复
查看评论(2)
引用 @四点是你的谎言 发表的:
只看此人

你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。事实上也有人这么干了,DPM和EPM目前是最好的。至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。

[图片]

查看更多

你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。

至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。

我说球星懂球是指,首先他自己是高水平球员,大家都是天才,他大概能够评估跟他交手多年的明星球员的实力,因为他们在对抗,有些事情自己做不到,别人能做到,会有深刻的印象。而不是说他的技战术水平,人员布置,战术规划比教练要强。

我说球星懂球是指,首先他自己是高水平球员,大家都是天才,他大概能够评估跟他交手多年的明星球员的实力,因为他们在对抗,有些事情自己做不到,别人能做到,会有深刻的印象。而不是说他的技战术水平,人员布置,战术规划比教练要强。

亮了(0)
回复
引用 @指尖红蝶 发表的:
只看此人

曾经我还挺相信高端数据的,直到我看了高端数据的算法我就觉得这东西有问题,然后是威少打爆了高端数据导致高端数据的算法又改了,这件事更是让我觉得可笑。

曾经我还挺相信高端数据的,直到我看了高端数据的算法我就觉得这东西有问题,然后是威少打爆了高端数据导致高端数据的算法又改了,这件事更是让我觉得可笑。

bpm作者修改的原因很简单,威少很多数据甚至排不进联盟前十,唯独bpm历史第一,你是作者你也得改。。

如果威少把所有算法全都打爆了,那bpm还改个鸡毛。。

bpm作者修改的原因很简单,威少很多数据甚至排不进联盟前十,唯独bpm历史第一,你是作者你也得改。。

如果威少把所有算法全都打爆了,那bpm还改个鸡毛。。

亮了(0)
回复
引用 @青云志不坠 发表的:
只看此人

首先数据分析都是依赖数据集的。。。没有基础数据的统计谁也说不出来高阶数据,无论什么公式什么算法都一样

首先数据分析都是依赖数据集的。。。没有基础数据的统计谁也说不出来高阶数据,无论什么公式什么算法都一样

他是这样的。rapm之类的,把每个球员作为多元变量,一个回合的正负值作为label,一个赛季几百个自变量,十几万的样本。首先是样本少,其次虽然跟基础数据无关,但噪声比较大,所以也很不稳定。只是很多人很迷信高阶数据,没有批判性意识。我的观点是:不依靠视频建模,只依靠统计数据建模,想要精准衡球员的贡献,无异于天方夜谭。

他是这样的。rapm之类的,把每个球员作为多元变量,一个回合的正负值作为label,一个赛季几百个自变量,十几万的样本。首先是样本少,其次虽然跟基础数据无关,但噪声比较大,所以也很不稳定。只是很多人很迷信高阶数据,没有批判性意识。我的观点是:不依靠视频建模,只依靠统计数据建模,想要精准衡球员的贡献,无异于天方夜谭。

亮了(0)
回复

质疑高阶数据含金量的只有一种人吧

质疑高阶数据含金量的只有一种人吧

亮了(0)
回复

引用内容由于违规已被删除

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

亮了(20)
回复
查看评论(2)
引用 @愤怒的大脸猫 发表的:
只看此人

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

[图片]

查看更多

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

亮了(0)
回复
引用 @LowerMer1on33 发表的:
只看此人

但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。

但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。

因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面

因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面

亮了(6)
回复
查看评论(2)
引用 @愤怒的大脸猫 发表的:
只看此人

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

[图片]

查看更多

哥们看了你这段话,我觉得你还是先关心下自己身心健康吧,我觉得似乎给你带来了不小的心灵创伤

亮了(0)
回复
引用 @骄傲科库给我力量 发表的:
只看此人

数据永远比印象流客观

数据永远比印象流客观

只能说大数据,平均数据,长时间的数据客观。
短时如麦迪 35 秒这种,还有单场 81 分这种,拿出来说得分厉害,说不过去,强如帮主都没有做到过。

只能说大数据,平均数据,长时间的数据客观。
短时如麦迪 35 秒这种,还有单场 81 分这种,拿出来说得分厉害,说不过去,强如帮主都没有做到过。

亮了(2)
回复
引用 @虎扑JR0044789202 发表的:
只看此人

因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面

因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面

你在自我介绍?需要帮你翻译不?

你在自我介绍?需要帮你翻译不?

亮了(0)
回复
引用 @三分goat库里 发表的:
只看此人

闭嘴 解释一下为什么别人都适用高阶数据 就科比不适用?

[图片]

查看更多

闭嘴 解释一下为什么别人都适用高阶数据 就科比不适用?

我找的你舔的原文,他观点跟我一致,难受不。

我找的你舔的原文,他观点跟我一致,难受不。

亮了(0)
回复
Re:约基奇的存在,证明了高阶数据的价值
虎扑游戏中心
掘金专区最热帖
[流言板]掘金队记:掘金内部有部分人士是雷霆球员海沃德的球迷
一个外线球员出勤比内线球员差这么多
掘金兄弟总决赛支持谁?
狼蜜,或者说西北蜜过来咨询掘金相关的事
要不用波特去和国王谈谈?
矿区的有个观点真的让我很奇怪
咱队首发有哪一家家人是正常的?
矿跟牛的管理层,哎。。。
八卦一下,大家希望谁夺冠
我觉得波尔波尔挺不错
掘金专区最新帖
[流言板]掘金队记:掘金内部有部分人士是雷霆球员海沃德的球迷
一个外线球员出勤比内线球员差这么多
狼蜜,或者说西北蜜过来咨询掘金相关的事
掘金明年还有机会吗?
工地上看到的,这俩人怎么样
大家如何看待哈里斯风给的交易建议
各位总经理,夏天怎么操作啊!
理性讨论,约基奇还能达成422大荣誉目标吗
看一些录像,怎么感觉小波特那一手跳投跟当年火箭的杰拉德格林有点像?
不知道我有没有记错,不知道jrs能不能找到这个新闻
热门游戏-即点即玩
无需下载,足球经理模式一键即玩
《NBA英雄》教练系统上线啦!我选好了,看看你的