全部回帖
引用内容由于违规已被删除
哈哈,那正好。我没有理解错原文,apm有过拟合,rapm改善了过拟合,在多大程度上改善?知乎你的文章写的比较细,大部分观点我是认同的,但我很好奇的是,你在基本逻辑都ok的情况下,怎么能推出来一个离谱的结论。当你用一个模型,或者多个模型,去“判定”一个人的时候,是不是要先证明这个模型的有效性?论文只给出了能把误差降低,400名球员作为自变量建模,就十几万条数据,要证明有效性,是不是应该拉上球员,教练,媒体,球迷,给这400个球员排名,再给出模型的综合排名,然后算top5, top10,top30,看一看模型的预测和大家的“主流”判断在多大程度上接近,这样可以大概知道模型的水平,工作量是有点大,但参考价值更高。比如要评估自动驾驶,除了模型损失,是不是还得做路段测试,大样本下,人类车祸率万分之一,模型车祸率百万分之一,这样才能说明可靠性的问题呢?你的知乎昨天我给你留言了,正好可以探讨下。
哈哈,那正好。我没有理解错原文,apm有过拟合,rapm改善了过拟合,在多大程度上改善?知乎你的文章写的比较细,大部分观点我是认同的,但我很好奇的是,你在基本逻辑都ok的情况下,怎么能推出来一个离谱的结论。当你用一个模型,或者多个模型,去“判定”一个人的时候,是不是要先证明这个模型的有效性?论文只给出了能把误差降低,400名球员作为自变量建模,就十几万条数据,要证明有效性,是不是应该拉上球员,教练,媒体,球迷,给这400个球员排名,再给出模型的综合排名,然后算top5, top10,top30,看一看模型的预测和大家的“主流”判断在多大程度上接近,这样可以大概知道模型的水平,工作量是有点大,但参考价值更高。比如要评估自动驾驶,除了模型损失,是不是还得做路段测试,大样本下,人类车祸率万分之一,模型车祸率百万分之一,这样才能说明可靠性的问题呢?你的知乎昨天我给你留言了,正好可以探讨下。
高阶贬科我能接受,但是捧詹不能接受,因为詹的很多行为就是为了提升高阶去做的,这就和统计相互影响了。还有也有为了老詹调系数的高阶数据。而且像詹姆斯走步得分,享受判罚利益这些,高阶肯定体现不出来。不是高阶不行,是遇到了老詹太离谱。正常来说高阶肯定是反应球员水平的。
[图片]
高阶贬科我能接受,但是捧詹不能接受,因为詹的很多行为就是为了提升高阶去做的,这就和统计相互影响了。还有也有为了老詹调系数的高阶数据。而且像詹姆斯走步得分,享受判罚利益这些,高阶肯定体现不出来。不是高阶不行,是遇到了老詹太离谱。正常来说高阶肯定是反应球员水平的。
你干脆就说只要能踩詹姆斯,贬你都无所谓吧
你干脆就说只要能踩詹姆斯,贬你都无所谓吧
引用内容由于违规已被删除
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
现在高阶数据又加进来很多种,高阶数据越来越完善。以后高阶数据也能体现出球员的实力了。
现在高阶数据又加进来很多种,高阶数据越来越完善。以后高阶数据也能体现出球员的实力了。
基础数据是比赛的初步反馈,高阶数据是比赛的真实反馈。某种意义上来说高阶数据能概括一个球员的真实实力表现(也可以说是绝大部分),有的人会说不要看excel,要多看比赛。这倒也不假,最靠谱的肯定是看比赛,但看完整个球员生涯所有比赛并不现实。你如果只是抽个几场比赛录像,几个GIF就妄图来概括一个球员的生涯,那还不如看高阶,至少高阶是统计了所有场次的比赛,而你的某场录像,几个GIF只是某个时刻的表现罢了。
基础数据是比赛的初步反馈,高阶数据是比赛的真实反馈。某种意义上来说高阶数据能概括一个球员的真实实力表现(也可以说是绝大部分),有的人会说不要看excel,要多看比赛。这倒也不假,最靠谱的肯定是看比赛,但看完整个球员生涯所有比赛并不现实。你如果只是抽个几场比赛录像,几个GIF就妄图来概括一个球员的生涯,那还不如看高阶,至少高阶是统计了所有场次的比赛,而你的某场录像,几个GIF只是某个时刻的表现罢了。
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
首先,剩下三个人并不是什么都没做,他们盯住了自己对位球员,否则对手直接一个长传过去对手不就上空篮了吗?
其次,你应该一直没太理解RAPM,是回归分析不是加减乘除。
假如科比贡献很大,如果科比下场了队友不能做出同样额贡献,那么RAPM就会识别出科比是那个让球队多赢分的人。
假如你RAPM低,说明你下场后球队照样赢分,只不过紧贴抢断的人从科比变成了老鱼,意思是你做的活别人也能做,说明你不够强。
这就是回归的意义。
然后没人把高阶数据当真理,只不过它比人的主观评价队伍印象流强多了而已。评分就算了吧,饭圈大战。
首先,剩下三个人并不是什么都没做,他们盯住了自己对位球员,否则对手直接一个长传过去对手不就上空篮了吗?
其次,你应该一直没太理解RAPM,是回归分析不是加减乘除。
假如科比贡献很大,如果科比下场了队友不能做出同样额贡献,那么RAPM就会识别出科比是那个让球队多赢分的人。
假如你RAPM低,说明你下场后球队照样赢分,只不过紧贴抢断的人从科比变成了老鱼,意思是你做的活别人也能做,说明你不够强。
这就是回归的意义。
然后没人把高阶数据当真理,只不过它比人的主观评价队伍印象流强多了而已。评分就算了吧,饭圈大战。
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
我从头到尾只有一个核心逻辑:nba这么多信息和细节的一场比赛里,如果目标是量化一场比赛每个球员的贡献,而手里又只有统计数据,通过统计数据建模,会丢失太多的过程和细节信息,导致模型精准度不高。所以我从来都是说,高阶作为参考,提供一个视角,就够了,作者原文也这样聊的。以前了解了一下per,ws人为设定参数,就觉得挺搞笑,没当回事。昨天去看了下rapm和bpm,无非是每场让专家给球员打分和排序是一件很难,工作量大的事情,所以无监督的思路,把正负值作为label建模,这样最方便,也剔除了主观因素。但是稍微一想就能知道噪声在哪,典型场景,奥运会科比牛皮糖贴防压迫,对方持球手传球不好,对面没接住,韦德抢断扣篮一条龙,这里面基础数据贡献科比0,韦德1抢断➕2分,高阶数据正负值全队+2,另外三人几乎没做什么,但是在高阶上和科比贡献一致。以及更多的协防补防,内线压迫导致你不敢上篮等情况。所以我说这样建模噪声很大,而视频建模目前的手段又做不到那么好,所以这是一个技术性问题。比如现在chatGPT大多数情况的回答都挺靠谱,但你不能把他的输出作为世界的客观真理吧,乱说的时候也不少。在引入视频信息建模前,我不会觉得以统计信息建模的高阶有特别高的参考价值。甚至,考虑每个球员的基础数据,结合虎扑的赛后评分(角色球员打的好容易高分)以及抽取评论引入nlp综合判定这个模型应该都不会太差。
你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。
至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。
你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。
至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。
但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。
但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。
数据永远比印象流客观
数据永远比印象流客观
你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。事实上也有人这么干了,DPM和EPM目前是最好的。至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。
[图片]
你要知道噪声最大的就是人类的主观感受,这是无数血泪的教训。
真想评判一体化数据的好坏也是往第二年的PBP数据里代看看那几个指标的大小,比如RMSE什么的… 而不是看啥主流评价去。
事实上也有人这么干了,DPM和EPM目前是最好的。
至于啥球星评价看看就得了,球星真永远懂球也不至于当教练各个一塌糊涂,篮球本来就是天赋占大头。
我说球星懂球是指,首先他自己是高水平球员,大家都是天才,他大概能够评估跟他交手多年的明星球员的实力,因为他们在对抗,有些事情自己做不到,别人能做到,会有深刻的印象。而不是说他的技战术水平,人员布置,战术规划比教练要强。
我说球星懂球是指,首先他自己是高水平球员,大家都是天才,他大概能够评估跟他交手多年的明星球员的实力,因为他们在对抗,有些事情自己做不到,别人能做到,会有深刻的印象。而不是说他的技战术水平,人员布置,战术规划比教练要强。
曾经我还挺相信高端数据的,直到我看了高端数据的算法我就觉得这东西有问题,然后是威少打爆了高端数据导致高端数据的算法又改了,这件事更是让我觉得可笑。
曾经我还挺相信高端数据的,直到我看了高端数据的算法我就觉得这东西有问题,然后是威少打爆了高端数据导致高端数据的算法又改了,这件事更是让我觉得可笑。
bpm作者修改的原因很简单,威少很多数据甚至排不进联盟前十,唯独bpm历史第一,你是作者你也得改。。
如果威少把所有算法全都打爆了,那bpm还改个鸡毛。。
bpm作者修改的原因很简单,威少很多数据甚至排不进联盟前十,唯独bpm历史第一,你是作者你也得改。。
如果威少把所有算法全都打爆了,那bpm还改个鸡毛。。
首先数据分析都是依赖数据集的。。。没有基础数据的统计谁也说不出来高阶数据,无论什么公式什么算法都一样
首先数据分析都是依赖数据集的。。。没有基础数据的统计谁也说不出来高阶数据,无论什么公式什么算法都一样
他是这样的。rapm之类的,把每个球员作为多元变量,一个回合的正负值作为label,一个赛季几百个自变量,十几万的样本。首先是样本少,其次虽然跟基础数据无关,但噪声比较大,所以也很不稳定。只是很多人很迷信高阶数据,没有批判性意识。我的观点是:不依靠视频建模,只依靠统计数据建模,想要精准衡球员的贡献,无异于天方夜谭。
他是这样的。rapm之类的,把每个球员作为多元变量,一个回合的正负值作为label,一个赛季几百个自变量,十几万的样本。首先是样本少,其次虽然跟基础数据无关,但噪声比较大,所以也很不稳定。只是很多人很迷信高阶数据,没有批判性意识。我的观点是:不依靠视频建模,只依靠统计数据建模,想要精准衡球员的贡献,无异于天方夜谭。
但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。
但凡看一下定义和算法就知道噪声有多大,我也不懂为啥有这么多人捧臭脚。美国媒体说的啥都是对的。
因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面
因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面
因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面
因为懂得算数据的人在球队里面当分析师拿高薪,天天看gif的人在租房子吃泡面
你在自我介绍?需要帮你翻译不?
你在自我介绍?需要帮你翻译不?
闭嘴 解释一下为什么别人都适用高阶数据 就科比不适用?
我找的你舔的原文,他观点跟我一致,难受不。
我找的你舔的原文,他观点跟我一致,难受不。
上海匡慧网络科技有限公司 沪B2-20211235 沪ICP备2021021198号-6 Copyright ©2021 KUANGHUI All Rights Reserved. 匡慧公司 版权所有