高阶数据究竟针对了谁?从高阶数据看历史前30,谁被低估,谁被高估了! 1214回复/ 50333360 浏览

全部回帖

收起
引用 @洛杉矶湖人队主帅沃格儿 发表的:
只看此人

32岁的科比可不止有加索尔。其他人已不算人了

32岁的科比可不止有加索尔。其他人已不算人了

在湖人队有15核,在热火只有3核。

在湖人队有15核,在热火只有3核。

亮了(0)
回复
引用 @hal9000 发表的:
只看此人

首先你的话没什么问题。其次我也算是职业玩数据的,太了解数据的问题了。首先你使用的仍然是早期的“高阶数据”,这些数据的问题就在于基础数据堆砌的逻辑。这对于1、节奏偏慢;2、注重防守;3、竞争环境恶劣,的球员和球队不利。如果要控制变量,可以考虑1、引入回合数;2、个人表现/球队表现*对手表现。比如常规赛就计算面对东部和西部球队时的数据2:1加权平均,季后赛则更复杂一些,因为季后赛的对手较为单一,因此要参考常规赛数据进行再次定标。经过这些操作之后再看结果。当然我肯定不会去干这个事情。因为以下几个事实:1、我不在意科比是不是最强,我欣赏的是他的竞争意志;2、即便是这样处理完,我仍然不认为这可以代表一个人的表现,因为每个人在场上的环境也不同,科比是个特别争强好胜的球员,喜欢和强者对位,这种影响目前很难量化,这也是为什么科比在通过录像逐球分析之后会有不同认识。3、即便你这表里的数据,其实与冠军的相关性不强。比如2011年诺维斯基几乎排不上,邓肯其实也不多,94和95的大梦,原因其实就是前面说的,不考虑环境因素。在慢节奏球队(回合数),阵地战为主(命中率),西部2东部(对手影响),球队打法(重防守的马刺、活塞、火箭出现都少,球权相对均衡的小牛、湖人、也不易出现排名第一。4、很明显第一名特别集中,而二三名之后就百花齐放,这其实就是这个数据的漏洞的体现。因为当初这些参数构筑时就是参考构造者心目中的第一名的数据来定制/训练的,所以会出现这种情况。(为什么不看前五?因为那可能更离谱)。搁了以前我可能会转开一贴数据分析一番去仔细论证,但现在没时间也不在意了。不过至少有一点,我认同你的态度,至少字面上的表达,是客观理性的。瘅我认为你对于数据的理解和构造过程还是不太了解了。当分析的问题越复杂,构造出完美数据的难度就越高,对解读者的要求就越高,对于不具备解读能力的人误导性也就越高。以篮球这项运动而言,我必须承认数据反馈的信息还是源源不够的,除了亲自上场,看录像仍然是最好的解读和总结方式。

首先你的话没什么问题。其次我也算是职业玩数据的,太了解数据的问题了。首先你使用的仍然是早期的“高阶数据”,这些数据的问题就在于基础数据堆砌的逻辑。这对于1、节奏偏慢;2、注重防守;3、竞争环境恶劣,的球员和球队不利。如果要控制变量,可以考虑1、引入回合数;2、个人表现/球队表现*对手表现。比如常规赛就计算面对东部和西部球队时的数据2:1加权平均,季后赛则更复杂一些,因为季后赛的对手较为单一,因此要参考常规赛数据进行再次定标。经过这些操作之后再看结果。当然我肯定不会去干这个事情。因为以下几个事实:1、我不在意科比是不是最强,我欣赏的是他的竞争意志;2、即便是这样处理完,我仍然不认为这可以代表一个人的表现,因为每个人在场上的环境也不同,科比是个特别争强好胜的球员,喜欢和强者对位,这种影响目前很难量化,这也是为什么科比在通过录像逐球分析之后会有不同认识。3、即便你这表里的数据,其实与冠军的相关性不强。比如2011年诺维斯基几乎排不上,邓肯其实也不多,94和95的大梦,原因其实就是前面说的,不考虑环境因素。在慢节奏球队(回合数),阵地战为主(命中率),西部2东部(对手影响),球队打法(重防守的马刺、活塞、火箭出现都少,球权相对均衡的小牛、湖人、也不易出现排名第一。4、很明显第一名特别集中,而二三名之后就百花齐放,这其实就是这个数据的漏洞的体现。因为当初这些参数构筑时就是参考构造者心目中的第一名的数据来定制/训练的,所以会出现这种情况。(为什么不看前五?因为那可能更离谱)。搁了以前我可能会转开一贴数据分析一番去仔细论证,但现在没时间也不在意了。不过至少有一点,我认同你的态度,至少字面上的表达,是客观理性的。瘅我认为你对于数据的理解和构造过程还是不太了解了。当分析的问题越复杂,构造出完美数据的难度就越高,对解读者的要求就越高,对于不具备解读能力的人误导性也就越高。以篮球这项运动而言,我必须承认数据反馈的信息还是源源不够的,除了亲自上场,看录像仍然是最好的解读和总结方式。

你说这么多,总结一句话:你认为数据有缺陷所以无用,看球印象最准。我没理解错吧?你提到看球和印象问题,印象流啥意思你应该懂吧,至于看球,如果你不能保证自己完整看完了一个球员每一秒钟的球,按照你对数据的观点(数据不是比赛,无法正确反应全部),你得出的结论都应该是错误的吧,毕竟那不是全部,那么,请教下你看完了科比每一秒的球了嘛?假如你真看完了,那么乔丹詹姆斯他们呢?如果你没看完其他任何一个人,你怎么得出正确的对比结论的?

你说这么多,总结一句话:你认为数据有缺陷所以无用,看球印象最准。我没理解错吧?你提到看球和印象问题,印象流啥意思你应该懂吧,至于看球,如果你不能保证自己完整看完了一个球员每一秒钟的球,按照你对数据的观点(数据不是比赛,无法正确反应全部),你得出的结论都应该是错误的吧,毕竟那不是全部,那么,请教下你看完了科比每一秒的球了嘛?假如你真看完了,那么乔丹詹姆斯他们呢?如果你没看完其他任何一个人,你怎么得出正确的对比结论的?

亮了(12)
回复
查看评论(2)

真详细,插眼慢慢看。

真详细,插眼慢慢看。

亮了(0)
回复
引用 @ty举个栗子 发表的:
只看此人

你是真没看过球啊……那几年常规赛,骑士不是第一就是第二,就这你还说阵容不行?敢情真的是赢了都是詹姆斯的,输了全是队友的锅?同理罗斯,没伤前公牛战绩也很好,季后赛也一般,怎么没看罗斯球迷说队友拉跨?一边拿着常规赛数一数二的战绩,一边说着队友不行,球队领袖就是这么当的是吧?

[图片]

查看更多

你是真没看过球啊……那几年常规赛,骑士不是第一就是第二,就这你还说阵容不行?敢情真的是赢了都是詹姆斯的,输了全是队友的锅?
同理罗斯,没伤前公牛战绩也很好,季后赛也一般,怎么没看罗斯球迷说队友拉跨?
一边拿着常规赛数一数二的战绩,一边说着队友不行,球队领袖就是这么当的是吧?

高阶数据基本就是胜率高的球队老大得力, 现在天天看到拿高阶数据来压科比,当然了,科比确实中期没带动鱼腩,这个球队老大当的不称职

高阶数据基本就是胜率高的球队老大得力, 现在天天看到拿高阶数据来压科比,当然了,科比确实中期没带动鱼腩,这个球队老大当的不称职[狗头]

亮了(0)
回复
引用 @木头哥哥cp3 发表的:
只看此人

我把为什么要看高阶数据的逻辑讲清楚吧。

不少人认为应该看总冠军数,数据是次要的。

那么我可否得出结论,5冠的费舍尔强于0冠的马龙,1冠的孙悦强于0冠的姚明?

你一定会回答我,费舍尔和孙悦都不是“核心冠军”,所以他们的戒指价值有限。

问题来了,如何定义谁是“核心”?

“核心冠军”概念的潜台词,就是冠军之间是不等价的,重要的不是冠军这个头衔,而是你对球队的“贡献值”有多大。

如果你的贡献不足,哪怕你是冠军成员费舍尔/孙悦,我们也不认为你强过无冠的马龙/姚明。

所以说现在需要一个评价指标,来评价一位球员的“贡献值”,以此定义谁是所谓的球队“核心”。

核心之间亦有很大差别,乔丹是核心,皮蓬也是核心,两者贡献不可等价。

这个评价指标有很多种,比如“比赛观感”,比如“基础数据”,比如“高阶数据”,比如“媒体投票”。

高阶数据本质是一种模型,它为什么被发明出来?

原因在于“总冠军个数”这个模型的BUG太多,不能自圆其说的地方太多,所以我们需要更好的模型来评价球员的“贡献值”。

模型一定是有问题的(经典名言all models are wrong, but some are useful),所以说高阶数据也在不断迭代,不断修正自己的问题。

其他的评价指标,例如“看比赛”和“投票”,很容易就变成饭圈大战,比谁的粉丝多,比哪个群体的嗓门大,所以说高阶数据反而相对客观。

高阶数据当然不完美,有很多漏洞,但是我目前没看到过更客观的评价指标。

这帖子里有个人一直追着我问,为什么xxx高阶数据不好但就是能夺冠。他的问题其实有代表性。

这个问题的潜台词是:“是否夺冠”是评价一位球员个人能力的最权威指标,我们要以“冠军数”为基准。

所以我说做研究需要先对研究对象祛魅,你要研究篮球请先对“总冠军”祛魅。

有没有一种可能,是否夺冠,或者说“冠军数”从来就不是一个优秀的模型呢?

我为啥要解释一个很烂的模型?

我反问一句,为什么乔丹高阶数据强,但是打牌不如奥尼尔奶奶?

你觉得你需不需要解释这个问题?

我再把逻辑再理一遍。

回合1:

你谈总冠军个数。

我就说费舍尔(5冠)大于 马龙(0冠)。

回合2:

你说费舍尔不是“核心冠军”。

我就问你如何定义谁是“核心”?

是不是需要一个先验的评价指标,来评价一位球员的贡献大小。

回合3:

这个评价贡献值的指标应该是什么?

这就见仁见智了。

我个人认为“多种高阶数据取排名均值”就是个不错的指标,当然它不完美。

库里,邓肯,乔丹,乐布朗,奥尼尔,伦纳德,字母哥,杜兰特这些公认的强者,高阶数据都不错。

我把为什么要看高阶数据的逻辑讲清楚吧。

不少人认为应该看总冠军数,数据是次要的。

那么我可否得出结论,5冠的费舍尔强于0冠的马龙,1冠的孙悦强于0冠的姚明?

你一定会回答我,费舍尔和孙悦都不是“核心冠军”,所以他们的戒指价值有限。

问题来了,如何定义谁是“核心”?

“核心冠军”概念的潜台词,就是冠军之间是不等价的,重要的不是冠军这个头衔,而是你对球队的“贡献值”有多大。

如果你的贡献不足,哪怕你是冠军成员费舍尔/孙悦,我们也不认为你强过无冠的马龙/姚明。

所以说现在需要一个评价指标,来评价一位球员的“贡献值”,以此定义谁是所谓的球队“核心”。

核心之间亦有很大差别,乔丹是核心,皮蓬也是核心,两者贡献不可等价。

这个评价指标有很多种,比如“比赛观感”,比如“基础数据”,比如“高阶数据”,比如“媒体投票”。

高阶数据本质是一种模型,它为什么被发明出来?

原因在于“总冠军个数”这个模型的BUG太多,不能自圆其说的地方太多,所以我们需要更好的模型来评价球员的“贡献值”。

模型一定是有问题的(经典名言all models are wrong, but some are useful),所以说高阶数据也在不断迭代,不断修正自己的问题。

其他的评价指标,例如“看比赛”和“投票”,很容易就变成饭圈大战,比谁的粉丝多,比哪个群体的嗓门大,所以说高阶数据反而相对客观。

高阶数据当然不完美,有很多漏洞,但是我目前没看到过更客观的评价指标。

这帖子里有个人一直追着我问,为什么xxx高阶数据不好但就是能夺冠。他的问题其实有代表性。

这个问题的潜台词是:“是否夺冠”是评价一位球员个人能力的最权威指标,我们要以“冠军数”为基准。

所以我说做研究需要先对研究对象祛魅,你要研究篮球请先对“总冠军”祛魅。

有没有一种可能,是否夺冠,或者说“冠军数”从来就不是一个优秀的模型呢?

我为啥要解释一个很烂的模型?

我反问一句,为什么乔丹高阶数据强,但是打牌不如奥尼尔奶奶?

你觉得你需不需要解释这个问题?

我再把逻辑再理一遍。

回合1:

你谈总冠军个数。

我就说费舍尔(5冠)大于 马龙(0冠)。

回合2:

你说费舍尔不是“核心冠军”。

我就问你如何定义谁是“核心”?

是不是需要一个先验的评价指标,来评价一位球员的贡献大小。

回合3:

这个评价贡献值的指标应该是什么?

这就见仁见智了。

我个人认为“多种高阶数据取排名均值”就是个不错的指标,当然它不完美。

库里,邓肯,乔丹,乐布朗,奥尼尔,伦纳德,字母哥,杜兰特这些公认的强者,高阶数据都不错。

每当这种帖子出现的时候没有一人真正去讨论数据的计算方法,都是在输出排名逻辑。

我认可你说的,排名需要有标准的说法,否则就是乱排,只不过本贴的标准是高阶数据,有的人的标准是所谓的核心冠军,说到底,这不过是换壳输出自己的主观排名罢了。

每当这种帖子出现的时候没有一人真正去讨论数据的计算方法,都是在输出排名逻辑。

我认可你说的,排名需要有标准的说法,否则就是乱排,只不过本贴的标准是高阶数据,有的人的标准是所谓的核心冠军,说到底,这不过是换壳输出自己的主观排名罢了。

亮了(0)
回复
查看评论(3)
引用 @詹姆斯4万分1万板1万助攻 发表的:
只看此人

因为篮球是一队人的,包括教练老板辅助什么的,而你只能看到两三个人,眼神不太好啊

[图片]

查看更多

因为篮球是一队人的,包括教练老板辅助什么的,而你只能看到两三个人,眼神不太好啊

湖人15核,热火3核。

湖人15核,热火3核。

亮了(0)
回复
查看评论(1)
引用 @NewAge111DW 发表的:
只看此人

这是球队战绩啊,还真比个人,看看对位,科比完爆詹姆斯;要是真看团队成绩,科比5个总冠军也完爆詹姆斯https://www.zhihu.com/answer/728834167

[图片]

查看更多

这是球队战绩啊,还真比个人,看看对位,科比完爆詹姆斯;要是真看团队成绩,科比5个总冠军也完爆詹姆斯https://www.zhihu.com/answer/728834167

看直接交手战绩和数据不就行了,扯那么多

看直接交手战绩和数据不就行了,扯那么多

亮了(2)
回复
查看评论(1)
引用 @没有王朝的Goat 发表的:
只看此人

咋了,科比是詹姆斯历史第二人的阻碍是吗

咋了,科比是詹姆斯历史第二人的阻碍是吗

不是吧

不是吧

亮了(0)
回复
引用 @虎扑JR0896486386 发表的:
只看此人

科蜜年纪都不小了好好过生活吧啊[捂脸]看你主页整天在网络对线,下班了就让自己休息一下吧,即使让科比排进前五又怎样呢,即使全世界的人都和你一样喜欢科比能怎样呢,这是什么很自豪的事吗,真没必要的,人楼主讲啦一大堆,你来这里胡乱两个等于号,不讲理的样[捂脸]你这样最多回到你那个圈子继续捧科比喷一下詹姆斯好像自己胜利了,也只是给科比招黑啊[捂脸]

科蜜年纪都不小了好好过生活吧啊[捂脸]看你主页整天在网络对线,下班了就让自己休息一下吧,即使让科比排进前五又怎样呢,即使全世界的人都和你一样喜欢科比能怎样呢,这是什么很自豪的事吗,真没必要的,人楼主讲啦一大堆,你来这里胡乱两个等于号,不讲理的样[捂脸]你这样最多回到你那个圈子继续捧科比喷一下詹姆斯好像自己胜利了,也只是给科比招黑啊[捂脸]

我现在讲的不是理,我说的是事实啊。

32岁科比+加索尔=28岁詹姆斯+30岁韦德+29岁波什=两连冠

这不是理,这是高阶数据解释不了的事实啊。

我现在讲的不是理,我说的是事实啊。

32岁科比+加索尔=28岁詹姆斯+30岁韦德+29岁波什=两连冠

这不是理,这是高阶数据解释不了的事实啊。

亮了(0)
回复
查看评论(1)
引用 @许仙与大蛇 发表的:
只看此人

最开始吹总得分的也是他们,但是现在又说总得分不行了!

最开始吹总得分的也是他们,但是现在又说总得分不行了!

当时他们可喜欢吹数据了!当时科比成为3万➕6千➕6千时候一顿吹,现在贬低詹姆斯4万➕1万➕1万

当时他们可喜欢吹数据了!当时科比成为3万➕6千➕6千时候一顿吹,现在贬低詹姆斯4万➕1万➕1万

亮了(147)
回复
查看评论(3)
引用 @Alexstra 发表的:
只看此人

急了,醒醒吧,可不仅仅是丹子,顶级球星大部分都有效,就针对科比?

急了,醒醒吧,可不仅仅是丹子,顶级球星大部分都有效,就针对科比?

说明这个数据没有办法解释所有的现象,而不是你来质疑现象,明白了吗? 你他妈首先得有文化。

说明这个数据没有办法解释所有的现象,而不是你来质疑现象,明白了吗? 你他妈首先得有文化。

亮了(0)
回复
查看评论(1)
引用 @虎扑JR1205905482 发表的:
只看此人

游戏版本不一样,你科赶上了08-10年的历史真空期,五大超新星(一阵詹姆斯、一阵韦德、一阵保罗、一阵霍华德、一阵杜兰特)全员单核创业。当时唯一能抗衡的绿凯三巨头,09加内特报销,10年被裁判黑哨让你偷了一冠。人家宇宙勇历史最强球队也才两连冠,照你的逻辑两连湖人=宇宙勇?

怎么解释后来五大超新星羽翼丰满,阵容雄厚,怎么年仅32岁的你科瞬间萎了人见人欺?

游戏版本不一样,你科赶上了08-10年的历史真空期,五大超新星(一阵詹姆斯、一阵韦德、一阵保罗、一阵霍华德、一阵杜兰特)全员单核创业。当时唯一能抗衡的绿凯三巨头,09加内特报销,10年被裁判黑哨让你偷了一冠。人家宇宙勇历史最强球队也才两连冠,照你的逻辑两连湖人=宇宙勇?

怎么解释后来五大超新星羽翼丰满,阵容雄厚,怎么年仅32岁的你科瞬间萎了人见人欺?

09kg不报销可真不好说…如果没记错10用华莱士顶的帕金斯,帕金斯伤了。也是真的差一点点。

09kg不报销可真不好说…如果没记错10用华莱士顶的帕金斯,帕金斯伤了。也是真的差一点点。

亮了(8)
回复
查看评论(1)
Re:高阶数据究竟针对了谁?从高阶数据看历史前30,谁被低估,谁被高估了!
勇士专区最热帖
勇管可以试试报价低温
【库里单挑集锦】你绝对不能错过的视频!用15分钟带你回顾库里职业生涯超强的个人单挑表演!
新赛季勇士队有机会进季后赛吗?
9.30日报|训练营名单出炉、波杰凌晨训练
路边看到的,真帅啊
穆迪下赛季三分能有实质性进步吗?
格林是三当家 那二当家是?
勇士总经理邓利维:全力梭哈只为了略高于平均水平毫无意义
李凯尔来了,追梦的一个保险
科尔:维金斯现在正处于身体状况巅峰期 他曾帮我们赢下总冠军
勇士专区最新帖
【库里单挑集锦】你绝对不能错过的视频!用15分钟带你回顾库里职业生涯超强的个人单挑表演!
10胜0负!库里季后赛面对利拉德场均数据一览
勇管可以试试报价低温
新赛季2号位的答案是谁
看了NBA这么久预测一下新赛季谁是得分王吧
兄弟们认为嘴哥上赛季那么拉胯的原因是什么?
新赛季勇士队有机会进季后赛吗?
如果交易牧笛能换来谁?
勇士队新赛季阵容,能取得什么成绩?
普尔格林冲突,真要是有天眼就好了。
热门游戏-即点即玩
无需下载,足球经理模式一键即玩
《NBA英雄》教练系统上线啦!我选好了,看看你的