我把为什么要看高阶数据的逻辑讲清楚吧。
不少人认为应该看总冠军数,数据是次要的。
那么我可否得出结论,5冠的费舍尔强于0冠的马龙,1冠的孙悦强于0冠的姚明?
你一定会回答我,费舍尔和孙悦都不是“核心冠军”,所以他们的戒指价值有限。
问题来了,如何定义谁是“核心”?
“核心冠军”概念的潜台词,就是冠军之间是不等价的,重要的不是冠军这个头衔,而是你对球队的“贡献值”有多大。
如果你的贡献不足,哪怕你是冠军成员费舍尔/孙悦,我们也不认为你强过无冠的马龙/姚明。
所以说现在需要一个评价指标,来评价一位球员的“贡献值”,以此定义谁是所谓的球队“核心”。
核心之间亦有很大差别,乔丹是核心,皮蓬也是核心,两者贡献不可等价。
这个评价指标有很多种,比如“比赛观感”,比如“基础数据”,比如“高阶数据”,比如“媒体投票”。
高阶数据本质是一种模型,它为什么被发明出来?
原因在于“总冠军个数”这个模型的BUG太多,不能自圆其说的地方太多,所以我们需要更好的模型来评价球员的“贡献值”。
模型一定是有问题的(经典名言all models are wrong, but some are useful),所以说高阶数据也在不断迭代,不断修正自己的问题。
其他的评价指标,例如“看比赛”和“投票”,很容易就变成饭圈大战,比谁的粉丝多,比哪个群体的嗓门大,所以说高阶数据反而相对客观。
高阶数据当然不完美,有很多漏洞,但是我目前没看到过更客观的评价指标。
这帖子里有个人一直追着我问,为什么xxx高阶数据不好但就是能夺冠。他的问题其实有代表性。
这个问题的潜台词是:“是否夺冠”是评价一位球员个人能力的最权威指标,我们要以“冠军数”为基准。
所以我说做研究需要先对研究对象祛魅,你要研究篮球请先对“总冠军”祛魅。
有没有一种可能,是否夺冠,或者说“冠军数”从来就不是一个优秀的模型呢?
我为啥要解释一个很烂的模型?
我反问一句,为什么乔丹高阶数据强,但是打牌不如奥尼尔奶奶?
你觉得你需不需要解释这个问题?
我再把逻辑再理一遍。
回合1:
你谈总冠军个数。
我就说费舍尔(5冠)大于 马龙(0冠)。
回合2:
你说费舍尔不是“核心冠军”。
我就问你如何定义谁是“核心”?
是不是需要一个先验的评价指标,来评价一位球员的贡献大小。
回合3:
这个评价贡献值的指标应该是什么?
这就见仁见智了。
我个人认为“多种高阶数据取排名均值”就是个不错的指标,当然它不完美。
库里,邓肯,乔丹,乐布朗,奥尼尔,伦纳德,字母哥,杜兰特这些公认的强者,高阶数据都不错。