先叠个甲、不关乎具体球员的表现和球员的好与坏;
统计学有个分支叫因果推断,其中出发点就是相关不等于因果;举个例子,天气热导致吃雪糕的人多 天气热也导致海边游泳的人多 进而导致淹死的人多; 你不能说吃雪糕导致淹死的人 、即使两者在数据是相关的 但是不是因果关系。进一步说决策,想降低淹死的比例 应该是在海边立起警示标语 而不是让大家少吃雪糕。感兴趣的兄弟们可搜一下 辛普森悖论
回到正题,高阶数据是基于球队战绩和战术加权的 是与正负值相关的结果指标,是具备相关性的 但是不一定具备因果性的。检测因果性最常见的就是随机试验,只有所有球员随机组合并且教练战术忽略的情况下的时候 结果指标 才是完全正确 ;但是,战术可以发挥长处 避免短处的,球员的组合和战术加权也不是完全随机的;就出现了看球观感和数据有差异的情况。这也是为什么一直会有新的技术指标出来的原因;
数据是比赛内容的降维、不用去看费时看48分钟或者更长的比赛内容,看数据就可以有一个大概的了解。总会存在信息的缺失,篮球比赛是比较复杂的相互博弈系统,不只是数据的加加减减。如果高阶完全正确,最经济的建队策略 应该是全部签争冠球队的拼图球员(类似18年的巴莫特),工资不贵 高阶数据又好、而不是寻找建队基石。这也是篮球比赛有意思的地方、只看数据多无聊啊。
先叠个甲、不关乎具体球员的表现和球员的好与坏;
统计学有个分支叫因果推断,其中出发点就是相关不等于因果;举个例子,天气热导致吃雪糕的人多 天气热也导致海边游泳的人多 进而导致淹死的人多; 你不能说吃雪糕导致淹死的人 、即使两者在数据是相关的 但是不是因果关系。进一步说决策,想降低淹死的比例 应该是在海边立起警示标语 而不是让大家少吃雪糕。感兴趣的兄弟们可搜一下 辛普森悖论
回到正题,高阶数据是基于球队战绩和战术加权的 是与正负值相关的结果指标,是具备相关性的 但是不一定具备因果性的。检测因果性最常见的就是随机试验,只有所有球员随机组合并且教练战术忽略的情况下的时候 结果指标 才是完全正确 ;但是,战术可以发挥长处 避免短处的,球员的组合和战术加权也不是完全随机的;就出现了看球观感和数据有差异的情况。这也是为什么一直会有新的技术指标出来的原因;
数据是比赛内容的降维、不用去看费时看48分钟或者更长的比赛内容,看数据就可以有一个大概的了解。总会存在信息的缺失,篮球比赛是比较复杂的相互博弈系统,不只是数据的加加减减。如果高阶完全正确,最经济的建队策略 应该是全部签争冠球队的拼图球员(类似18年的巴莫特),工资不贵 高阶数据又好、而不是寻找建队基石。这也是篮球比赛有意思的地方、只看数据多无聊啊。