一直能听到一种说法,所谓的某人有XX支本垒打只能在某球场打出去,以讹传讹居多,揣着明白装糊涂的也有。那么我们根据STATCAST相关数据简单分析一下。
首先介绍一下xHR这个数据(有种预感这个介绍完了可能后面都不需要了)。因为大联盟每个球场形状都不一样,有的左外野比较远,有的右外野比较远,一直是一个争议的焦点。为了去推测实际击球的情况,那么就是假定这个球在30个球场分别击出,然后把全垒打的可能加起来。(想了想还是直接机翻一下该页面的介绍算了)。
Statcast本垒打追踪器
这个工具可以让你根据球的轨迹和球场的各种墙壁高度和距离,查看一名球员在大满贯赛事周围的30个公园里击出的击球中有多少是本垒打。这些数字包括常规赛和季后赛。 您可以从两种视图中选择:标准视图,它纯粹基于观察到的球轨迹;调整视图,它根据此处显示的数据应用环境变量。 “调整后”的类型意味着每个本垒打轨迹都会被改变,以承认它被击中的场地的环境背景。此调整基于我们公园因子排行榜上显示的数据。
这个数据会统计所有球员每一次界内长打(不管结果是全垒打、接杀还是其他安打),统计在多少个球场会成为本垒打,不考虑被美技接杀的情况。如果一个长球在3个球场会是本垒打,那么这个球的xHR就是0.1,如果在30个球场都是本垒打,xHR就是1.0。球场因素除了考虑各位置距离,还考虑海拔、温度等,尽量准确。把一个球员本赛季所有长球的xHR加起来,和实际HR进行比较,得到下面图1.
随便列几个,法官 实际 HR 56,XHR52.3,实际高于平均预期3.7,看起来确实是有红利
第二名 大谷 实际HR 53 XHR48.6,实际高于平均预期4.4,啊?怎么红利还更多了。
再看第四名SOTO 实际40 预期44.2……你在洋基咋还吃亏了。
下面为了省事,我们直接看HR-XHR这个数据,看看哪些人吃了最多红利。
可以看到全垒打名列前茅的,比如金鸟双星、大谷、法官都在,但是比较奇怪的是,某球队只打10支左右的,居然能超过预期这么多,可见这个球场是很有特色的。
最后看预期低于实际最多的,可以看出皇家包揽前两名,这个球场对于打者是比较严苛的。然后洋基和金鸟也有打者上榜,可见每个人对球场的适应情况也不一样。
从这一个简单的数据统计来看,全垒打这种低阶数据里面确实存在着很大的偶然性,球场的情况各不相同,球员选择最适合球场的打法也没错。xHR这个数据虽然也不是很合理,但是比单纯比HR的,已经好上太多了。当然这种数据不够直观,在传播方面有很大难度。可能的情况下,还是多使用高阶数据进行讨论
如果大家有兴趣,一会我再把所谓互换球场的数据发一下,看个乐就好。
一直能听到一种说法,所谓的某人有XX支本垒打只能在某球场打出去,以讹传讹居多,揣着明白装糊涂的也有。那么我们根据STATCAST相关数据简单分析一下。
首先介绍一下xHR这个数据(有种预感这个介绍完了可能后面都不需要了)。因为大联盟每个球场形状都不一样,有的左外野比较远,有的右外野比较远,一直是一个争议的焦点。为了去推测实际击球的情况,那么就是假定这个球在30个球场分别击出,然后把全垒打的可能加起来。(想了想还是直接机翻一下该页面的介绍算了)。
Statcast本垒打追踪器
这个工具可以让你根据球的轨迹和球场的各种墙壁高度和距离,查看一名球员在大满贯赛事周围的30个公园里击出的击球中有多少是本垒打。这些数字包括常规赛和季后赛。 您可以从两种视图中选择:标准视图,它纯粹基于观察到的球轨迹;调整视图,它根据此处显示的数据应用环境变量。 “调整后”的类型意味着每个本垒打轨迹都会被改变,以承认它被击中的场地的环境背景。此调整基于我们公园因子排行榜上显示的数据。
这个数据会统计所有球员每一次界内长打(不管结果是全垒打、接杀还是其他安打),统计在多少个球场会成为本垒打,不考虑被美技接杀的情况。如果一个长球在3个球场会是本垒打,那么这个球的xHR就是0.1,如果在30个球场都是本垒打,xHR就是1.0。球场因素除了考虑各位置距离,还考虑海拔、温度等,尽量准确。把一个球员本赛季所有长球的xHR加起来,和实际HR进行比较,得到下面图1.
随便列几个,法官 实际 HR 56,XHR52.3,实际高于平均预期3.7,看起来确实是有红利
第二名 大谷 实际HR 53 XHR48.6,实际高于平均预期4.4,啊?怎么红利还更多了。
再看第四名SOTO 实际40 预期44.2……你在洋基咋还吃亏了。
下面为了省事,我们直接看HR-XHR这个数据,看看哪些人吃了最多红利。
可以看到全垒打名列前茅的,比如金鸟双星、大谷、法官都在,但是比较奇怪的是,某球队只打10支左右的,居然能超过预期这么多,可见这个球场是很有特色的。
最后看预期低于实际最多的,可以看出皇家包揽前两名,这个球场对于打者是比较严苛的。然后洋基和金鸟也有打者上榜,可见每个人对球场的适应情况也不一样。
从这一个简单的数据统计来看,全垒打这种低阶数据里面确实存在着很大的偶然性,球场的情况各不相同,球员选择最适合球场的打法也没错。xHR这个数据虽然也不是很合理,但是比单纯比HR的,已经好上太多了。当然这种数据不够直观,在传播方面有很大难度。可能的情况下,还是多使用高阶数据进行讨论
如果大家有兴趣,一会我再把所谓互换球场的数据发一下,看个乐就好。