楼主,我有两个问题和一个可能的建议。
1. 游戏玩家的性别是如何确定的?我看楼主并没有对采集到的数据做处理或其他分析,直接统计出了性别人数。我觉得这可能会导致对性别判断的偏差,因为账号显示性别和玩家实际性别可能有区别,且账号可能由人为代打,这对数据采集会有影响。
2. 贝叶斯理论如何应用在这里的数据分析?先验和后验认识是对哪个变量的?以及本分析对先验分布的假设是否敏感?
有一个小建议,对于我的第一个问题,可以将账号显示性别作为采集数据的一部分,而将玩家真实性别作为缺失变量。由于EM算法和基于贝叶斯理论对带有缺失数据的问题都有良好表现,我觉得可以拿来用做进一步探索。
总体而言楼主的project非常精彩,看得人非常开心🤣虎扑就需要这样有水平有情怀还幽默的jr
楼主,我有两个问题和一个可能的建议。
1. 游戏玩家的性别是如何确定的?我看楼主并没有对采集到的数据做处理或其他分析,直接统计出了性别人数。我觉得这可能会导致对性别判断的偏差,因为账号显示性别和玩家实际性别可能有区别,且账号可能由人为代打,这对数据采集会有影响。
2. 贝叶斯理论如何应用在这里的数据分析?先验和后验认识是对哪个变量的?以及本分析对先验分布的假设是否敏感?
有一个小建议,对于我的第一个问题,可以将账号显示性别作为采集数据的一部分,而将玩家真实性别作为缺失变量。由于EM算法和基于贝叶斯理论对带有缺失数据的问题都有良好表现,我觉得可以拿来用做进一步探索。
总体而言楼主的project非常精彩,看得人非常开心🤣虎扑就需要这样有水平有情怀还幽默的jr