我正在使用MovieLens 100K数据集。我想有一个图表可视化最喜欢的电影类型为女性用户。就目前而言,这是通过总结他们对特定类型的电影进行了多少次评级(即他们参与了该类型)来实现的。然而,考虑到一些女性用户比其他人给出了更多的评分,可能结果并不是很真实。也许有一位女性用户真的很喜欢“戏剧”,并给出了100分。有什么方法可以标准化这些数据并真实地表示最受欢迎的流派是什么? plt.figure(figsize=(18,10))
for column in all_female_users[['Action', 'Adventure' , 'Anima