df = DataFrame({'类别':['水果','水果','水果','蔬菜','蔬菜','肉类','肉类'], '产地':['美国','中国','中国','中国','新西兰...','新西兰','美国'], '水果':['苹果','梨','草莓','番茄','黄瓜','羊肉','牛肉'], '数量':[5,5,9,3,2,10,8...0 美国 5 5 苹果 水果1 中国 5 5 梨 水果2 中国 10 9 草莓 水果3 中国 3 3 番茄 蔬菜4 新西兰...3 2 黄瓜 蔬菜5 新西兰 13 10 羊肉 肉类6 美国 20 8 牛肉 肉类
按照类别为index, 产地为columns,统计词条出现频次...:
pd.crosstab(df['类别'],df['产地'],margins=True)
比如类别为水果,产地在中国的出现频次为2,结果如下:
产地 中国 新西兰 美国 All类别