Python中可以使用collections模块中的Counter类来统计列表中字符串的词频。Counter类是一个字典的子类,用于统计可哈希对象的数量。
首先,需要导入collections模块:
import collections
然后,定义一个列表count,其中包含多个字符串。假设列表为:
count = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
接下来,使用Counter类创建一个计数器对象:
counter = collections.Counter(count)
可以通过调用计数器对象的most_common()方法来获取按照词频降序排列的元素列表。例如,获取列表中出现频率最高的两个元素:
most_common = counter.most_common(2)
最后,可以打印出结果:
for item in most_common:
print(item[0], ":", item[1])
完整代码如下:
import collections
count = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
counter = collections.Counter(count)
most_common = counter.most_common(2)
for item in most_common:
print(item[0], ":", item[1])
输出结果为:
apple : 3
banana : 2
这段代码中,首先导入了collections模块,然后定义了一个列表count,其中包含了多个字符串。接着,使用Counter类创建了一个计数器对象counter,并调用most_common()方法获取出现频率最高的两个元素。最后,通过循环遍历输出了每个元素及其对应的词频。
推荐的腾讯云相关产品:腾讯云云服务器(CVM)和腾讯云云数据库MySQL。
领取专属 10元无门槛券
手把手带您无忧上云