首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python - count列表中字符串的词频,列表中的单词数各不相同

Python中可以使用collections模块中的Counter类来统计列表中字符串的词频。Counter类是一个字典的子类,用于统计可哈希对象的数量。

首先,需要导入collections模块:

代码语言:txt
复制
import collections

然后,定义一个列表count,其中包含多个字符串。假设列表为:

代码语言:txt
复制
count = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']

接下来,使用Counter类创建一个计数器对象:

代码语言:txt
复制
counter = collections.Counter(count)

可以通过调用计数器对象的most_common()方法来获取按照词频降序排列的元素列表。例如,获取列表中出现频率最高的两个元素:

代码语言:txt
复制
most_common = counter.most_common(2)

最后,可以打印出结果:

代码语言:txt
复制
for item in most_common:
    print(item[0], ":", item[1])

完整代码如下:

代码语言:txt
复制
import collections

count = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
counter = collections.Counter(count)
most_common = counter.most_common(2)

for item in most_common:
    print(item[0], ":", item[1])

输出结果为:

代码语言:txt
复制
apple : 3
banana : 2

这段代码中,首先导入了collections模块,然后定义了一个列表count,其中包含了多个字符串。接着,使用Counter类创建了一个计数器对象counter,并调用most_common()方法获取出现频率最高的两个元素。最后,通过循环遍历输出了每个元素及其对应的词频。

推荐的腾讯云相关产品:腾讯云云服务器(CVM)和腾讯云云数据库MySQL。

  • 腾讯云云服务器(CVM):腾讯云提供的弹性计算服务,可根据实际需求弹性调整计算资源,支持多种操作系统和应用场景。详情请参考腾讯云云服务器(CVM)
  • 腾讯云云数据库MySQL:腾讯云提供的高性能、可扩展的云数据库服务,适用于各种规模的应用程序。详情请参考腾讯云云数据库MySQL
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 领券