在Python中循环遍历多个txt文件并统计所选单词的频率可以通过以下步骤实现:
selected_words = ["word1", "word2", "word3"]
。os
模块的listdir
函数列出目标文件夹中的所有文件,然后使用循环逐个打开文件并读取内容。假设多个txt文件都存储在同一个文件夹中,可以使用如下代码:import os
folder_path = "path_to_folder" # 替换为文件夹的实际路径
for filename in os.listdir(folder_path):
if filename.endswith(".txt"):
file_path = os.path.join(folder_path, filename)
with open(file_path, "r") as file:
content = file.read()
# 统计频率的代码
import re
from collections import Counter
word_counts = Counter()
for filename in os.listdir(folder_path):
if filename.endswith(".txt"):
file_path = os.path.join(folder_path, filename)
with open(file_path, "r") as file:
content = file.read()
words = re.findall(r'\b\w+\b', content) # 使用正则表达式分割单词
word_counts.update(words) # 统计单词出现的频率
print(word_counts.most_common()) # 输出按频率排序的单词列表
collections
模块的Counter
类来统计单词的频率。most_common
方法可以按照频率从高到低返回一个包含单词和频率的列表。腾讯云相关产品和产品介绍链接地址:
请注意,以上链接仅作为参考,实际选择产品时需要根据需求进行评估和选择。
领取专属 10元无门槛券
手把手带您无忧上云