从包含不同类别的txt文件创建字典的方法可以通过以下步骤实现:
下面是一个示例代码,演示如何从包含不同类别的txt文件创建字典:
import os
# 定义字典
dictionary = {}
# 定义包含不同类别txt文件的文件夹路径
folder_path = 'path/to/txt/files'
# 遍历文件夹中的txt文件
for file_name in os.listdir(folder_path):
file_path = os.path.join(folder_path, file_name)
# 判断是否为txt文件
if file_name.endswith('.txt'):
# 获取类别标签
category = file_name.split('.')[0]
# 打开文件并逐行读取内容
with open(file_path, 'r') as file:
lines = file.readlines()
# 处理文本并添加到字典中
processed_text = []
for line in lines:
# 文本处理操作,如分词、去除标点符号、转换为小写等
processed_line = line.strip().lower()
processed_text.append(processed_line)
# 将处理后的文本添加到字典中
if category not in dictionary:
dictionary[category] = processed_text
else:
dictionary[category].extend(processed_text)
# 打印字典内容
for category, text_list in dictionary.items():
print(category)
for text in text_list:
print(text)
请注意,上述示例代码仅为演示目的,实际应用中可能需要根据具体需求进行适当的修改和优化。另外,示例代码中没有涉及腾讯云相关产品,因此无需提供相关链接。
领取专属 10元无门槛券
手把手带您无忧上云