可以通过以下步骤实现:
import os
import json
def merge_jsonl_files(folder_path, output_file):
merged_data = []
for file_name in os.listdir(folder_path):
if file_name.endswith('.jsonl'):
file_path = os.path.join(folder_path, file_name)
with open(file_path, 'r') as file:
for line in file:
merged_data.append(json.loads(line))
with open(output_file, 'w') as output:
for data in merged_data:
output.write(json.dumps(data) + '\n')
folder_path = '/path/to/folder'
output_file = '/path/to/output.jsonl'
merge_jsonl_files(folder_path, output_file)
这样,函数将会遍历指定文件夹中的所有JSONL文件,并将它们合并到一个输出文件中。输出文件中的每一行都是一个JSON对象。
合并JSONL文件的优势是可以将多个文件中的数据整合到一个文件中,方便后续的数据处理和分析。
应用场景:
推荐的腾讯云相关产品:腾讯云对象存储(COS)
领取专属 10元无门槛券
手把手带您无忧上云