在Python中,您可以使用pandas库来构造一个允许您读取txt文件并将每1000行存储为自己的dataframe的循环。以下是一个示例代码:
import pandas as pd
# 读取txt文件,以制表符分隔
df_list = []
chunk_size = 1000
with open('your_file.txt', 'r') as file:
chunk = []
for line in file:
chunk.append(line.strip().split('\t'))
if len(chunk) == chunk_size:
df_list.append(pd.DataFrame(chunk))
chunk = []
if chunk:
df_list.append(pd.DataFrame(chunk))
# 将每个chunk的dataframe存储为自己的dataframe
for i, df_chunk in enumerate(df_list):
df_chunk.to_csv(f'chunk_{i}.csv', index=False)
上述代码首先打开txt文件,并逐行读取文件内容。每读取一行,将其以制表符为分隔符进行分割,并添加到一个chunk列表中。当chunk列表的长度达到1000行时,将其转换为一个dataframe,并将该dataframe添加到df_list列表中。最后,将每个chunk的dataframe存储为自己的csv文件。
这样,您就可以将txt文件按照每1000行存储为自己的dataframe,并保存为独立的csv文件。
领取专属 10元无门槛券
手把手带您无忧上云