如何按行数拆分(.csv)文件，但保留每个拆分子文件上的第一行(列标题)？python

在Python中，可以使用csv模块来处理.csv文件，并按行数拆分文件并保留每个拆分子文件上的第一行（列标题）。下面是一个示例代码：

import csv
import os

def split_csv_file(input_file, output_dir, rows_per_file):
    # 创建输出目录
    os.makedirs(output_dir, exist_ok=True)

    with open(input_file, 'r', newline='') as file:
        reader = csv.reader(file)
        header = next(reader)  # 读取第一行（列标题）

        file_index = 1
        row_count = 0
        output_file = None

        for row in reader:
            # 如果达到指定的行数，创建一个新的拆分子文件
            if row_count % rows_per_file == 0:
                if output_file:
                    output_file.close()
                output_file = open(os.path.join(output_dir, f'output_{file_index}.csv'), 'w', newline='')
                writer = csv.writer(output_file)
                writer.writerow(header)  # 写入列标题到每个拆分子文件
                file_index += 1

            writer.writerow(row)
            row_count += 1

        if output_file:
            output_file.close()

# 示例用法
input_file = 'input.csv'  # 输入文件路径
output_dir = 'output'  # 输出目录路径
rows_per_file = 1000  # 每个拆分子文件的行数

split_csv_file(input_file, output_dir, rows_per_file)

上述代码中，split_csv_file函数接受输入文件路径、输出目录路径和每个拆分子文件的行数作为参数。它首先创建输出目录，然后使用csv.reader读取输入文件的内容。通过迭代读取每一行数据，并根据指定的行数进行拆分，将每个拆分子文件的第一行写入列标题，然后将每一行数据写入相应的拆分子文件中。

请注意，上述代码仅提供了一个基本的示例，你可以根据实际需求进行修改和扩展。

如何按行数拆分(.csv)文件，但保留每个拆分子文件上的第一行(列标题)？python

、、

我一直在尝试基于我找到的解决方案创建这个python csv拆分器。第一个问题是保留每个子列表中的第一行(列标题)。它不会保留第一行作为每个文件拆分中的“头”。第二个问题是，我试图将拆分的文件发送到脚本

浏览 162提问于2021-09-17得票数 0

1回答

数据文件的标题在排序时消失。

、、、

我有一个带有行数据的csv文件。第一行是列的标题。我想按某些参数(特别是第一列)对数据进行排序，但当然要将头保持在原来的位置。当我执行以下操作时，标题将完全消失，并且不包含在输出文件中。有谁能建议如何保留标题，但跳过它并对其余的</

浏览 2提问于2014-04-13得票数 0

2回答

如何使用python将.csv文件转换为.db文件？

、、、

我希望使用python将csv文件转换为db (数据库)文件。我该怎么做？

浏览 2提问于2014-03-16得票数 0

回答已采纳

3回答

使用pysftp拆分SFTP目录中的文本文件

、、

我试图使用python将大小为100 MB的文本文件(具有唯一行)拆分为10个大小相同的文件，但我无法找到合适的方法。请告诉我如何从SFTP目录中读取/拆分文件，并将所有文件放回FTP目录本身。

浏览 5提问于2020-08-10得票数 4

回答已采纳

3回答

将CSV文件拆分成1 1gb或更少的文件？

、、、、

每个月我们都会收到一个大于2 2GB的发票文件，我们的印刷厂有1.1 2GB的限制，目前所有这些过程都是手工完成的。这个应用程序的第一步是能够将这些巨大的2 1GB文件分成有限的1 1GB文件，这样它就不会破坏每个CSV条目，并且每个文件从头到尾都是可读的，而不会破坏任何数据。我如何<

浏览 1提问于2011-03-08得票数 0

回答已采纳

1回答

读取.dat文件并使用“\”python分隔列

、、、、

我试图在python中读取我的.dat文件中的第0列。该文件列将被“\”分隔。例如：我有以下内容可以读取数据并将列按“\”拆分当我试图通过ref[0:]访问数据时，将输出第一

浏览 3提问于2022-10-03得票数 0

回答已采纳

1回答

下一步(读取器)删除第一行数据

、、

我正在编写一个python脚本，该脚本读取csv文件并遍历任何带有不等式的单元格，并添加一个新列并将该不等式拆分到新的单元格中。我想忽略csv的第一行作为它的标题，但是usinig (Reader)也删除了第一行数据。reader = csv.DictReader(inFile) first_row =

浏览 1提问于2022-07-08得票数 1

1回答

PHP删除CSV的第二行并重写没有该行的CSV

、、、、

我有一个脚本，它从CSV文件的第2行/第2行创建一个数组，保持标题不变，然后执行它的操作。太棒了！$cnt = 0; if (($handle = fopen("A

浏览 2提问于2013-11-24得票数 1

3回答

使用powershell拆分CSV

、

我有很大的CSV文件(每个50-500 MB )。在这些设备上运行复杂的power shell命令会耗时很长时间，并且/或者会遇到内存问题。处理数据需要按公共字段进行分组，比如在ColumnA中。因此，假设数据已经按该列进行了排序，如果我随机拆分这些文件(即每行x-1000行)，那么匹配的条目仍然可能以不同的部分结束。在A中有数千个不同的</e

浏览 0提问于2013-02-07得票数 3

回答已采纳

3回答

离开标题时跳过powershell中的行

我有一个46000行8列的csv文件。我需要保持行数不变(46k)；因此，在添加新行时，我取出第一行(基于最旧的日期)，保留标题，以便可以将新数据分配到正确的列。Get-Content -Path $path | Set-Content -Path $new-path ...it也去掉了头文件</em

浏览 15提问于2021-01-06得票数 1

1回答

R:读取csv文件时删除页眉、页脚和零星列标题

我有一堆csv文件需要阅读。每个文件都有一个标题，大多数文件都有页脚，一半的文件有零星出现在文件主体中的列标题。我想删除页眉、页脚和零星的列标题。我几乎在我所有的问题和答案中都包含了可重现的例子，但在这种情况下，由于我正在读取外部文件，我不确定如何做到这一点。 每个<

浏览 0提问于2012-06-16得票数 0

回答已采纳

2回答

将排序的惰性帧分割成较小的块，保持整个组

数据由第一列排序，第一列是一个id列，它总是包含相同值的13个连续条目。重要的是要避免将一组ids分割成不同的文件。这意味着我们可以在13、26、39(等)位置拆分文件，并保存整个ids组。理想情况下，我希望每个文件的大小都在100 in左右。实际的df.shape是(5965869, 193)，假设每个<em

浏览 6提问于2022-07-10得票数 1

1回答

使用python合并CSV

、、、

我正在尝试使用python合并多个CSV。我遇到的问题是，每个文件都有3行头。在合并这些文件之前，我如何处理掉所有文件的第二行和第三行标题(只将主标题保留在第一行或每个文件中)？谢谢!

浏览 8提问于2022-01-11得票数 0

1回答

如何为dataframe中的每一列创建csv文件？

、、、

我在VSCode中使用Python。我读了一个CSV文件，并把它转换成股票市场收盘价的数据。第一栏是日期栏，其他是每个股票符号收盘价。我想用多列将这个数据分割成不同的.csv文件。每个新的.csv文件将根据每个股票符号列的标题名称命名。例如，下面是dataframe的

浏览 2提问于2020-09-12得票数 0

回答已采纳

2回答

用jQuery循环遍历列

、、

我试图遍历csv文件的列和行，但只得到第一行的结果。name2 65%name4 65% url: 'test.csv', type: "GE

浏览 4提问于2015-09-03得票数 0

回答已采纳

1回答

CSV助手如何读取几个头行的csv文件

、、、、

我使用CsvHelper在不同的位置使用多个头行编写csv文件(标题有一定数量的列，但名称不同)。每个标题后的行数是不同的。是否有可能使用CsvHelper在csv文件中的不同头行上查找/迭代(可能通过对头列的名称或部分名称进行搜

浏览 1提问于2020-02-27得票数 2

回答已采纳

4回答

JAVA代码将CSV文件拆分为不同的CSV文件，并将单个列数据从父文件提取到子文件

、

我有一个CSV文件，其中包含近10000行数据。我想根据总行数将该文件拆分为10个不同的CSV文件，这样每个文件都可以包含1000行数据，按顺序排列的第一个文件应该有1-1000行，第二个文件应该包含1001-2000行等等。另外，这10个不同的</

浏览 2提问于2017-07-11得票数 0

回答已采纳

1回答

有没有办法使用pandas导入几个.txt文件，每个文件都变成一个单独的数据帧？

、、、、

我必须处理每个包含2列和631行的50+ .txt文件，在进行数据分析之前，我必须对每个文件进行不同的操作(有时是相互操作)。我希望有一种方法可以在pandas中导入不同数据框架下的每个文本文件，而不是单独导入。我使用skiprows=1是因为我必须删除标题，这是每个.txt文件的第一

浏览 15提问于2020-07-15得票数 0

1回答

PostgreSQL - CSV文件导入错误

、、

我正在尝试将csv文件导入PostgreSQL表(9.2)。我发现一个列值有错误的输入语法，但似乎PostgreSQL与列及其值不匹配。我使用以下命令导入CSV： \copy project_task from '/home/user/downloads/project_task_export.csv' WITH DELIMITER ',' CSV HEA

浏览 3提问于2013-03-07得票数 4

1回答

为什么我的csv拆分脚本在标题之前返回额外的行？

、

我有一个定期下载的csv文件。csv预期将被拆分，因此它被拆分为5000个块，包括每个拆分CSV顶部的标头。这意味着我的标题行是15001、10002、15003、20004，等等。我已经写了一个php脚本来做拆分文件的工作，但是我似乎不能捕捉到只在头部包含头部的模式。 <?data)

浏览 8提问于2019-01-16得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何按行数拆分(.csv)文件，但保留每个拆分子文件上的第一行(列标题)？python

相关·内容

如何按行数拆分(.csv)文件，但保留每个拆分子文件上的第一行(列标题)？python

数据文件的标题在排序时消失。

如何使用python将.csv文件转换为.db文件？

使用pysftp拆分SFTP目录中的文本文件

将CSV文件拆分成1 1gb或更少的文件？

读取.dat文件并使用“\”python分隔列

下一步(读取器)删除第一行数据

PHP删除CSV的第二行并重写没有该行的CSV

使用powershell拆分CSV

离开标题时跳过powershell中的行

R:读取csv文件时删除页眉、页脚和零星列标题

将排序的惰性帧分割成较小的块，保持整个组

使用python合并CSV

如何为dataframe中的每一列创建csv文件？

用jQuery循环遍历列

CSV助手如何读取几个头行的csv文件

JAVA代码将CSV文件拆分为不同的CSV文件，并将单个列数据从父文件提取到子文件

有没有办法使用pandas导入几个.txt文件，每个文件都变成一个单独的数据帧？

PostgreSQL - CSV文件导入错误

为什么我的csv拆分脚本在标题之前返回额外的行？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐