首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >C语言基础:(二十三)文件操作

C语言基础:(二十三)文件操作

作者头像
_OP_CHEN
发布2026-01-14 09:26:22
发布2026-01-14 09:26:22
1230
举报
文章被收录于专栏:C++C++

前言

C语言作为一门经典的编程语言,其文件操作功能在数据处理和持久化存储中扮演着重要角色。无论是简单的文本读写,还是复杂的二进制文件处理,C语言提供了一套强大而灵活的标准库函数,如fopenfreadfwritefclose等,使得开发者能够高效地管理文件系统资源。掌握文件操作不仅有助于实现数据的长期保存和共享,还能为日志记录、配置文件解析等实际应用场景提供支持。本文将探讨C语言文件操作的核心概念、常见函数的使用方法以及最佳实践,下面就让我们正式开始吧!


一、为什么使用文件?

如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用文件。

二、什么是文件?

磁盘(硬盘)上的文件是文件。

但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。

2.1 程序文件

程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2 数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

本章讨论的是数据文件。

在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。

其实我们有时候会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。

2.3 文件名

一个文件要有一个唯一的文件标识,以便用户识别和利用。

文件名包含3部分:文件路径+文件名主干+文件后缀

例如:c:/code/text.txt

为了方便起见,文件标识常被称为文件名

三、二进制文件和文本文件

根据数据的组织形式,数据文件被称为文本文件二进制文件

数据在内存中以二进制的形式存储,若不加转换的输出到外存的文件中,就是二进制文件

如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件

那么一个数据在文件中是怎么存储的呢?

字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。

如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节。如下图所示:

测试代码如下:

代码语言:javascript
复制
#include <stdio.h>
int main()
{
    int a = 10000;
    FILE* pf = fopen("test.txt", "wb");
    fwrite(&a, 4, 1, pf);//⼆进制的形式写到⽂件中
    fclose(pf);
    pf = NULL;
    return 0;
}

在VS上打开二进制文件:

四、文件的打开和关闭

4.1 流和标准流

4.1.1 流

我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。

C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。

一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要先打开流,然后操作。

4.1.2 标准流

那么为什么我们从键盘输入数据,向屏幕上输出数据,却并没有打开流呢?

那是因为C语言程序在启动的时候,默认打开了3个流:

  • stdin - 标准输入流,在大多数的环境中从键盘输入,scanf就是从标准输入流中读取数据。
  • stdout - 标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
  • stderr - 标准错误流,大多数环境中输出到显示器界面。

这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作了。

stdin、stdout、stderr三个流的类型为:FILE*,通常称为文件指针

C语言中,就是通过FILE*的文件指针来维护流的各种操作的。

4.2 文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”

每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名为FILE

例如,VS2013编译环境提供的stdio.h头文件中有以下的文件类型声明:

代码语言:javascript
复制
struct _iobuf {
    char *_ptr;
    int _cnt;
    char *_base;
    int _flag;
    int _file;
    int _charbuf;
    int _bufsiz;
    char *_tmpfname;
};

typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。

每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。

一般都是通过一个FILE指针来维护这个FILE结构的变量,这样使用起来更加方便。

下面我们可以创建一个FILE*类型的指针变量,如下所示:

代码语言:javascript
复制
FILE* pf;//⽂件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够间接找到与它关联的文件

比如:

4.3 文件的打开和关闭

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件

在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

ANSI C规定使用fopen函数来打开文件,fclose来关闭文件。函数原型如下:

代码语言:javascript
复制
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );

//关闭⽂件
int fclose ( FILE * stream );

mode表示文件的打开模式,下面都是文件的打开模式:

文件使用方式

含义

如果指定文件不存在

“r” (只读)

为了输入数据,打开一个已经存在的文本文件

出错

“w”(只写)

为了输出数据,打开一个文本文件

建立一个新的文件

“a” (追加)

向文本文件尾添加数据

建立一个新的文件

“rb”(只读)

为了输入数据,打开一个二进制文件

出错

“wb”(只写)

为了输出数据,打开一个二进制文件

建立一个新的文件

“ab”(追加)

向一个二进制文件尾添加数据

建立一个新的文件

“r+”(读写)

为了读和写,打开一个文本文件

出错

“w+”(读写)

为了读和写,建立一个新的文件

建立一个新的文件

“a+”(读写)

打开一个文件,在文件尾进行读写

建立一个新的文件

“rb+”(读写)

为了读和写,打开一个二进制文件

出错

“wb+”(读写)

为了渡河写,新建一个新的二进制文件

建立一个新的文件

“ab+”(读写)

打开一个二进制文件,在文件尾进行读和写

建立一个新的文件

示例代码如下:

代码语言:javascript
复制
/* fopen fclose example */
#include <stdio.h>
int main ()
{
    FILE * pFile;
    //打开⽂件
    pFile = fopen ("myfile.txt","w");
    //⽂件操作
    if (pFile!=NULL)
    {
        fputs ("fopen example",pFile);
        //关闭⽂件
        fclose (pFile);
    } 
    return 0;
}

五、文件的顺序读写

5.1 顺序读写函数介绍

函数名

功能

适用于

fgetc

字符输入函数

所有输入流

fputc

字符输出函数

所有输出流

fgetc

文本行输入函数

所有输入流

fputc

文本行输出函数

所有输出流

fscanf

格式化输入函数

所有输入流

fprintf

格式化输出函数

所有输出流

fread

二进制输入

文件输入流

fwrite

二进制输出

文件输出流

上面所说的适用于所有输入流一般指适用于标准输入流和其他输入流(如文件输入流);所有输出流一般指适用于标准输出流和其他输出流(如文件输出流)。

5.2 对比一组函数:

scanf / fscanf / sscanf printf / fprintf / sprintf

特性维度

printf 家族 (输出/生成)

scanf 家族 (输入/解析)

核心关系与说明

核心功能

将数据按格式输出到不同目的地

从不同来源按格式读取并解析数据

功能互逆

函数与目的地/源

一一对应

∙ 标准I/O

printf(format, ...) 目的地: 标准输出(屏幕)

scanf(format, ...) 来源: 标准输入(键盘)

基础控制台交互

∙ 文件I/O

fprintf(FILE* stream, format, ...) 目的地: 任何文件流

fscanf(FILE* stream, format, ...) 来源: 任何文件流

文件读写核心函数

∙ 字符串I/O

sprintf(char* str, format, ...) 目的地: 字符数组(字符串) snprintf(str, size, format, ...) 目的地: 字符数组(安全)

sscanf(const char* str, format, ...) 来源: 字符数组(字符串)

字符串处理与转换利器

关键参数

值 (Variable):要输出的数据本身

地址 (Address):存储结果的变量地址

scanf家族必须使用&取地址 (数组名除外)

返回值

成功输出的字符数 (Character count)

成功匹配并赋值的项目数 (Item count)

返回值可用于判断操作成功与否

主要风险

sprintf:缓冲区溢出 (目标数组空间不足)

scanf/fscanf:缓冲区溢出 (读取字符串未限制宽度) 输入流残留导致后续读取错误

安全实践

永远使用snprintf代替sprintf (指定缓冲区大小)

始终指定域宽 (如用%49s代替%s) 检查返回值并清空输入流

sscanf因来源是字符串,相对更可控

六、文件的随机读写

6.1 fseek

根据文件指针的位置和偏移量来定位文件指针(文件内容的光标)。函数原型如下:

代码语言:javascript
复制
int fseek ( FILE * stream, long int offset, int origin );

举个例子:

代码语言:javascript
复制
/* fseek example */
#include <stdio.h>

int main ()
{
    FILE * pFile;
    pFile = fopen ( "example.txt" , "wb" );
    fputs ( "This is an apple." , pFile );
    fseek ( pFile , 9 , SEEK_SET );
    fputs ( " sam" , pFile );
    fclose ( pFile );
    return 0;
}

程序首先创建并打开一个名为"example.txt"的二进制文件,然后写入初始字符串"This is an apple."。此时文件内容完整,文件指针位于文件末尾。关键的一步是使用`fseek(pFile, 9, SEEK_SET)`将文件指针重新定位到离文件开头第9个字节的位置,也就是单词"an"之前的位置。随后程序写入新的字符串" sam",这个过程会覆盖原来该位置的"an apple"部分内容。最终,文件内容从原来的"This is an apple."变成了"This is a sample."。

通过这个例子,我们可以看到`fseek`函数的强大功能:它允许我们像数组一样随机访问文件的任何位置,其中第二个参数指定偏移量,第三个参数`SEEK_SET`表示从文件开头计算偏移,其他可选值还有`SEEK_CUR`(从当前位置)和`SEEK_END`(从文件末尾)。这种随机访问能力对于处理大型文件或需要修改文件中特定数据的场景非常有用,避免了重新写入整个文件的低效操作。

6.2 ftell

返回文件指针相对于起始位置的偏移量。函数原型如下所示:

代码语言:javascript
复制
long int ftell ( FILE * stream );

举个例子:

代码语言:javascript
复制
/* ftell example : getting size of a file */
#include <stdio.h>

int main ()
{
    FILE * pFile;
    long size;
    pFile = fopen ("myfile.txt","rb");
    if (pFile==NULL)
        perror ("Error opening file");
    else
    {
        fseek (pFile, 0, SEEK_END); // non-portable
        size=ftell (pFile);
        fclose (pFile);
        printf ("Size of myfile.txt: %ld bytes.\n",size);
    } 
    return 0;
}

这段程序首先以二进制读取模式打开名为"myfile.txt"的文件,并进行错误检查,如果文件打开失败则使用`perror`输出错误信息。如果文件成功打开,关键步骤是使用`fseek(pFile, 0, SEEK_END)`将文件指针移动到文件末尾,然后调用`ftell(pFile)`函数获取当前文件指针的位置,由于此时指针位于文件结尾,这个位置值就等于文件的字节大小。程序将这个值存储在变量`size`中,关闭文件后输出文件的大小信息。

需要特别注意的是,代码注释中标注了"non-portable",这是因为虽然这种方法是获取文件大小的常见技巧,但在某些系统中可能无法正常工作,尤其是当文件以文本模式打开时,或者处理超过long类型表示范围的大文件时。更可移植的方法是使用系统特定的API(如Unix/Linux的stat函数或Windows的GetFileSize函数)来获取文件大小信息。这种方法的核心原理是利用文件指针的定位和位置查询功能来推断文件尺寸。

6.3 rewind

rewind函数的作用是让文件指针的位置回到文件的起始位置。函数原型如下:

代码语言:javascript
复制
void rewind ( FILE * stream );

同样,我们来看个例子:

代码语言:javascript
复制
/* rewind example */
#include <stdio.h>

int main ()
{
    int n;
    FILE * pFile;
    char buffer [27];

    pFile = fopen ("myfile.txt","w+");
    for ( n='A' ; n<='Z' ; n++)
        fputc ( n, pFile);
    rewind (pFile);

    fread (buffer,1,26,pFile);
    fclose (pFile);

    buffer[26]='\0';
    printf(buffer);
    return 0;
}

程序首先以读写模式("w+")创建并打开"myfile.txt"文件,然后通过循环使用`fputc`函数将26个大写英文字母(从'A'到'Z')依次写入文件中。在完成写入操作后,文件指针自然停留在文件末尾的位置。此时调用`rewind(pFile)`函数的关键作用就是将文件指针重新设置到文件的开头,为后续的读取操作做好准备。

在重置文件指针后,程序使用`fread`函数一次性读取26个字节的内容到字符数组`buffer`中,由于指针已回到文件开头,因此读取的是刚刚写入的完整字母序列。最后,程序为字符串添加终止符'\0',并通过printf输出结果,显示"ABCDEFGHIJKLMNOPQRSTUVWXYZ"。由此我们可以得出结论:在同一个文件流中先写入后读取数据时,无需关闭再重新打开文件,只需简单调用`rewind`即可将指针复位,能够大大提高文件操作的效率和便捷性。

七、文件读取结束的判定

7.1 被错误使用的feof

我们需要牢记:在文件读取的过程中,不能用feof函数的返回值直接来判断文件是否结束。

feof的作用是:当文件读取结束的时候,判断读取结束的原因是否是 - 遇到文件尾结束

1. 文本文件读取是否结束,判断返回值是否为EOF(fgetc),或者NULL(fgets)。例如:

  • fgetc 判断是否为EOF。
  • fgetc 判断返回值是否为NULL。

2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。例如:

  • fread判断返回值是否小于实际要读的个数。

我们来举个文本文件的例子:

代码语言:javascript
复制
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
    int c; // 注意:int,⾮char,要求处理EOF
    FILE* fp = fopen("test.txt", "r");
    if(!fp) {
        perror("File opening failed");
        return EXIT_FAILURE;
    } 
    //fgetc 当读取失败的时候或者遇到⽂件结束的时候,都会返回EOF
    while ((c = fgetc(fp)) != EOF) // 标准C I/O读取⽂件循环
    {
        putchar(c);
    } 
    //判断是什么原因结束的
    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");

    fclose(fp);
}

这段程序首先尝试以只读模式打开"test.txt"文件,如果打开失败则使用`perror`输出错误信息并返回失败状态。关键部分在于使用`while ((c = fgetc(fp)) != EOF)`循环来读取文件内容,这里特别需要注意的是变量`c`被声明为`int`类型而不是`char`类型,这是因为`fgetc`函数在遇到文件结束或读取失败时会返回`EOF`(通常定义为-1),如果使用`char`类型可能无法正确区分正常字符和EOF。

在循环体内,每个读取到的字符通过`putchar`输出到屏幕。循环结束后,程序使用`ferror`和`feof`函数来精确判断循环终止的原因:如果是由于读取错误导致的终止,输出"I/O error when reading";如果是正常到达文件末尾,则输出"End of file reached successfully"。这种错误处理机制体现了健壮的文件操作编程实践,确保程序能够区分正常结束和异常情况,最后无论何种情况都会正确地关闭文件句柄,避免资源泄漏。

再来举个二进制文件的例子:

代码语言:javascript
复制
#include <stdio.h>

enum { SIZE = 5 };

int main(void)
{
    double a[SIZE] = {1.,2.,3.,4.,5.};
    FILE *fp = fopen("test.bin", "wb"); // 必须⽤⼆进制模式
    fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
    fclose(fp);

    double b[SIZE];
    fp = fopen("test.bin","rb");
    size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
    if(ret_code == SIZE) {
        puts("Array read successfully, contents: ");
        for(int n = 0; n < SIZE; ++n)
            printf("%f ", b[n]);
        putchar('\n');
    } else { // error handling
        if (feof(fp))
            printf("Error reading test.bin: unexpected end of file\n");
        else if (ferror(fp)) {
            perror("Error reading test.bin");
        }
    } 

    fclose(fp);
}

八、文件缓冲区

ANSI C标准采用“缓冲文件系统”处理数据文件的。所谓缓冲系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小是根据C编译系统决定的。内存与硬盘的关系如下图所示:

下面看一段代码示例:

代码语言:javascript
复制
#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{
    FILE*pf = fopen("test.txt", "w");
    fputs("abcdef", pf);//先将代码放在输出缓冲区
    printf("睡眠10秒-已经写数据了,打开test.txt⽂件,发现⽂件没有内容\n");
    Sleep(10000);
    printf("刷新缓冲区\n");
    fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)
    //注:fflush 在⾼版本的VS上不能使⽤了
    printf("再睡眠10秒-此时,再次打开test.txt⽂件,⽂件有内容了\n");
    Sleep(10000);
    fclose(pf);
    //注:fclose在关闭⽂件的时候,也会刷新缓冲区
    pf = NULL;

    return 0;
}

这里可以得出结论

因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。

如果不做,可能导致读写文件的问题。


总结

以上就是本期C语言文件操作的全部内容啦!希望大家继续支持博主,我会持续更新优质好文的~~!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2026-01-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 一、为什么使用文件?
  • 二、什么是文件?
    • 2.1 程序文件
    • 2.2 数据文件
    • 2.3 文件名
  • 三、二进制文件和文本文件
  • 四、文件的打开和关闭
    • 4.1 流和标准流
      • 4.1.1 流
      • 4.1.2 标准流
    • 4.2 文件指针
    • 4.3 文件的打开和关闭
  • 五、文件的顺序读写
    • 5.1 顺序读写函数介绍
    • 5.2 对比一组函数:
  • 六、文件的随机读写
    • 6.1 fseek
    • 6.2 ftell
    • 6.3 rewind
  • 七、文件读取结束的判定
    • 7.1 被错误使用的feof
  • 八、文件缓冲区
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档