前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >read函数的返回值问题

read函数的返回值问题

作者头像
全栈程序员站长
发布2022-06-25 15:04:55
发布2022-06-25 15:04:55
2.7K00
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

Read函数读取字符串返回值的问题

1. 前言

在学习socket编程的途中, 通过客户端给服务端发送字符串,然后服务端通过read或者recv来读取数据,然后返回读取的字节数. 我在想read返回的读取字节数有没有包含'\0'或者'\n'呢,于是通过一些简单的小例子,来看看实际情况到底如何.

2. read函数

我们来看一下read函数的原型:

代码语言:javascript
代码运行次数:0
运行
复制
ssize_t read(int fd, void *buf, size_t count);

然后看看函数的描述:

read() attempts to read up to count bytes from file descriptor fd into the buffer starting at buf.

然后是函数的返回描述:

On success, the number of bytes read is returned (zero indicates end of file), and the file position is advanced by this number. It is not an error if this number is smaller than the number of bytes requested; this may happen for example because fewer bytes are actually available right now (maybe because we were close to end-of-file, or because we are reading from a pipe, or from a terminal), or because read() was interrupted by a signal. See also NOTES. On error, -1 is returned, and errno is set appropriately. In this case, it is left unspecified whether the file position (if any) changes.

大概的意思就是read函数从文件描述符fd中读取字节到count大小的buf中,如果成功读取的话,返回读到的字节数大小,否则返回-1.

接下来我们通过一下小函数来实验一下.

3. read函数从终端读入字符串的返回的大小

看下面的函数:

代码语言:javascript
代码运行次数:0
运行
复制
#include <stdio.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>

#define BUFSIZE 1024

int main(int argc, char *argv[]){ 
   

    char buf[BUFSIZE] = { 
   0};

    int len = read(STDIN_FILENO, buf, BUFSIZE);

    printf("Read buf: %s", buf);
    printf("The length of buf read: %d\n", len);
    printf("The strlen of buf: %ld\n", strlen(buf));

    return 0;
}

现在我们编译运行这个程序,然后输入:

代码语言:javascript
代码运行次数:0
运行
复制
hello

我们知道hello的字节数为5,然后在终端里我们要敲回车进行确认,也就是换行符'\n',然后我们看看输出:

代码语言:javascript
代码运行次数:0
运行
复制
Read buf: hello
The length of buf read: 6
The strlen of buf: 6

注意在代码中

代码语言:javascript
代码运行次数:0
运行
复制
printf("Read buf: %s", buf);

这一句我是没有加换行符的,但是输出的时候却有了换行的作用,说明buf把换行符'\n'给读取进来了,下面的长度也说明了问题,

  1. 读取到的长度为6,然而hello只有5个字节,说明把换行符读了进来,结束符没有读取进来
  2. strlen测量的buf长度也是6,因为strlen不测量结束符'\0',因此也说明read读取到的字节数不包含结束符,而是包含换行符. ps. 最后会有简略的strlensizeof函数的比较.

4. read函数从文件读入字符串的返回的大小

因为终端只能带有换行符,我们试一下从文件中读取不带换行符的试试.创建一个文件名为read_test,里面的内容为:

代码语言:javascript
代码运行次数:0
运行
复制
hello

注意是不带换行的!

然后代码改为如下:

代码语言:javascript
代码运行次数:0
运行
复制
#include <stdio.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>

#define BUFSIZE 1024

int main(int argc, char *argv[]){ 
   

    char buf[BUFSIZE] = { 
   0};

    int r_fd = open(argv[1], O_RDONLY);

    int len = read(r_fd, buf, BUFSIZE);

    printf("Read buf: %s", buf);
    printf("The length of buf read: %d\n", len);
    printf("The strlen of buf: %ld\n", strlen(buf));

    return 0;
}

编译运行, 输入的命令为:

代码语言:javascript
代码运行次数:0
运行
复制
./read_the_end_of_file read_test

最后输出为:

代码语言:javascript
代码运行次数:0
运行
复制
Read buf: helloThe length of buf read: 5
The strlen of buf: 5

很显而易见,buf只读取了hello,没有了换行符,所以导致第一行和下一行连在一起了.

read函数返回的字节大小和strlen返回的字符串长度都是5,验证了这一点.

5. 总结

通过上面两个简单的测试,最后总结如下:

  1. 在终端中,因为无可避免要回车进行确定,因此read函数会读入换行符,所以read函数从终端读取到的字符串字节数会比输入的大1个字节,多出的一个字节是换行符的大小,不是结束符'\0'的大小. read函数读取不包含'\0', strlen读取的也不包含'\0'
  2. read在文件中读取字符串可以不包含换行符.

6. 番外: strlen和sizeof的区别

先说结论:

  1. strlen 是函数,sizeof 是运算符
  2. strlen 测量的是字符的实际长度,以’\0’ 结束。而sizeof 测量的是字符的分配大小. 也就是说: strlen是通过找'\0'来确定字符的实际长度的.这一点非常关键.

下面来看看简单的例子:

代码语言:javascript
代码运行次数:0
运行
复制
#include <stdio.h>
#include <string.h>

int main(){ 
   

    char str[20] = "hello";
    printf("strlen of str: %ld\n", strlen(str));
    printf("sizeof str: %ld\n", sizeof(str));

    return 0;
}

输出为:

代码语言:javascript
代码运行次数:0
运行
复制
strlen of str: 5
sizeof str: 20

有一点要说明,在char str[20] = "hello";这条语句中, 字符数组会自动在hello后面加上'\0'这个结束符,所以strlen才能找到'\0',得到str的实际字符长度为5.

那如果字符数组不一次赋值的话,就有区别了,看下面程序:

代码语言:javascript
代码运行次数:0
运行
复制
#include <stdio.h>
#include <string.h>

int main(){ 
   

    char str1[] = "hello";
    char str2[] = { 
   'h','e','l','l','o', '\0'};
    char str3[] = { 
   'h', 'e','l','l', 'o'};


    printf("str1:%s\n", str1);
    printf("str2:%s\n", str2);
    printf("str3:%s\n", str3);
    
    printf("strlen of str1 = %ld\n", strlen(str1));
    printf("strlen of str1 = %ld\n", strlen(str2));
    printf("strlen of str1 = %ld\n", strlen(str3));

    return 0;
}

编译运行:

代码语言:javascript
代码运行次数:0
运行
复制
str1:hello
str2:hello
str3:hellohello
strlen of str1 = 5
strlen of str1 = 5
strlen of str1 = 10

我们知道字符串是以 ‘\0’ 为结束标志的,所以char str1[ ] = “hello” 等效于char str2[ ] = {‘h’ , ‘e’ , ‘l’ , ‘l’ , ‘o’ , ‘\0’} 。strlen函数求的是字符串的实际长度,它求得方法是从开始到遇到第一个’\0’,如果你只定义没有给它赋初值,这个结果是不定的,它会从首地址一直找下去,直到遇到’\0’停止。而如果不在字符数组初始化的时候加上\0,那么strlen 得到的值就不是正确的数值,打印出来的结果也不是想要的结果。因此我们要避免这种情况,在初始化的时候要记得加上 \0,或者一次性赋初值。 另外:

  • strlen的结果要在运行的时候才能计算出来,是用来计算字符串的长度,不是类型占内存的大小。而大部分编译程序在编译的时候就把sizeof计算过了是类型或是变量的长度。
  • sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以’’\0’’结尾的

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/152116.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Read函数读取字符串返回值的问题
    • 1. 前言
    • 2. read函数
    • 3. read函数从终端读入字符串的返回的大小
    • 4. read函数从文件读入字符串的返回的大小
    • 5. 总结
    • 6. 番外: strlen和sizeof的区别
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档