前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >面试官:说一下大文件分片下载

面试官:说一下大文件分片下载

作者头像
神说要有光zxg
发布于 2024-04-30 07:55:20
发布于 2024-04-30 07:55:20
52100
代码可运行
举报
运行总次数:0
代码可运行

文件上传、文件下载都是常见的需求。

大文件上传我们会通过分片上传来优化。

比如阿里云 OSS 的大文件分片上传:

那大文件下载如何优化呢?

答案也是分片下载,或者叫流式传输。

我们试一下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
nest new download-test

创建个 Nest 项目。

在 AppController 里添加个 download 的路由

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import { Controller, Get, Res } from '@nestjs/common';
import { AppService } from './app.service';
import { Response } from 'express';
import * as fs from 'fs';

@Controller()
export class AppController {
  constructor(private readonly appService: AppService) {}

  @Get()
  getHello(): string {
    return this.appService.getHello();
  }

  @Get('download')
  download(@Res() res: Response) {
    const content = fs.readFileSync('package.json');

    res.set('Content-Disposition', `attachment; filename="guang.json"`);

    res.end(content);
  }
}

把服务跑起来:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
npm run start:dev

浏览器访问下:

可以看到,触发了下载。

在 devtools 里可以看到正确设置了 header:

header 通过 @Header 装饰器加也可以:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@Get('download')
@Header('Content-Disposition', `attachment; filename="guang.json"`)
download(@Res() res: Response) {
    const content = fs.readFileSync('package.json');

    res.end(content);
}

效果一样。

但是,这样文件是全部读取出来返回,如果文件大了,比如好几个 G,会占用很大的内存。

当大文件下载的时候,能不能读出一部分返回一部分,也就是流式的下载呢?

可以的,http 有这个功能。

就是 transfer-encoding:chunked

这个是面试常考题。

从服务器下载一个文件的时候,如何知道文件下载完了呢?

有两种方式:

一种是 header 里带上 Content-Length,浏览器下载到这个长度就结束。

另一种是设置 transfer-encoding:chunked,它是不固定长度的,服务器不断返回内容,直到返回一个空的内容代表结束。

比如这样:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
5
Hello
1
,
5
World
1
!
0

这里分了 “Hello” “,” “World”“!” 这 4 个块,长度分别为 5、1、5、1

最后以一个长度为 0 的块代表传输结束。

这样,不管内容多少都可以分块返回,就不用指定 Content-Length 了。

这就是大文件的流式传输的原理,就是 transfer-encoding:chunked。

然后我们在代码里实现下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@Get('download2')
@Header('Content-Disposition', `attachment; filename="guang.json"`)
download2(@Res() res: Response) {
    const stream = fs.createReadStream('package.json');

    stream.pipe(res);
}

node 的 stream 本来就是分块读取内容的,这里配合流式返回数据很合适。

现在就不再返回 Content-Length 了,而是返回了 Transfer-Encoding:chunked:

这就是流式传输。

不过在 nest 里最好不要直接用 node 的 stream api。

因为它有很多事件,比如 data、error、end 等,自己处理还是挺麻烦的。

可以直接用 Nest 封装的一个类 StreamableFile:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@Get('download3')
download3() {
    const stream = fs.createReadStream('package.json');

    return new StreamableFile(stream, {
      disposition: `attachment; filename="guang.json"`
    });
}

试一下:

效果一样。

只是这里的 Content-Type 默认是 application/octet-stream 二进制流:

你也可以改一下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@Get('download3')
download3() {
    const stream = fs.createReadStream('package.json');

    return new StreamableFile(stream, {
      type: 'text/plain',
      disposition: `attachment; filename="guang.json"`
    });
}

这样就实现了流式传输了。

相比大文件上传需要自己实现分片,大文件下载这个,浏览器和 http 内置了支持,直接指定对应 header 就行,自己不用做很多事情。

然后具体的 http 响应体是什么样的呢?

我们用 wireshark 抓包看一下:

在 wireshark 官网下载安装包:

安装后把它跑起来:

选择 loopback 这个网卡,本地回环地址,可以抓到 localhost 的包:

输入过滤器 port 3000,也就是过滤 3000 端口的数据包。

然后回车就会进入抓包界面:

这时候再访问下 http://localhost:3000/download3

可以看到抓到了几个 tcp 的包:

这两个分别是请求和响应:

如果多了找不到,点一下 protocal 会排序:

可以看到,确实是分块传输的:

这里有一个数据块,然后一个空块结尾。

再访问下 http://localhost:3000/download 接口对比下:

和上面的对比下,这就是没有分块的响应。

当然,现在的文件比较小,可以找一个大一点的文件试一下:

可以看到,现在分片就多了:

大概是 65536 一个分块,也就是 64k。

每个分块都有 chunk size 和 chunk data:

确实是分块了。

案例代码上传了 Nest 小册仓库。

总结

大文件上传的优化是分片上传,大文件下载的优化是分片下载。

只不过这个分片下载 http 帮你做了,你只要指定 transfer-encoding:chunked 就行,也叫流式传输。

在 Nest 里可以用 fs.createReadStream 获取文件流,然后返回 StreamableFile 的对象就可以了。

返回的响应就是流式的,我们通过 wireshark 抓包证实了这点。

每个分块都有 chunk size、chunk data 的信息。

以后面试官再问你大文件下载优化或者问 transfer-encoding:chunked,你就可以大胆的说你用 wireshark 抓包验证过了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 神光的编程秘籍 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
《大胖 • 小课》- 说说大文件分片和断点续传
这是《大胖小课》栏目的专题一《说说文件上传那些事儿》的第6节-《大文件分片和断点续传》。
zz_jesse
2020/03/17
1.3K0
前端文件下载(三)
两篇文章讲解的都是自动启动浏览器下载。下载的进度浏览器进行反馈,文件小的时候浏览器会很快下载完并提示,但是文件很大的话,那么下载就很慢了,准确来说数据拉取很慢,点击之后页面很久才会响应。这个时候,我们加个 loading 转圈圈提示就行了,但是不友好,是否让用户知道数据加载到哪里了呢?加载完后浏览器吊起下载。
Jimmy_is_jimmy
2023/09/19
4830
前端文件下载(三)
⭐Python实现多线程并发下载大文件(制作支持断点续传的下载器的绝佳参考⁉️)⭐
不知道各位童鞋们是否遇到过需要使用python下载大文件的需求,或者需要从一些网速很慢的网站上下载文件。如果你在实际下载过程碰到下载不稳定经常失败的情况,本文的方法将会给你带来一些解决思路和方案。
全栈程序员站长
2022/09/13
2.2K0
⭐Python实现多线程并发下载大文件(制作支持断点续传的下载器的绝佳参考⁉️)⭐
文件下载,搞懂这9种场景就够了
在 文件上传,搞懂这8种场景就够了 这篇文章发布之后,阿宝哥收到了挺多掘友的留言,感谢掘友们一直以来的鼓励与支持。其中掘友 @我的烟雨不在江南 和 @rainx 在文章底部分别发了以下留言:
童欧巴
2021/08/20
3.3K0
文件下载,搞懂这9种场景就够了
附件下载原来如此简单
之前我们已经了解过了 POST 上传的数据处理,以及包括上传的图片怎么处理,那么文件下载又是一个怎么样的过程呢?今天就要来好好说道说道。
Qiang
2019/06/22
8840
深入理解文件上传下载的原理及实现逻辑
文件上传的是根据 http 协议的规范和定义,完成请求消息体的封装和消息体的解析,然后将二进制内容保存到文件。
Lion 莱恩呀
2025/01/01
3780
深入理解文件上传下载的原理及实现逻辑
Springboot大文件上传下载实现思路,分片、断点续传代码
WebUploader是由Baidu WebFE(FEX)团队开发的一个简单的以HTML5为主,FLASH为辅的现代文件上传组件。
星辰大海的精灵
2024/12/03
5131
前端下载图片的N种方法
前几天一个简单的下载图片的需求折腾了我后端大佬好几天,最终还是需要前端来搞,开始说不行的笔者最后又行了,所以趁着这个机会来总结一下下载图片到底有多少种方法。
街角小林
2022/06/15
1.2K0
大文件上传与流下载
在现代网站中,越来越多的个性化图片,视频,去展示,因此我们的网站一般都会支持文件上传。今天我们以大文件上传和下载为主题来分享总结一下.
用户10501441
2024/11/24
2230
大文件上传与流下载
asp.net下载文件几种方式
{ /* 微软为Response对象提供了一个新的方法TransmitFile来解决使用Response.BinaryWrite 下载超过400mb的文件时导致Aspnet_wp.exe进程回收而无法成功下载的问题。 代码如下: */ Response.ContentType = "application/x-zip-compressed"; Response.AddHeader("Content-Disposition", "attachment;filename=z.zip"); string filename = Server.MapPath("DownLoad/aaa.zip"); Response.TransmitFile(filename); } //WriteFile实现下载 protected void Button2_Click(object sender, EventArgs e) { /* using System.IO; */ string fileName ="aaa.zip";//客户端保存的文件名 string filePath=Server.MapPath("DownLoad/aaa.zip");//路径 FileInfo fileInfo = new FileInfo(filePath); Response.Clear(); Response.ClearContent(); Response.ClearHeaders(); Response.AddHeader("Content-Disposition", "attachment;filename=" + fileName); Response.AddHeader("Content-Length", fileInfo.Length.ToString()); Response.AddHeader("Content-Transfer-Encoding", "binary"); Response.ContentType = "application/octet-stream"; Response.ContentEncoding = System.Text.Encoding.GetEncoding("gb2312"); Response.WriteFile(fileInfo.FullName); Response.Flush(); Response.End(); } //WriteFile分块下载 protected void Button3_Click(object sender, EventArgs e) { string fileName = "aaa.zip";//客户端保存的文件名 string filePath = Server.MapPath("DownLoad/aaa.zip");//路径 System.IO.FileInfo fileInfo = new System.IO.FileInfo(filePath); if (fileInfo.Exists == true) { const long ChunkSize = 102400;//100K 每次读取文件,只读取100K,这样可以缓解服务器的压力 byte[] buffer = new byte[ChunkSize]; Response.Clear(); System.IO.FileStream iStream = System.IO.File.OpenRead(filePath); long dataLengthToRead = iStream.Length;//获取下载的文件总大小 Response.ContentType = "application/octet-stream"; Response.AddHeader("Content-Disposition", "attachment; filename=" + HttpUtility.UrlEncode(fileName)); while (dataLengthToRead > 0 && Response.IsClientConnected) { int lengthRead = iStream.Read(buffer, 0, Convert.ToInt32(ChunkSize));//读取的大小 Response.OutputStream.Write(buffer, 0, lengthRead); Response.Flush(); dataLengthToRead = dataLengthToRead - lengthRead; } Response.Close(); } } //流方式下载 protected void Button4_Click(object sender, Eve
用户7705674
2021/11/02
2K0
大文件分片上传和分片下载
大家好,我是柒八九。一个专注于前端开发技术/Rust及AI应用知识分享的Coder
前端柒八九
2024/07/02
5200
大文件分片上传和分片下载
Node.js 动态表格大文件下载实践
前言 最近优化了几个新人写出的动态表格文件下载接口的性能瓶颈,感觉非常有必要总结一篇文章作为文档来抛砖引玉,以促进大家学习一起写出更专业的代码。 HTTP 文件下载 讲具体问题之前需要先了解一些 HTTP 基础,下面简单介绍一下用 Node.js&Koa 怎么实现文件下载。 参考: rfc2616 19.5.1 Content-Disposition rfc1806 Node.js Stream 简单下载 最简单的情况就是服务器上文件系统已经存在了某个文件,客户端请求下载直接把文件读了吐回去即可: impo
用户1097444
2022/06/29
6.5K0
Node.js 动态表格大文件下载实践
Spring Boot中实现文件上传和下载功能示例
在Spring Boot中实现文件上传和下载功能是一个常见的需求,可以通过几个简单的步骤来完成。下面来介绍一下如何实现文件上传和下载。
用户7353950
2024/06/18
1.5K0
Spring Boot中实现文件上传和下载功能示例
C#一分钟浅谈:文件上传与下载功能实现
在Web应用开发中,文件的上传和下载是非常常见的需求。无论是用户上传头像还是下载资料,这些操作都需要开发者对文件处理有一定的了解。本文将从基础出发,逐步深入探讨如何在C#环境下实现文件的上传与下载,并针对过程中可能遇到的问题提出解决方案。
Jimaks
2024/10/12
9850
一文带你层层解锁「文件下载」的奥秘
大家好我是秋风,今天带来的主题是关于文件下载,在我之前曾经发过一篇文件上传的文章(一文了解文件上传全过程(1.8w字深度解析,进阶必备),反响还不错,时隔多日,由于最近有研究一些媒体相关的工作,因此打算对下载做一个整理,因此他的兄弟篇诞生了,带你领略文件下载的奥秘。本文会花费你较长的时间阅读,建议先收藏/点赞,然后查看你感兴趣的部分,平时也可以充当当做字典的效果来查询。
秋风的笔记
2020/10/27
1.2K0
一文带你层层解锁「文件下载」的奥秘
django 下载文件(解决中文路径问题)
def file_download(request): """ 下载文件 """ # 我这里是访问网络地址下载文件 # 下载本地文件的话直接打开文件下载就ok # with open('xxx', mode='rb') as f: # data = f.read() res = requests.get(xxx) # 文件分块处理(适用于大文件) data = res.iter_content() # 设置content_
ruochen
2021/05/12
1.4K0
django 下载文件(解决中文路径问题)
PDF.js 分片下载的介绍2:分片下载demo
服务器环境: php7.2 nginx 1.14 ubuntu 18.04 测试浏览器:谷歌浏览器 70.0.3538.110(
庞小明
2019/05/25
12.8K0
使用Nodejs和Express构建http响应流实现下载功能
然后创建响应头,指定响应的类型,同时也可以使用Content-Disposition设置浏览器下载时需要保存的文件名
kongxx
2023/11/22
9420
node实现分片下载
http通过Range Requests相关的header,可以与服务器进行协商,实现分部分的请求。
Keller
2021/12/14
1.1K0
node实现分片下载
AspNetCore中的文件上传与下载优化
在现代Web开发中,文件上传和下载是常见的功能需求。然而,随着文件大小的增加或网络环境的变化,传统的文件上传和下载方式可能会遇到性能瓶颈或用户体验问题。本文将深入讲解如何在AspNetCore中实现大文件上传、分块上传、断点续传以及高效的文件下载。
郑子铭
2025/05/12
1050
AspNetCore中的文件上传与下载优化
推荐阅读
相关推荐
《大胖 • 小课》- 说说大文件分片和断点续传
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验