首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#压缩

独家 | 进阶RAG-提升RAG效果

数据派THU

上下文压缩就是为了解决这个问题。其思想很简单:与其按原样立即返回检索到的文档,它可以使用给定查询的上下文压缩它们,以便只返回相关信息。这里的“压缩”既指压缩单个...

9010

BSP英制管螺纹详解

lrglu

基本轮廓为 55° 截头圆角三角形,相对于轴线以 1°47′ (1.79°) 的角度逐渐变细。BSPT 螺纹上的锥度使其在扭转时形成密封,因为外部和内部螺纹的侧...

6310

全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源

新智元

具体来说,他们首先在空间维度上进行了8x8倍的压缩,接着在时间维度上进一步压缩了4倍。通过这种创新的压缩策略,既避免了因抽帧而牺牲视频流畅度的弊端,又大幅降低了...

9510

CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion

新智元

不仅以4bit的权重大小实现了目前无损条件下最极限的扩散模型训练后压缩,同时还实现了超过2.38倍真实硬件加速。

8110

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

机器之心

训练后量化(Post-Training Quantization,PTQ)是大模型压缩的常用技术,其核心原理是将大模型的权重、激活值、KV Cache使用低精度...

6510

Python处理压缩文件的终极指南

sergiojune

在日常数据处理和文件管理中,压缩文件是一种常见的文件格式。使用Python可以方便地自动化处理压缩文件,包括压缩和解压各种格式的文件,如ZIP、TAR、GZ等。...

7010

MySQL8 中文参考(八十四)

ApacheCN_飞龙

您可以使用find()方法查询并返回模式中集合中的文档。MySQL Shell 提供额外的方法与find()方法一起使用,以过滤和排序返回的文档。

5610

通过 StyleGAN Prior 进行可扩展人脸图像编码:面向人机协作视觉的压缩

用户1324186

上海交通大学 · 研究员 (已认证)

1. 按照输入generator的次序可以将18个style vectors分为三组:

9410

CMC-Bench:视觉信号压缩的新范式

用户1324186

上海交通大学 · 研究员 (已认证)

视觉信号压缩旨在最小化图像数据,在网络资源和存储容量有限的情况下,提高图像/视频的服务质量。自1991年以来,视觉信号的压缩率每十年增长一倍。然而,在即将到来的...

11910

SciPy 稀疏矩阵(6):CSC

不可言诉的深渊

不同于 LIL 格式和 CSR 格式都是把稀疏矩阵看成有序稀疏行向量组,然后对行向量组中每一个行向量进行压缩存储,CSC 格式把稀疏矩阵看成有序稀疏列向量组,然...

5510

压缩算法简介

FPGA开源工作室

压缩算法是一种通过减少数据量来节省存储空间或传输数据的技术。压缩算法可以分为两种类型:有损压缩和无损压缩。 有损压缩算法会牺牲一定的数据精度或质量,在压缩数据的...

10210

.NET使用原生方法实现文件压缩和解压

追逐时光者

在.NET中实现文件或文件目录压缩和解压可以通过多种方式来完成,包括使用原生方法(System.IO.Compression命名空间中的类)和第三方库(如:Sh...

5810

C# 生成指定图片的缩略图

初九之潜龙勿用

1、缩略图通过压缩技术在尽量保证显示质量的情况下,能够在 Web 浏览器中更加迅速地载入数据。

8010

C# 实现网页内容保存为图片并生成压缩包

初九之潜龙勿用

对于批量生成的图片文件,我们可以生成压缩包为客户提供下载功能,压缩功能引用的是ICSharpCode.SharpZipLib.dll,创建 ZipCompres...

6410

还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低

量子位

因此团队提出了一个简单的视频压缩网络(即VAE),它能首先在空间维度上实现8x8倍的压缩,再从时间维度上压缩4倍。

16810

BinLLM:让LLM理解用户-商品协同信息的编码方式

秋枫学习笔记

LLMRec如何集成用户-item的交互信息?常见的方式是从头训练LLM或者从其他模型来映射协作信息。但这些方法无法以类似文本的格式表示信息,这可能无法与LLM...

5310

分享 | ATAC-Seq 分析流程

用户7010445

ATAC-Seq 是“Assay for Transposase-Accessible Chromatin with high-throughput Seque...

14910

Docker|了解容器镜像层(1)

数据科学工厂

容器非常神奇。它们允许简单的进程表现得像虚拟机。在这种优雅的底层是一组模式和实践,最终使一切运作起来。在设计的根本是层。层是存储和分发容器化文件系统内容的基本方...

7910

大模型KV Cache节省神器MLA学习笔记(包含推理时的矩阵吸收分析)

BBuf

上面的图是Deepseek2 paper中对集中常见KV Cache压缩方法的对比,可以看到MLA的核心是对keys和values进行低秩联合压缩来减少KV C...

18020

GQA,MLA之外的另一种KV Cache压缩方式:动态内存压缩(DMC)

BBuf

在openreview上看到最近NV的一个KV Cache压缩工作:https://openreview.net/pdf?id=tDRYrAkOB7 ,感觉思路...

8910
领券