压缩 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签压缩

#压缩

Codex 太啰嗦？加上这三项配置让回答更简洁

Immerse 11小时前2026-07-22 17:40:44

在 ~/.codex/config.toml 加上三项设置，就能分别压缩推理摘要、降低输出详细度，并把默认表达风格切到务实模式。

1400

混元 Hy3 Agent 实战：季度报告从 3 小时压缩到 40 分钟，附完整 Prompt 模板

行者全栈架构师 16小时前2026-07-22 12:39:04

我负责一个 8 人后端团队的季度运营复盘，每季度末要产出一份《技术运营季度报告》交付给技术委员会。报告需要汇总以下素材：

3300

数据丢包怎么办？库库插值是良方！（高频流数据版）

云深无际 16小时前2026-07-22 12:31:56

最近写了不少程序，记录一个软件上面的设计，目前是将解析好的数据通过 USB发送给上位机，其中数据打包的思路是把结构化的多通道数据转换为一维字节流，并加入“帧头和...

900

Context压缩与Token优化：让长文档对话不爆上下文

陆业聪 1天前2026-07-21 13:42:55

• 月之暗面发布Kimi K3，同期智谱AI年化收入（ARR）突破10亿美元，国产大模型商业化节奏明显加快。

8210

2026-07-19：增量偶权环查询。用go语言，有一个包含 n 个节点的无向图，节点编号从 0 到 n-1，初始时图中不存在任何边。现在给定一个边序

福大大架构师每日一题 1天前2026-07-21 13:29:02

2026-07-19：增量偶权环查询。用go语言，有一个包含 n 个节点的无向图，节点编号从 0 到 n-1，初始时图中不存在任何边。现在给定一个边序列 edg...

1800

说人话有多重要？大模型中的困惑度

掘金安东尼 1天前2026-07-21 09:43:16

2024年清华大学的1bit量化研究（OneBit方法）中，研究者正是通过对比量化前后的困惑度变化验证了模型在极端压缩下仍保持83%的生成能力。

4310

大部分token根本不该重复计算，不止于KVCache

用户11563501 1天前2026-07-21 09:34:39

Google 的 TurboQuant 把 KV 缓存压缩到 3 比特，精度一点没降，但因为跑在推理进程里，直接导致推理慢了 20% 以上。压缩本身没问题，问题...

6710

平均场贝叶斯神经网络的宽度鲁棒可学习网络

CreateAMind 2天前2026-07-20 21:11:27

Width-Robust Learnability in Mean-Field Bayesian Neural Networks

3510

爆省98%！Claude Code 拓展六层Token极致优化全方案

OpenNiuma 2天前2026-07-20 14:08:17

核心作用：在AI与API之间搭建本地透明压缩层，内置6种压缩算法，可逆无损压缩，专门处理MCP工具返回的日志、JSON、代码片段、Playwright快照等大体...

13810

开发必备神技！狂揽169K Star，优化上下文Token 成本骤降60-80%，效率暴增

OpenNiuma 2天前2026-07-20 13:15:17

很多人用Claude Code的体验是这样的：刚开始觉得惊艳，用着用着就发现三个问题接踵而至——Token烧太快、上下文说丢就丢、代码质量忽高忽低。

11810

又一神器火爆了！上下文压缩98%，帮Cladue Code省下一大笔Token费用

OpenNiuma 2天前2026-07-20 13:14:03

跑个30分钟的任务，光工具调用的原始输出就能吃掉40%的上下文。等模型不得不压缩对话来腾空间的时候，好玩的事情就发生了：忘了正在编辑哪个文件、忘了任务进行到哪一...

14510

GitHub 爆了！44.8K爆火开源神器！禁止Claude Code说废话,省下 80%左右消耗，让你的工作效率拉满

OpenNiuma 2天前2026-07-20 13:13:22

在使用一般模式时，很多工具回答一个问题甚至解决一个 Bug，输出就像一位过度热情的名校实习生：先礼节性地夸赞问题提得好，再用大量的连接词进行冗余铺垫，最后还要殷...

6900

Claude Code 记忆插件来了，三天暴涨3k星。一个能自动捕捉对话，并自动压缩上下文的 Claude Code 插件

AI约翰 5天前2026-07-17 20:38:26

这个插件的原理很简单：自动捕捉你在 Claude Code 中的所有操作，用 AI 压缩关键上下文，然后注入到下一次会话中。

13210

刚刚！Google发布TurboQuant，模型内存需求直接暴跌6倍

AI约翰 5天前2026-07-17 20:32:36

Google最新发布的TurboQuant算法，将大语言模型的内存占用暴降90%，这意味着什么？

8210

27B 模型压缩到 3.9GB，PrismML 的 Bonsai 把大模型塞进了浏览器和手机

用户11563501 6天前2026-07-16 20:56:41

昨天，Apple智能获批，引发广泛关注，最受期待的就是能是苹果自家的本地端侧模型。

35210

图片太大不想反复传平台？给自己搭一个私有在线压缩工具

fruge365 6天前2026-07-16 08:41:53

很多人会随手找一个在线压缩网站解决，但这类工具也有顾虑。有的需要注册，有的限制数量，有的压缩效果不稳定，还有一个更现实的问题：一些工作图片、证件截图、产品图或未...

6910

数据湖：不是万能钥匙，但可能是你最需要的那把

叫我阿柒啊

腾讯云TDP ｜产品KOL (已认证)

7天前2026-07-15 10:35:54

数据湖不是万能钥匙，但在多数据源场景中非常实用。

10810

1字节怎么吞掉256MB

IT蜗壳-Tango 8天前2026-07-14 21:46:01

这不是段子。1字节的缓冲区，怎么吞下256MB？更关键的是——这256MB的洪水漫出去之后，到底冲毁了什么？

8800

ECCV 2026 | 让3DGS实时跑在手机上！Flux-GS：移动端3D重建的突围

Amusi 9天前2026-07-13 18:41:21

Project Page: https://xiaobiaodu.github.io/flux-gs-project/ Code(移动端与训练代码均已开源)...

17800

15天学会AI应用开发（十七）使用LangGraph实现会话记忆功能

aqi00 9天前2026-07-13 15:04:02

上一篇文章采用langchain_community包协助LangChain实现了对话记忆功能，但langchain_community属于早期链式架构的临时补...

11110

#压缩

Codex 太啰嗦？加上这三项配置让回答更简洁

混元 Hy3 Agent 实战：季度报告从 3 小时压缩到 40 分钟，附完整 Prompt 模板

数据丢包怎么办？库库插值是良方！（高频流数据版）

Context压缩与Token优化：让长文档对话不爆上下文

2026-07-19：增量偶权环查询。用go语言，有一个包含 n 个节点的无向图，节点编号从 0 到 n-1，初始时图中不存在任何边。现在给定一个边序

说人话有多重要？大模型中的困惑度

大部分token根本不该重复计算，不止于KVCache

平均场贝叶斯神经网络的宽度鲁棒可学习网络

爆省98%！Claude Code 拓展六层Token极致优化全方案

开发必备神技！狂揽169K Star，优化上下文Token 成本骤降60-80%，效率暴增

又一神器火爆了！上下文压缩98%，帮Cladue Code省下一大笔Token费用

GitHub 爆了！44.8K爆火开源神器！禁止Claude Code说废话,省下 80%左右消耗，让你的工作效率拉满

Claude Code 记忆插件来了，三天暴涨3k星。一个能自动捕捉对话，并自动压缩上下文的 Claude Code 插件

刚刚！Google发布TurboQuant，模型内存需求直接暴跌6倍

27B 模型压缩到 3.9GB，PrismML 的 Bonsai 把大模型塞进了浏览器和手机

图片太大不想反复传平台？给自己搭一个私有在线压缩工具

数据湖：不是万能钥匙，但可能是你最需要的那把

1字节怎么吞掉256MB

ECCV 2026 | 让3DGS实时跑在手机上！Flux-GS：移动端3D重建的突围

15天学会AI应用开发（十七）使用LangGraph实现会话记忆功能

热门专栏

腾讯云中间件的专栏

WeTest质量开放平台团队的专栏

腾讯开源的专栏

杨焱的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#压缩

Codex 太啰嗦？加上这三项配置让回答更简洁

混元 Hy3 Agent 实战：季度报告从 3 小时压缩到 40 分钟，附完整 Prompt 模板

数据丢包怎么办？库库插值是良方！（高频流数据版）

Context压缩与Token优化：让长文档对话不爆上下文

2026-07-19：增量偶权环查询。用go语言，有一个包含 n 个节点的无向图，节点编号从 0 到 n-1，初始时图中不存在任何边。现在给定一个边序

说人话有多重要？大模型中的困惑度

大部分token根本不该重复计算，不止于KVCache

平均场贝叶斯神经网络的宽度鲁棒可学习网络

爆省98%！Claude Code 拓展六层Token极致优化全方案

开发必备神技！狂揽169K Star，优化上下文Token 成本骤降60-80%，效率暴增

又一神器火爆了！上下文压缩98%，帮Cladue Code省下一大笔Token费用

GitHub 爆了！44.8K爆火开源神器！禁止Claude Code说废话,省下 80%左右消耗，让你的工作效率拉满

Claude Code 记忆插件来了，三天暴涨3k星。一个能自动捕捉对话，并自动压缩上下文的 Claude Code 插件

刚刚！Google发布TurboQuant，模型内存需求直接暴跌6倍

27B 模型压缩到 3.9GB，PrismML 的 Bonsai 把大模型塞进了浏览器和手机

图片太大不想反复传平台？给自己搭一个私有在线压缩工具

数据湖：不是万能钥匙，但可能是你最需要的那把

1字节怎么 吞掉256MB

ECCV 2026 | 让3DGS实时跑在手机上！Flux-GS：移动端3D重建的突围

15天学会AI应用开发（十七）使用LangGraph实现会话记忆功能

腾讯云中间件的专栏

WeTest质量开放平台团队的专栏

腾讯开源的专栏

杨焱的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

1字节怎么吞掉256MB