首页
学习
活动
专区
圈层
工具
发布

#压缩

Hermes Agent实战避坑:高效用本地AI Agent,这些坑别踩!

胖头鱼的鱼缸

Hermes Agent内置了很多命令,覆盖新建会话、命名、上下文压缩、会话复用等核心功能,输入/commands即可查看全部命令,/commands N可翻页...

600

AI正在终结传统ERP?麦肯锡最新报告揭示五大颠覆路径

heidsoft

麦肯锡明确指出:AI智能体可将ERP实施工作量降低至少50%,将实施周期缩短50%。这是ERP史上最大的一次经济模型重构。

500

模型量化算法详解:从 PTQ 到 AWQ 的大模型压缩实战指南

heidsoft

随着 GPT、LLaMA、DeepSeek 等大语言模型的兴起,模型规模呈指数级增长:

3000

上下文腐烂 - 单次对话

用户11705094

这种现象的数学本质是,位置偏置把权重抬到两端,softmax把差距指数放大,有限容量让中间首先被压缩掉。

300

谁吃到了 AI 红利?

用户11705094

AI 的优势在于压缩中间层和实现快速闭环,而传统企业组织则依赖层级、分工与权力链条。

1000

如何打造现象级 Agentic 产品,深度剖析小龙虾成功之道

用户12057812

它让记忆随着时间逐渐压缩。最近发生的事情会被完整保留,而几天之前的内容则会被自动整理和归纳,再往前的记录则会变得更加模糊。

2800

不只是平均池化:EvoPool 如何把同源序列“压缩”进蛋白语言模型表示?

Tom2Code

蛋白质语言模型(Protein Language Models, PLMs)通常会把一条氨基酸序列编码成一串 residue-level embeddings:

4910

打破固有范式?CubeAttn‑X实现最高83%内存节约,LRR提升45%

山野大叔

原因:交替排列让两种层形成"压缩—检索—压缩—检索"的循环——每个 CubeAttn 层接收到 Softmax 精炼过的位置信息再压缩,每个 Softmax 层...

4510

换哪个数据库,我还能省100万,创造业绩

AustinDatabases

《告别迁移焦虑:OceanBase MySQL 模式能否兼容 DBA 的“祖传”运维 SQL?》

3210

惊人 82.8% 压缩率!Webman Phar 启用 Gzip 后仅 1MB

Tinywan

实际测试中,无压缩 Phar 可能达 30-40MB,启用 Gzip 后可压缩至 7-10MB(压缩率约 70-80%),具体取决于项目中代码与资源比例(纯代码...

5000

从 io.Reader 到 io.WriterTo:Go I/O 抽象为什么这么耐用

技术圈

Go 标准库里有些接口小到近乎朴素,io.Reader 就是典型代表。它只有一个 Read 方法,却贯穿文件、网络、压缩、加密、HTTP 请求体、命令行管道和内...

7300

Headroom:Netflix 工程师开源的上下文压缩工具,省 token 还是烧 token?

用户11563501

Headroom 把自己定位成"AI Agent 的上下文压缩层"。在 Agent 把数据发给 LLM 之前,它先拦截下来,做一轮智能压缩。

17710

你的 Agent 刚帮用户烧了 38 美元,就为了跑一个查询

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

倒不是因为它处理了什么惊世骇俗的复杂逻辑,而是因为它把同一份文件连续总结了 47 次。它发现活儿已经干完了,然后……决定再干一遍。没崩溃,没报警,只有一个不停旋...

10210

大模型终于能读千页文档了!DeepSeek-OCR 用 1 招压缩 10 倍,准确率还能 97%

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

“给大模型喂一份 1000 页的财报,它要么‘内存爆炸’,要么切片段后逻辑全乱 —— 这难题终于被破解了!” 近期 DeepSeek 发布的 DeepSeek-...

9310

零基础也能做微信红包封面,从设计到发放一步到位【免费领红包封面】

PikeTalk

先简单说下啥是红包封面:就是发红包时对方点开看到的图/动画,说白了就是装红包的 “外壳”,不是红包本身哈!

11500

ASML 卖中国一台光刻机,利润顶 20 万吨猪肉!这差距太扎心

PikeTalk

这种 “垄断地位” 让 ASML 有十足的定价权,想卖多少钱就卖多少钱,利润自然高得吓人。而猪肉属于大宗商品,市场竞争激烈,上下游环节多,利润空间早被压缩得死死...

10110

前些日,Claude Code开源了!51万行代码,全网狂欢

jeffery_jcm

背景:2026年3月31日, Claude Code源代码通过npm注册表中的一个map文件惨遭泄露,全部在线裸奔。

10210

持续学习:AI 从短期记忆到会睡眠的模型

唐国梁Tommy

注意力是在 token 之间做关联;反向传播则像在梯度和参数之间做一种上下文学习;优化器里的 momentum,也是在压缩一段梯度历史。模型结构处理 token...

12610

Google DeepMind:视频大模型的真正瓶颈,从来不在 LLM 那一端

唐国梁Tommy

这两个铺垫合起来就指向同一个结论——我们需要的不是又一个 post-hoc 压缩方法,而是一个从一开始就吐出压缩后 token 的视觉编码器。

7910

Hermes Agent 记忆架构:一座"记忆工厂"

唐国梁Tommy

很多 AI 产品一谈 memory,都给人一种"只要加一个记忆模块就够了"的错觉。但把 Hermes Agent 的系统设计和源码对着看下来,你会发现一件反直觉...

15200
领券