缓存 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签缓存

#缓存

缓存就是数据交换的缓冲区（称作Cache），当某一硬件要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

CDN 访问日志分析：洞察用户访问行为与性能瓶颈

gavin1024 6小时前2026-07-28 14:25:00

缓存命中率是衡量 CDN 加速效果的核心指标。以下 SQL 可以快速计算整体和各维度的缓存命中情况：

800

PostgreSQL plan_cache_mode：一个参数让倾斜数据的查询快了 44 倍

小徐 10小时前2026-07-28 10:15:29

95% 是 APPROVED，4% 是 PENDING，1% 是 SPAM。典型的长尾分布。

500

踩了个大坑！K8s 挂载目录的日志，居然也在吃容器内存？

欢醉 11小时前2026-07-28 08:41:35

最近一直收到某个服务pod容器内存超过80%的告警，堆内存加上堆外内存目前看也只有1G左右，但pod内存却达到4G多，查来查去查到active_file对应的l...

500

7 个 TypeScript 设计模式，治好你满屏的 if/else

前端达人 1天前2026-07-27 12:52:03

因为重试失败时缓存层压根没往里写，等某一次重试成功了，缓存照样写得进去。两种套法都能用。

1910

同样都是Linux，为什么有人夸"轻量"，有人骂"吃内存"？

芸知 3天前2026-07-24 21:04:43

你刚装好一台 Linux 服务器，跑了一行 free -h，结果吓了一跳：total 4G，used 3.8G，free 0.1G。

9210

2nm双芯加持！“苏妈”放出大杀器，全面超越Vera Rubin？

芯智讯 4天前2026-07-24 13:10:44

这样每个FCD包含一个L2缓存实例。单个L2缓存的带宽是MI355X上单个Infinity Cache的1.5倍，两个L2缓存的聚合带宽则达到MI355X的3倍...

14710

用 Node.js 连接数据库：一次请求是怎么跑起来的？

Lihua奏 4天前2026-07-24 12:54:03

下面这个接口是查用户资料。它会先查 Redis，有缓存就直接返回；没有缓存才去查 PostgreSQL，然后把结果写回 Redis。

7810

大模型进了银行，为什么还是答不对客户的问题？万字方案讲透 RAG 落地 | 建议收藏

机器学习之禅 4天前2026-07-24 12:51:38

缓存失效是经典难题：知识库更新了，缓存的旧答案还在——返回过时信息。知识库频繁更新的场景，缓存就是颗定时炸弹（对策：库版本号绑定缓存键、短 TTL）

9110

API 缓存设计指南

FunTester 4天前2026-07-23 21:38:54

缓存错误往往比不缓存更危险。个性化数据必须使用用户维度的缓存键，且不能泄露到共享缓存；余额、实时库存等数据应使用很短的 TTL，或干脆避免缓存；认证令牌、会话信...

12400

从3s到25ms！看看人家的接口优化技巧，确实很优雅！

程序员小猿 4天前2026-07-23 20:59:48

一个很好理解的空间换时间的例子是合理使用缓存，针对一些频繁使用且不频繁变更的数据，可以提前缓存起来，需要时直接查缓存，避免频繁地查询数据库或者重复计算。

7600

美国掌握芯片，中国争夺开放生态： Kimi K3 把大模型竞争推向系统架构时代

anzhsoft 4天前2026-07-23 20:58:23

K3 官方披露，其 API 编程负载的缓存命中率超过 90%，缓存命中输入价格为 0.30 美元/百万 Token，未命中输入为 3 美元，输出为 15 美元。...

22910

transformers v5.14.1最新发布：修复Inkling集成关键问题，辅助生成与缓存机制两大故障一次解决

福大大架构师每日一题 5天前2026-07-23 20:06:31

这意味着缓存相关机制在该问题中扮演了重要角色，尤其是静态缓存路径下的行为与预期之间出现了偏差。

8710

2.8万亿参数的 Kimi K3，到底堆了什么？

乐小野

石化盈科信息技术有限责任公司｜算法工程师 (已认证)

5天前2026-07-23 13:12:15

标准 Transformer 的自注意力复杂度是 O(n²)，上下文越长，KV 缓存膨胀越厉害。100 万 token 的情况下，传统注意力几乎不可行。KDA ...

41510

别再裸用workbuddy了，我把八类专家，拉成了一条生产线

瑭宋元 7天前2026-07-21 15:53:00

效率侧佐证：平台侧统计本月累计调用 8 亿+ tokens，缓存命中率 93.9%。长上下文复用把单位成本压到极低——用得越狠，边际越便宜。

14711

ollama v0.32.1发布详解：工具调用更稳、多轮推理更强、内存泄漏修复、模型加载超时生效与交互体验全面升级

福大大架构师每日一题 7天前2026-07-21 13:30:12

缓存快照性能的优化，虽然在版本说明里只有短短一句，但它依然值得单独关注。因为缓存快照通常与状态记录、复用效率、运行过程中的资源管理紧密相关。只要性能更好，就意味...

15310

大部分token根本不该重复计算，不止于KVCache

用户11563501 7天前2026-07-21 09:34:39

前缀缓存要求缓存内容必须是新请求一字不差的前缀。改一个字符，整个缓存全废。实际生产里，三种常见场景直接让缓存失效：

13410

从 200K 到 1M：长上下文管理的原理

柏拉图的美工刀 7天前2026-07-21 08:08:08

最近我们团队做了一个销售AI助手，以问答为主，慢慢加上了识别文档功能。最开始的需求很小：识别一张图片——销售在客户现场拍一张资料或名片的截图，模型提取关键信息。...

9810

工具站还在每次请求打回源站？先别急着上Edge · Day 62

袁锐钦 7天前2026-07-20 21:57:09

✅ Cloudflare Workers、Vercel Edge / Middleware 一类能力，是 2026 年主流托管平台都在推的边缘运行时。 ⚠ 下文...

9810

ARP协议工作原理与ARP欺骗防御技术详解

程序员古德 7天前2026-07-20 21:01:59

ARP全称Address Resolution Protocol，中文译为地址解析协议。它工作在OSI模型的数据链路层与网络层之间。RFC 826对ARP的定义...

11300

一行代码引发的线上事故，复盘Python生产环境那些隐患

用户11081884 7天前2026-07-20 20:36:19

Python里falsy值可不止 None——0、""、[]、False，统统被 or 当作“没取到”。而这些都是完全合法的缓存值。用户余额为0？缓存击穿。查询...

11110

#缓存

CDN 访问日志分析：洞察用户访问行为与性能瓶颈

PostgreSQL plan_cache_mode：一个参数让倾斜数据的查询快了 44 倍

踩了个大坑！K8s 挂载目录的日志，居然也在吃容器内存？

7 个 TypeScript 设计模式，治好你满屏的 if/else

同样都是Linux，为什么有人夸"轻量"，有人骂"吃内存"？

2nm双芯加持！“苏妈”放出大杀器，全面超越Vera Rubin？

用 Node.js 连接数据库：一次请求是怎么跑起来的？

大模型进了银行，为什么还是答不对客户的问题？万字方案讲透 RAG 落地 | 建议收藏

API 缓存设计指南

从3s到25ms！看看人家的接口优化技巧，确实很优雅！

美国掌握芯片，中国争夺开放生态： Kimi K3 把大模型竞争推向系统架构时代

transformers v5.14.1最新发布：修复Inkling集成关键问题，辅助生成与缓存机制两大故障一次解决

2.8万亿参数的 Kimi K3，到底堆了什么？

别再裸用workbuddy了，我把八类专家，拉成了一条生产线

ollama v0.32.1发布详解：工具调用更稳、多轮推理更强、内存泄漏修复、模型加载超时生效与交互体验全面升级

大部分token根本不该重复计算，不止于KVCache

从 200K 到 1M：长上下文管理的原理

工具站还在每次请求打回源站？先别急着上Edge · Day 62

ARP协议工作原理与ARP欺骗防御技术详解

一行代码引发的线上事故，复盘Python生产环境那些隐患

热门专栏

Technology Share

张戈的专栏

田飞雨的专栏

腾讯云中间件的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐