首页
学习
活动
专区
圈层
工具
发布

#token

Hy3 preview上线两周Token调用增长10倍

小腾资讯君

-截至目前,Hy3 preview的Token调用总量已达上一代模型Hy2的10倍。

4200

AI 大模型的「中文税」:中文比英文更费 Token,为什么?

本草音乐实验室

模型在读到任何文字之前,会通过 tokenizer 把输入切成一个个 token。你可以把 tokenizer 想象成 AI 的「积木切割机」。你输入一句话,它...

3500

SKILL能解决MCP的token冗余,但为什么又说二者不是对立关系而是互补关系呢?

用户1493530

题主的困惑非常精准,我第一次看到各种博客说"互补"的时候也觉得逻辑不自洽。但深入研究之后发现,问题出在大多数文章没有把"互补"的具体机制讲清楚,让人误以为是两套...

5810

告别“账单刺客”:在日均 Token 破千万的业务场景下,我如何通过 API 聚合策略实现 90% 的降本增效?

鱼片粥来碗豆腐

我们发现,Agent 的思考过程(Thinking tokens)占用了 40% 的成本。于是我们通过 WellAPI 切换到了支持提示词缓存(Prompt C...

13410

很多人焦虑 AI,却连 100 块的 token 都不愿意买

用户7912670

为什么宁愿继续观望,继续焦虑,继续拖着,也不愿意先花一点点钱,让自己先上手试一试?

7910

Sa-Token 的 switchTo,不是 “管理员冒充用户”

程序员NEO

如果你把 StpUtil.switchTo(10044) 理解成“管理员直接变成用户登录”,那这功能大概率会被你用歪。

9010

一文彻底搞懂 Sa-Token safe-auth:它不是“再登录一次”,而是给危险接口加一道门

程序员NEO

很多人看到这里,还是会懵。 它到底是“校验密码”的方法,还是“校验通过后打标记”的方法? 它应该放在删除接口里,还是放在校验密码的接口里?

10210

Sa-Token 记住我机制,讲透 Cookie 和 Token

程序员NEO

这篇文章,我就结合 Sa-Token 的实现,把这件事彻底拆开。如果你们项目里也在做 Web 登录、前后端分离、APP / 小程序鉴权,这篇会很有用。

11110

Sa-Token 的 token-prefix 和 token-style,到底谁管谁?

程序员NEO

我前阵子给一套 Sa-Token 鉴权做接口标准化时,就把这两个配置混过一次。 后来才彻底想明白:token-prefix 管的是“怎么提交”,token-st...

9310

Sa-Token Session会话:三种模型彻底搞懂,不再傻傻分不清

程序员NEO

你说它跟 HttpSession 啥关系?能不能直接替换?一个账号多端登录,Session 数据到底共享还是隔离?

17110

还在用 @PreAuthorize?聊聊我切换到 Sa-Token 路由拦截后的真实体感

程序员NEO

项目初期,接口不多,每个 Controller 方法上加个 @SaCheckLogin 注解,清清爽爽。

11210

Sa-Token 注解鉴权

程序员NEO

后来我把项目的鉴权层换成了 Sa-Token 的注解模式, 上面那坨代码直接变成方法头上一个 @SaCheckRole("admin"),说实话改完那一刻确实爽...

9110

别再写死权限了!SpringBoot + Sa-Token 实现 RBAC 的最佳姿势

程序员NEO

在做 Web 开发时,权限认证是一个绕不开的话题。它的核心逻辑其实非常简单:规定哪些用户可以访问哪些接口、页面或资源。

15310

SpringBoot集成Sa-Token

程序员NEO

整合示例代码在官方仓库的/sa-token-demo/sa-token-demo-springboot文件夹下,如遇到难点可结合源码进行学习测试。

9310

一行命令装好,10x token 省出来的 Claude Code 记忆系统

Immerse

专注分享 AI 玩法、独立开发与AI 出海的 AGI 实践者,更多干货欢迎关注公众号 #沉浸式AI 或访问 yaolifeng.com

20210

OpenClaw 入门指南:AI Agent 开发新范式

七夜zippoe

摘要:OpenClaw 是 2026 年最火爆的开源 AI 助手项目,GitHub 两周突破 15 万 Star。本文将从架构原理、部署实践、成本优化、安全加固...

45520

DeepSeek-V4更新:百万 token 上下文、1.6T MoE、FP4+FP8 混合精度、Pro-Max 与 Flash-Max 全面解析

福大大架构师每日一题

2026年4月24日,DeepSeek-AI正式发布DeepSeek-V4系列预览版本,该系列包含两款强大的混合专家(Mixture-of-Experts, M...

73530

DeepSeek-V4百万Token,为什么推理成本反而只要以前的10%,其实DeepSeek真正赢在架构创新上

码哥字节

关于 RAG 的补充:百万上下文不是 RAG 的终结者。对于超大规模知识库(亿级 token、实时更新的数据),RAG 仍然有不可替代的意义。但对于"中等规模、...

36710

Claude Opus 4.7 同样文本的 token 数增加最多 35%,AI Agent 运营成本正在指数级增长

码哥字节

坦白讲,这里有个很容易踩到的坑。很多团队升级模型时只看 benchmark 评分,不会重新核算 token 数。如果你的系统提示是 3,000 tokens(旧...

25810
领券