首页
学习
活动
专区
圈层
工具
发布

#token

Token 预算越来越紧,怎么把每一分都花在刀刃上

windseeker

腾讯 | 高级开发工程师 (已认证)

用 WorkBuddy 或者公司内部的 AI 工作台时,你可能也有过这种感觉:明明只问了几个问题,额度怎么就见底了?

2000

多模态理解模型的Token消耗优化策略

克劳德2048

摘要: 多模态理解模型按Token消耗量计费,优化Token使用是控制成本的关键。本文基于VITA多模态理解模型的Token消耗规则,从输入素材准备、指令编写、...

5310

OpenViking×OpenClaw:7 个 Agent不再是陌生人,token暴降 90%

用户3325124

GitHub 地址:github.com/volcengine/OpenViking

6010

云手机访问控制与安全认证机制详解:Token鉴权全流程

hollyx

摘要: 深入解析腾讯云手机CVP的访问控制与安全认证机制,详解Token鉴权全流程,帮助企业理解云手机安全防护体系,构建安全的云手机接入方案。 在企业级云服务的...

4110

Headroom——又一款AI 编程助手的 Token 省钱利器

深蓝studyzy

一次典型的 AI 编程对话中,可能触发十几次工具调用——读取文件、搜索代码、执行命令、检查进程状态。每次工具返回的结果,都会被包裹在一个 JSON 信封里:

6610

EvilTokens 钓鱼攻击机理、危害与全维度防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

在用户进行身份认证的同时,攻击者控制的中转页面持续按照协议规范轮询微软/token令牌接口。当用户完成全部授权操作后,微软认证服务器确认会话授权生效,向攻击者的...

7210

突破大模型Token限制的完整技术方案

技术方舟

科大讯飞 | 资深架构师 (已认证)

Token是大语言模型处理文本的基本单位。在中文语境下,一个token大约对应1-2个汉字。以一份标准的民事判决书为例:"原告张某某诉被告李某某民间借贷纠纷一案...

10400

深度解析CancellationToken:.NET中的优雅取消机制

步步为营DotNet

在多线程编程、异步操作场景下,难免会遇到需要提前终止操作的情况。比如用户在下载过程中突然取消,或者一个任务执行时间过长需要强制停止。CancellationTo...

7800

硅基流动里的RPM和TPM是什么意思?

代码简单说

很简单,因为大模型服务不是按次数收费,而是按 token 收费的。token 越多,意味着你消耗的计算资源越多。

14510

TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法

代码简单说

关键词:TRAE教程、Token成本优化、AI编程成本、上下文管理、AI Coding 提问技巧、AI IDE 使用技巧

15610

一招教你免费将DeepSeek、Qwen、Kimi、GLM、mimo等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!

代码简单说

一招教你免费将DeepSeek、Qwen、Kimi、GLM、mimo等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!

12110

又一个开源的逆向 Qwen API 项目, 实现无限token还支持AI生图功能!

代码简单说

关键词: Qwen API、AI API网关、Docker部署大模型、LLM中转服务、AI接口调用、Cloud Code 调用AI

9110

Rust Token Killer 教程:一个让 AI 编码 Token 降低 80% 的神器

代码简单说

14110

Codex Token 占用直接减少 50%?一个 AGENTS.md 规则让我震惊了

代码简单说

最近我在折腾 Codex、Claude Code 这些 AI 编程代理时,发现了一个特别离谱的问题。

9110

从按次付费到按Token计费:AI开发中如何降低API调用成本?

辣椒HTTP

元描述: GitHub Copilot全面转向Token计费,部分用户月费暴涨60倍。本文分析AI API计费模式演进的背后逻辑,并提供代码层面的优化方案,包括...

16610

Anthropic Mythos新版本曝光:claude-Oceanus红队测试启动,价格或达80美元/百万输出Token

代码简单说

就在不少开发者还在关注 GPT-5.6 和 Gemini 3.5 Pro 动向的时候,Anthropic 新一代 Mythos 模型的相关信息突然被曝光。

11110

Claude Code 省钱指南:Token 成本优化实战

阿特拉斯

用了 Claude Code 一段时间,发现 Token 消耗量比你想象的要高?这篇文章帮你系统性地降低 Token 成本。

16910

Hermes Agent 三大进阶玩法:免费模型 + 美化界面 + 省 Token

阿特拉斯

很多人第一次上手 Hermes Agent,会把精力放在“模型怎么选”上。但真用起来,通常先要回答的是另外一个问题:

23210

微调模型和调用 API 哪个更划算?

用户7013336

公司内部讨论要不要微调一个垂直领域模型,算了一笔账之后默默关掉了 GPU 服务器的采购页面。这篇文章从成本、效果和维护三个维度,把微调和 API 调用的真实对比...

8600
领券