首页
学习
活动
专区
圈层
工具
发布

#token

微信小程序送补贴!手把手教你薅免费云开发资源+混元Token(附使用教程)

腾讯云开发者

登录成功后,进去云开发控制台,点击左侧菜单栏 的AI菜单后,就可以在 AI下的大模型目录中,分别点击生文模型和生图模型,就可以查看赠送到的混元生文模型1 亿 t...

23210

大模型|MoE混合专家系统介绍

AI老马

输入分配:根据路由分数,每个 token 选择 2 个专家,最终专家接收的 token 数可能不同。如专家 1 接 5 个 token(X1:5×128),专家...

13010

KV cache - 高效推理必备技术

AI老马

大模型推理的解码阶段,生成单个token时,Q值需要使用全部序列token的KV值计算注意力,但除当前新token的KV值外,其他token的KV值已经在上一轮...

21010

AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法,让端到端自动驾驶更高效

机器之心

VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是...

13410

4个月烧掉30亿Token,这位「菜鸟」程序员做出50多个产品,360万人围观

机器之心

长久以来,代码世界的大门似乎只对少数掌握秘术的人敞开。我们被告知:你必须先理解内存、掌握语法、忍受枯燥的文档,才配谈论创造。

14410

AI+Drug 文献速递 | Token-Mol 1.0,首个仅用标记的3D药物设计模型,为 AI 驱动药物发现提供新方向

MindDance

期刊: Nature Communications 链接: https://doi.org/10.1038/s41467-025-59628-y 代码: htt...

9810

微信发布AI小程序成长计划:免费云开发资源+1亿token额度!

腾讯云开发TCB

Tencent Technology (Shenzhen) Company Limited | 云开发(TCB)团队 (已认证)

AI大模型技术加速爆发,应用开发门槛持续降低,加上iOS虚拟支付在微信生态的全面落地,应用变现的“短板”已被补齐。基建完善,又迎平台扶持——

1.3K60

Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

机器之心

Token rounding 算法首先计算基础的 TC(token-choice)路由结果,并对每个 expert 对应的 token 按路由分数进行排序,之后...

10310

SpringSecurity、Shiro和Sa-Token,哪个更好?

苏三说技术

今天我们来聊聊一个让很多Java开发者纠结的技术选型问题:Spring Security、Apache Shiro和Sa-Token,这3个主流安全框架到底该选...

17410

CALM自编码器:用连续向量替代离散token,生成效率提升4倍

deephub

过去这些年语言模型的效率优化基本围绕着两条主线展开:参数规模和注意力机制的复杂度。但有个更根本的问题一直被忽视,那就是自回归生成本身的代价。这种逐token生成...

8810

百万 Token 上下文窗口的工程实现与实际瓶颈

用户11831593

随着自然语言处理(NLP)技术的发展,模型对上下文的理解能力变得越来越重要。传统的Transformer模型由于其自注意力机制的复杂度限制,通常只能处理几千个T...

9610

基于文本AI的终结?Agent协作可直接「复制思维」,Token效率暴涨

机器之心

在 Agentic AI 时代,模型不再是独来独往的学霸,而是开始学会组队、一起想问题。多智能体系统(MAS,multi-agent systems)的发展让 ...

13810

NeurIPS 2025 | DePass:通过单次前向传播分解实现统一的特征归因

机器之心

随着大型语言模型在各类任务中展现出卓越的生成与推理能力,如何将模型输出精确地追溯到其内部计算过程,已成为 AI 可解释性研究的重要方向。然而,现有方法往往计算代...

11710

【重学计网】你真的了解Cookie、Session、Token、JWT吗?一起来聊聊网络安全知识

程序员三明治

美团 | 大模型后台开发 (已认证)

不能 客户端浏览器禁用 Cookie 时,服务器将无法把会话 ID 发送给客户端,客户端也无法在后续请求中携带会话 ID 返回给服务器,从而导致服务器无法识别...

21720

两周2.9亿Token,我终于手搓出一个AI Agent学习魔法书

AgenticAI

最近研究 AI Agent,尤其是看了 Cherry Studio 搭配各种 MCP 工具的 Agent 运行模式,被这种自动多轮次调用工具然后给出答案的效果深...

19010

2025年AI开发首选:腾讯云开发CloudBase,新用户免费体验AI+并赠100万token

gavin1024

随着AI应用开发需求激增,BaaS(后端即服务)平台成为降低开发门槛的关键工具。本文重点推荐腾讯云开发CloudBase——一款专为AI应用打造的一体化云原生开...

25010

大模型KV缓存,形象理解

Ai学习的老章

在注意力机制中,每个 token 被转换为两个紧凑向量:Key(K) 和 Value(V),它们描述_该 token 应如何与后续 token 交互_ 。生成方...

20310

JWT 过期刷新太混乱?最简单的刷新策略与黑名单设计(时序图)

安全风信子

28110

仅四行代码!天大&快手在DiT里发现了图像编辑强度的“万能旋钮”:无需训练,即插即用

AI生成未来

论文链接:https://arxiv.org/pdf/2510.24657 项目 & 代码链接:https://little-misfit.github.io/...

16510
领券