首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

VLM视觉模型处理过程

aaronwjzhao

以Qwen2.5 VL 3B为例,patch_size=14,输入图像按照1414划分成多个patch块。对于尺寸为(H W)的图像,视觉token数为:N =...

11011

架构演进:从确定性工作流 (Workflow) 到自主智能体 (LLM Agent)

咕泡科技

湖南咕泡网络科技有限公司 | 副总裁 (已认证)

虽然两者都以大模型(LLM)为核心引擎,但在控制流逻辑、状态管理及非确定性处理上存在本质区别。本文将通过“智慧旅游规划”这一典型场景,深度拆解两者的技术范式差异...

11010

从 Gemini 的变化,看 AI 系统设计正在发生的一个转向

用户12007056

在 AI 应用的早期阶段,系统设计往往围绕一个核心问题展开: 这个模型,够不够强?

8910

云上 AI API 接入实践:企业如何治理多模型与密钥复杂度

用户12007056

随着 Claude 等大模型逐步进入企业生产系统,越来越多业务开始依赖 AI API 能力,例如智能客服、内容生成、知识问答与自动化流程等。

9110

万字长文详解向量数据库与RAG

闫同学

在我们<u>上一篇文章</u>中,我们探讨了如何通过构建知识库,使得大模型能够从“无状态”变成“有状态”,从而增强其记忆和上下文感知的能力。知识库作为一种让大模...

29050

当AI API 进入制造与医疗核心系统:工程侧需要提前考虑的几个关键问题

用户12007056

模型效果不错,接口也能调通,测试阶段一切正常。但当系统进入 真实运行环境,尤其是制造业和医疗行业的核心系统后,问题才真正开始暴露。

10810

Gemini 3 Pro 国内怎么购买 API Key 及大模型 LLM API 试用指南

用户11991468

摘要:Google 再次刷新了 多模态大模型 的上限。本文将为您权威解读 Gemini 3 Pro 的核心特性(超长上下文、原生多模态),并为国内开发者提供一份...

1.3K20

2026 大模型(LLM)三巨头:Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 API 谁更值得购买?

用户11991468

摘要:2026 年的 AI 战场硝烟四起,Google、OpenAI 与 Anthropic 纷纷亮出核武器。面对 Gemini 3 Pro 的多模态、GPT-...

35910

Claude Code 国内保姆级使用指南:实测 GLM-4.7 与 Claude Opus 4.5 全方案解

羊cc

Claude Code 是 Anthropic 推出的旗舰级代理式编程工具。在2026年的技术环境下,国内开发者主要通过修改环境变量 ANTHROPIC_BAS...

3.5K50

生产环境中的大模型 API 接入实践:多模型并行的工程思考

用户12007056

随着大模型在各类业务中的使用逐渐深入,越来越多的系统开始将模型能力引入到核心业务链路中,例如内容生成、智能问答、辅助决策等场景。

12510
领券