首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

万字长文详解向量数据库与RAG

闫同学

在我们<u>上一篇文章</u>中,我们探讨了如何通过构建知识库,使得大模型能够从“无状态”变成“有状态”,从而增强其记忆和上下文感知的能力。知识库作为一种让大模...

5430

当AI API 进入制造与医疗核心系统:工程侧需要提前考虑的几个关键问题

用户12007056

模型效果不错,接口也能调通,测试阶段一切正常。但当系统进入 真实运行环境,尤其是制造业和医疗行业的核心系统后,问题才真正开始暴露。

9410

Gemini 3 Pro 国内怎么购买 API Key 及大模型 LLM API 试用指南

用户11991468

摘要:Google 再次刷新了 多模态大模型 的上限。本文将为您权威解读 Gemini 3 Pro 的核心特性(超长上下文、原生多模态),并为国内开发者提供一份...

97120

2026 大模型(LLM)三巨头:Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 API 谁更值得购买?

用户11991468

摘要:2026 年的 AI 战场硝烟四起,Google、OpenAI 与 Anthropic 纷纷亮出核武器。面对 Gemini 3 Pro 的多模态、GPT-...

24210

Claude Code 国内保姆级使用指南:实测 GLM-4.7 与 Claude Opus 4.5 全方案解

羊cc

Claude Code 是 Anthropic 推出的旗舰级代理式编程工具。在2026年的技术环境下,国内开发者主要通过修改环境变量 ANTHROPIC_BAS...

2.7K50

生产环境中的大模型 API 接入实践:多模型并行的工程思考

用户12007056

随着大模型在各类业务中的使用逐渐深入,越来越多的系统开始将模型能力引入到核心业务链路中,例如内容生成、智能问答、辅助决策等场景。

9710

Llama-Factory 意图识别模型微调实战(RTX 4090D 24G)

Wangzy

此处没有广告,线上大家都说该平台性价比高,实际体验下来确实如此,一小时2元左右,配置加微调应该一两个小时就差不多了。

20310

收藏!LLM-RL训练框架:3大流派+6大框架,一文搞定

AI-Frontiers

原文: https://mp.weixin.qq.com/s/9f4mqYVGKNS-LhmHLl6CXw

43310
领券