首页
学习
活动
专区
圈层
工具
发布

#架构

46. vLLM API Server 架构:高性能推理服务的设计与实现

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析了vLLM API Server的架构设计与实现细节,...

200

软件工程/架构/开发领域常见的 理念 – 原则 – AI提示词优化 – 约束

收心

💡 总结 你问的这种“简短代号型”原则和理念,在开发规则、架构思想、安全规范、团队方法论几个领域非常多。

4110

.NET 10 与智能体时代的架构演进:以 File-Based Apps 为核心的 C# 生态重塑

张善友

在 AI 驱动的开发流程中,代码的生成具有以下核心特征,这些特征直接决定了.NET 10 架构调整的必要性:

3710

深入浅出 supermemory:你的AI第二大脑如何打造?

AgenticAI

你是否曾经遇到过这样的困扰:在与AI助手对话时,它总是"忘记"之前的聊天内容?或者想要查找之前保存的重要信息,却怎么也找不到?supermemory 这个开源项...

10010

xxl-job 和 elastic-job,哪个更好?

苏三说技术

今天我们来探讨一个让许多技术团队纠结的问题:在分布式任务调度领域,XXL-JOB和Elastic-Job,到底哪个更好?

10010

让 Q 值估计更准确:从 DQN 到 Double DQN 的改进方案

deephub

DQN 用 max Q(s',a') 计算目标值,等于在挑 Q 值最高的动作,但是这些动作中包括了那些因为估计噪声而被高估的动作,素以就会产生过估计偏差,直接后...

10110

不跟英伟达走老路,这家GPU公司的技术架构藏着哪些关键解?

深度学习与Python

对于国产 GPU 行业来说,没有哪个时间节点比当下更宝贵。在政策支持硬科技企业上市的背景下,国产 GPU 迎来了难得的上市黄金窗口期。但上市并非终点,在敲钟的那...

9410

从局部最优到全局跃迁:关于企业“智慧运营中枢”模式的构建与实践思考

深度学习与Python

为解决上述问题,经过大量实践验证,“企业架构” 思想是推动数智化转型科学有序开展最为契合的方法理论。成熟的企业架构方法为转型提供了系统化框架:通过对企业业务架构...

9610

42. Worker / Driver 架构:vLLM的分布式推理核心

安全风信子

作者:HOS(安全风信子) 日期:2026-01-19 来源平台:GitHub 摘要: 本文深入剖析vLLM框架中的Worker / Driver架构,作...

7410

# 腾讯混元3D模型助力拓竹科技将建模周期从数小时压缩至分钟级

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

腾讯混元3D模型接入拓竹科技MakerWorld平台,利用独创的3D-DiT与3D-Omni双架构方案,将3D建模周期从数小时大幅压缩至分钟级。该方案通过“AI...

10310

# 腾讯云 EdgeOne 边缘安全加速平台架构解析与 DDoS 高防改版特性概要

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

腾讯云 EdgeOne (Tencent Cloud EdgeOne) 是中国首款基于全新架构的真正一体化边缘安全加速平台。该产品摆脱了传统拼凑式的架构,依托腾...

11310

智慧燃气“人工智能+”白皮书 | 核心概要

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

• 研究方法:本报告采用“现状-需求-架构”三位一体的设计方法论。首先基于行业政策与燃气企业(如泰能天然气)的实际业务痛点进行定性分析,进而通过分层解耦(算力层...

12210

OpenDoc-0.1B:0.1B参数掀起文档解析领域的轻量革命

LiuDag

现在AI模型都爱往千亿、万亿参数上堆,卷得没边了。而复旦大学视觉与学习实验室去年12月开源的OpenDoc-0.1B,偏要反其道而行之——仅用0.1B(1亿)参...

11610

Go 的语言设计天然不适合复杂业务系统抽象

JanYork_简昀

当语言不直接 enforce 架构规则时,治理会成为主战场:lint 与 depguard、代码生成、架构决策记录、CI 适应度函数、统一脚手架、测试策略等。它...

10510

腾云出海,扬帆远航 | 2026腾讯云合作伙伴大会出海专场三亚启航,共探全球增长新范式

腾讯云音视频

腾讯 | 行业应用产品经理 (已认证)

出海专场上,围绕实时互动与边缘安全加速两大腾讯云核心出海能力,腾讯云音视频产品架构专家宛新万、腾讯云边缘平台产品架构总监胡兵,带来了深度的全球场景解决方案分享,...

14010

【Linux系统编程】(二十三)从块到块组:Ext2 文件系统核心架构的初步认识

_OP_CHEN

在深入 Ext2 文件系统之前,我们必须先搞懂三个核心基础概念 ——块(Block)、分区(Partition)、inode(索引节点)。这三个...

9710

跨平台 UI 工程的 Agentic 转型:MCP 在 Avalonia 生态中的深度应用与架构演进

张善友

在人工智能辅助软件开发的演进历程中,大型语言模型(LLM)长期以来一直面临着一个核心瓶颈:由于缺乏对运行中应用程序状态的实时访问权,这些模型往往处于一种“文本真...

12510

支持插件化扩展的云构建平台推荐:企业级开发新范式

gavin1024

8810

KIOXIA:当SSD开始"思考"——存储架构的算力升级

数据存储前沿技术

在高性能存储系统中,一个关键矛盾正在浮现:网络带宽正从400Gbps向1.6Tbps跃迁,SSD单盘性能已突破32GB/s,但承载数据处理任务的xPU却受限于P...

9810

SANDISK:NVMe SSD管理新标准:I3C总线技术

数据存储前沿技术

本文将系统解析I3C的技术架构、通信原理及其在NVMe SSD管理中的落地实践,帮助技术从业者理解这一正在重塑存储管理范式的关键转型。

12310
领券