首页
学习
活动
专区
圈层
工具
发布

#优化

52. vLLM 核心模块逐文件:scheduler.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入解析vLLM调度器核心模块scheduler.py,揭示其...

100

51. vLLM 核心模块逐文件:engine.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入解析vLLM引擎核心模块engine.py,通过源码精读揭...

100

Spring AI系列之RAG(检索增强生成)从原理到实战指南

SmileNicky

RAG的工作流程可以分为两大阶段:离线索引(Indexing) 和 在线检索生成(Retrieval & Generation)。

100

用 CANN 部署大语言模型(LLM)实战指南:让百亿参数“跑”在国产硬件上

晚霞的不甘

本文将带你完成一次完整的 LLM 部署实战——以 Llama-2-7B 为例,展示如何利用 CANN 实现:

900

深入理解 CANN:为 AI 量身打造的异构计算架构

晚霞的不甘

cann组织链接:https://atomgit.com/cann ops-nn仓库链接:https://atomgit.com/cann/ops-nn

2000

Flutter for OpenHarmony从基础到专业:深度解析新版番茄钟的倒计时优化

晚霞的不甘

旧版仅显示大号时间文本(40px),新版采用 Stack 布局叠加圆形进度条 + 中心时间:

1200

CANN 编译器深度解析(一):从 ONNX 到 CANN IR 的图优化全流程

晚霞的不甘

相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 当你运行:

2100

多模态大模型落地实战:CANN 如何加速 Vision-Language 推理?

晚霞的不甘

通用推理框架往往在此类任务中“力不从心”。而 CANN(Compute Architecture for Neural Networks) 凭借其全栈协同设...

2700

深入 CANN 图编译引擎:如何让神经网络“跑得更快、吃得更少”?

晚霞的不甘

而 图编译引擎的作用,就是在模型部署前,对这张计算图进行“外科手术式”优化,生成一个更适合目标硬件执行的高效版本。

1100

Flutter for OpenHarmony《智慧字典》 App 主页深度优化解析:从视觉动效到交互体验的全面升级

晚霞的不甘

利用 SingleTickerProviderStateMixin 和 AnimationController,为主标题添加了 淡入动画。

2400

[鸿蒙2025领航者闯关]Flutter + OpenHarmony 性能调优实战:打造 60fps 流畅体验与低功耗的鸿蒙应用

晚霞的不甘

更严峻的是,低端设备(如入门级手表)内存仅 128MB,而 Flutter 默认内存占用约 80–120MB。

1800

CANN:迈向 AI 原生计算的新范式

晚霞的不甘

在过去的十年中,人工智能从实验室走向千行百业。然而,一个根本性问题始终存在:我们是否仍在用“为通用计算设计的硬件”来运行“本质上高度结构化的 AI 任务”?

1900

Flutter for OpenHarmony从基础到惊艳:深度解析新版 AI 聊天应用的三大跃迁

晚霞的不甘

旧版应用打开即为空白聊天区,用户需自行输入首条消息。新版则引入了完整的欢迎界面(_buildWelcomeScreen):

2100

ollama v0.15.6发布:上下文限制修复、自动模型下载、Claude环境变量优化、Droid与Qwen全面更新详解

福大大架构师每日一题

在 2026 年 2 月 7 日,Ollama 官方正式发布 v0.15.6 最新版本。本次更新虽然版本号看似小幅提升,但实际上内部改动巨大,涉及 模型加载机制...

1800

ComfyUI v0.12.2 发布——新增 4B ACE Step 1.5 模型支持,修复多项稳定性问题!

福大大架构师每日一题

2026 年 2 月 4 日,ComfyUI 正式推出了 v0.12.2 版本。本次更新为“Immutable Release”,仅支持修改版本标题和说明。虽然...

3200

2026-02-05:转换字符串的最小操作次数。用go语言,给定一个只含小写字母的字符串 s。你可以重复做这样的事情任意次:从当前字符串中选出

福大大架构师每日一题

2026-02-05:转换字符串的最小操作次数。用go语言,给定一个只含小写字母的字符串 s。你可以重复做这样的事情任意次:从当前字符串中选出一种出现过的字母,...

1400

openclaw v2026.2.1 发布:安全强化、系统提示升级、UI优化与性能全面提升

福大大架构师每日一题

2026年2月2日,openclaw 正式发布 v2026.2.1 版本。此次更新围绕系统安全、Agent 功能升级、消息传输稳定性以及 Web UI 优化进行...

1200

ollama v0.15.4 更新:OpenClaw全面上线,优化集成流程与工具解析能力大升级!

福大大架构师每日一题

Ollama 在 2026 年 2 月 2 日正式发布了 v0.15.4 版本,本次更新带来了多个关键改进与功能增强,尤其是集成系统和模型解析器的深度优化,提升...

7700

DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级!

福大大架构师每日一题

2026 年 2 月 1 日,DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强,进一步完善了在多设备(尤其是 ...

1900

ComfyUI v0.11.1正式发布:新增开发者专属节点支持、API节点强化、Python 3.14兼容性更新等全方位优化!

福大大架构师每日一题

2026年1月29日,ComfyUI迎来了全新的 v0.11.1版本。本次更新属于不可变版本(immutable release),主要优化了开发者体验、API...

1700
领券