首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#模型

软件架构师如何在日常工作中使用 AI

深度学习与Python

Avraham Poupko 在 OOP 大会 上发表了一场关于他在日常工作中如何使用 AI 的演讲。

000

字节跳动开源 AIBrix:填补云原生大模型推理“系统层”空白

深度学习与Python

AIBrix 项目目前已经开源,本文为AIBrix 技术解析。详见: 🔗 vLLM 博客:https://blog.vllm.ai/2025/02/21/ai...

000

DeepSearcher深度解读:Agentic RAG的出现,传统RAG的黄昏

崔认知

从海外的OpenAI、微软Bing Copilot、Perplexity AI,再到国内的豆包、Kimi,都是这一共识下的代表产品。

000

手把手教你用DeepSeek和Dify打造企业级AI助手

wayn

检索增强生成 (RAG) 是一种先进的技术,它通过检索相关知识来增强 AI 响应。通过为模型提供必要的上下文信息,它可以提高响应的准确性和相关性。当您上传内部文...

400

AAAI 2025| ST-FiT:使用有限训练数据的归纳时空预测

时空探索之旅

论文标题:ST-FiT: Inductive Spatial-Temporal Forecasting with Limited Training Data

1100

运维人必看:DeepSeek如何落地运维场景

lyb-geek

作为一名运维工程师,你是否正在寻找一种更智能、更高效的方式来管理复杂的IT基础设施?DeepSeek(或类似AI工具)可能是你的答案。今天,我们将深入探讨如何将...

800

CVPR 2025 | MobileMamba开源:轻量级多感受野视觉Mamba主干

小白学视觉

项目代码:https://github.com/lewandofskee/MobileMamba(所有代码/模型权重均已开源)

500

最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)

小白学视觉

本文详细回顾了大型语言模型从2017年Transformer架构的出现到2025年DeepSeek-R1的发展历程,涵盖了BERT、GPT系列、多模态模型、推理...

600

【CVPR 2025】高效视觉Mamba模块EfficientViM,即插即用!

小白学视觉

论文题目:EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Sp...

500

2025年2月的LLM最新排名中,Grok 3表现出色,逆势而上,而Claude 3.7 Sonnet则令人刮目相看,成绩突出!

福大大架构师每日一题

最初,DeepSeek凭借其“性价比”优势迅速扩展到全球各地,随后引发了整个行业的激烈竞争。到了2月初,谷歌推出了Gemini 2.0系列模型。

1300

绝了!k3s (k8s) 安装 ollama 运行 deepseek 全流程揭秘,yaml全公开

福大大架构师每日一题

在容器编排的世界中,k3s (k8s) 无疑是备受瞩目的存在。此次聚焦在 k3s (k8s) 环境下安装 ollama,并实现运行 deepseek。首先映入眼...

600

学习笔记 | 浅析WRF降水变量的计算

用户11172986

大家好!今天我们来聊聊WRF模型中的降水变量。WRF作为一种广泛使用的气象预报模型,其输出中包含多个与降水相关的变量,这些变量的理解和正确使用对于气象研究至关重...

400

DeepSeek-多机多卡集群部署

运维小路

前面我们无论是直接部署,还是容器部署都还是单机的模型,受单机GPU限制,并不能跑比较大的模型,今天我们将用多台机器组成一个集群来跑一个更大的模型。

1000

“小力出奇迹”的DeepSeek,也难逃大模型安全短板?

科技云报道

大模型DeepSeek凭借“小力出奇迹”成为国货之光,其在数学、代码、自然语言推理等任务上的优异性能而大受欢迎。

700

DeepSeek-容器化(Docker)部署vLLM和Open WebUI

运维小路

前面小节我们通过conda创建虚拟Python环境,实现vLLM和OpenWebUI的配置,但是这个安装部署会非常繁琐非费时间。我们今天将使用容器来部署。环境还...

1300

一文读懂:DeepSearch 前生今世

Luga Lee

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的输出模型技术 - DeepSearch 和 DeepRe...

600

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

新智元

近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效...

500

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

新智元

近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。

1400

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

新智元

就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!

100

大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达

机器之心

该论文的第一作者是清华大学计算机系研究生温佳鑫,蚂蚁技术研究院副研究员关健为共同第一作者。

500
领券