Avraham Poupko 在 OOP 大会 上发表了一场关于他在日常工作中如何使用 AI 的演讲。
AIBrix 项目目前已经开源,本文为AIBrix 技术解析。详见: 🔗 vLLM 博客:https://blog.vllm.ai/2025/02/21/ai...
从海外的OpenAI、微软Bing Copilot、Perplexity AI,再到国内的豆包、Kimi,都是这一共识下的代表产品。
检索增强生成 (RAG) 是一种先进的技术,它通过检索相关知识来增强 AI 响应。通过为模型提供必要的上下文信息,它可以提高响应的准确性和相关性。当您上传内部文...
论文标题:ST-FiT: Inductive Spatial-Temporal Forecasting with Limited Training Data
作为一名运维工程师,你是否正在寻找一种更智能、更高效的方式来管理复杂的IT基础设施?DeepSeek(或类似AI工具)可能是你的答案。今天,我们将深入探讨如何将...
项目代码:https://github.com/lewandofskee/MobileMamba(所有代码/模型权重均已开源)
本文详细回顾了大型语言模型从2017年Transformer架构的出现到2025年DeepSeek-R1的发展历程,涵盖了BERT、GPT系列、多模态模型、推理...
论文题目:EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Sp...
最初,DeepSeek凭借其“性价比”优势迅速扩展到全球各地,随后引发了整个行业的激烈竞争。到了2月初,谷歌推出了Gemini 2.0系列模型。
在容器编排的世界中,k3s (k8s) 无疑是备受瞩目的存在。此次聚焦在 k3s (k8s) 环境下安装 ollama,并实现运行 deepseek。首先映入眼...
大家好!今天我们来聊聊WRF模型中的降水变量。WRF作为一种广泛使用的气象预报模型,其输出中包含多个与降水相关的变量,这些变量的理解和正确使用对于气象研究至关重...
前面我们无论是直接部署,还是容器部署都还是单机的模型,受单机GPU限制,并不能跑比较大的模型,今天我们将用多台机器组成一个集群来跑一个更大的模型。
大模型DeepSeek凭借“小力出奇迹”成为国货之光,其在数学、代码、自然语言推理等任务上的优异性能而大受欢迎。
前面小节我们通过conda创建虚拟Python环境,实现vLLM和OpenWebUI的配置,但是这个安装部署会非常繁琐非费时间。我们今天将使用容器来部署。环境还...
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的输出模型技术 - DeepSearch 和 DeepRe...
近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效...
近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。
就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!
该论文的第一作者是清华大学计算机系研究生温佳鑫,蚂蚁技术研究院副研究员关健为共同第一作者。