腾讯科技(深圳)有限公司 | 市场研究 (已认证)
腾讯云推出的对话式 AI 解决方案基于 TRTC 技术,旨在解决传统 AI 对话的高延迟与兼容性难题。该方案通过“客户端 SDK + 实时互动 AI 服务”架构...
vLLM是一个快速且易于使用的库,用于大型语言模型(LLM)的推理和服务。vLLM最初由加州大学伯克利分校的天空计算实验室开发,现已发展为一个由学术界和工业界共...
DSPy 的诞生,正是为了将 LLM 编程从“手工艺”带入“工程化”时代。它不把提示视为静态字符串,而是可学习、可组合、可优化的程序组件。
PydanticAI 把 LLM、Python 类型系统和 Pydantic 模型组合在一起。核心理念很简单:LLM 响应必须符合预定义的 Python 类型,...
【新智元导读】最新综述首次系统探讨LLM控制机器人的安全威胁、防御机制与未来挑战,指出LLM的具身鸿沟导致其在物理空间可能执行危险动作,而现有防御体系存在逻辑与...
原文: https://mp.weixin.qq.com/s/oRUjkoUcHOrMtHfVHkr5Cw
大语言模型的出现,彻底改变了数据的宿命,原本只能躺在硬盘里吃灰的存档、记录,如今转化为了能够用于训练大模型、让大模型理解专业化领域的“智慧之果”。
Model Context Protocol (MCP) 是一个开放的协议标准,用于在大语言模型(LLM)和外部工具之间建立标准化的通信机制。本文将介绍 MCP...
摘要:Google 再次刷新了 多模态大模型 的上限。本文将为您权威解读 Gemini 3 Pro 的核心特性(超长上下文、原生多模态),并为国内开发者提供一份...
在企业知识建设过程中,90% 以上的信息都以非结构化形式存在:文档、制度、报告、网页、说明书……这些内容信息密度高,却长期沉睡在文件系统中,难以被计算、难以被复...
随着大语言模型(LLM)从对话交互工具转向企业复杂业务流程的核心处理载体,AI Agent 正在驱动软件工程范式的深层重构。对开发者、产品经理及技术管理者而言,...
摘要:OpenCode 作为一款革命性的终端 AI 编程工具,凭借其独创的 Plan/Build 双模式工作流火爆技术圈。本文将深度解析 OpenCode 的核...
作为一款热门的开源LLM应用开发平台,Dify凭借其直观的界面和全流程工具链,成为很多团队从原型到生产环境的首选。2026年1月16日发布的v1.11.3版本,...
这篇论文提出了TowerMind,一个基于塔防游戏的AI学习环境和基准,用于评估大型语言模型(LLM)作为智能体的能力。TowerMind通过提供低计算需求和多...
Gemma Scope 2 是一套旨在解释 Gemini 3 模型行为的工具,使研究人员能够分析模型的突发行为,审核和调试 AI 代理,并针对越狱、幻觉和阿谀奉...
本文的目标是解释为什么现代LLM架构在前馈部分使用 SwiGLU 作为激活函数并且已经放弃了 ReLU。
LLM 在多步骤问题求解上的表现已经相当不错了,但复杂逻辑链的处理仍然是个难题。模型的推理深度直接决定了它在多跳推理任务中能走多远、有多可靠。