经过 2025 年的试水,Agent 的落地效果将在 2026 年受到集中检验。能否持续产生业务价值,将成为衡量 Agent 成功与否的核心标准,而支撑其稳定、...
“通往超级智能的那条路——无非是不断训练大语言模型、喂更多合成数据、雇上几千人做后训练、再在强化学习上搞点新花样——在我看来完全是胡扯,这条路根本行不通。”
在数字化浪潮席卷全球的今天,AI 正以前所未有的深度和广度融入企业发展的脉络之中,成为驱动创新与增长的核心引擎。那么,如何通过 AI 技术发现新的商业与增长机会...
在实际应用中,推理成本高昂、算力需求巨大,直接制约了业务的广泛落地。大模型在实际应用中面临的挑战不仅是“快不快”,更是“省不省”。本专题将跳出表面的参数微调,系...
vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttent...
这波快速发展的 AI 浪潮,吸引了很多人投身创业。根据 Thunderbit 数据,2025 年全球有超过 1 万家获得融资的 AI 创业公司,如果把所有“沾 ...
12 月 12 日,决战紫金之巅——云谷杯・2025 人工智能应用创新创业大赛总决赛暨闭幕式在云谷中心成功举办。本届大赛在杭州城西科创大走廊管理委员会、杭州西湖...
在全球人工智能领域竞争快速升温的当下,谷歌与 OpenAI 再次在同一天抛出重磅更新,令整个行业的注意力高度集中。
本文为《2025 年度盘点与趋势洞察》系列内容之一,由 InfoQ 技术编辑组策划。本系列覆盖大模型、Agent、具身智能、AI Native 开发范式、AI ...
如今,以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务,而DeepSearch 作为深度思考大模型的核心搜索器,在推理过程中通过迭代调用...
通用大模型(LLM)的狂飙突进,终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE(美国执业医师资格考试)中表现优异,但在面对需...
本文共同第一作者为西安交通大学硕士生常建磊和博士生梅若风。柯炜为西安交通大学副教授。论文通讯作者为西安交通大学教授许翔宇,其研究方向涵盖三维视觉、生成式 AI ...
自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。
随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。
近日,在全球人工智能领域最具影响力的顶级学术会议 NeurIPS(神经信息处理系统大会)上, 清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对...
最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网络,即使在完全不同的数据集上训练、用不同的初始化和超参数,最终学到的权重都会收敛到一个共享的...
昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业知识工作上最强大的模型系列」,在众多基准测试中,GPT-5...
表征对齐(REPA)可通过将强大的预训练视觉编码器的表征蒸馏为中间扩散特征,来指导生成式训练。该方法于去年十月份问世,一直以来都备受关注,已成为加速扩散 Tra...
多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言去推理?
在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源: