Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Deep Research:不只是一个工具,是新时代的开始(5+实践例子)

Deep Research:不只是一个工具,是新时代的开始(5+实践例子)

作者头像
AI进修生
发布于 2025-02-05 07:02:30
发布于 2025-02-05 07:02:30
5050
举报
文章被收录于专栏:AI进修生AI进修生

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

Openai 又在筹备新的活动了,接下来会更新些什么?敬请期待。

Deep Research,不只是一个工具,是新时代的开始。

它基于o3的代理系统不是在做简单的总结,而是在思考,在发现联系,在独立得出结论。它真的在工作,真的在创造价值。

看看GPQA测试的数据:这是一个连Google都无法帮助解决的难题。PhD专家在自己领域能得81%,但跨领域只有31%。而o3呢?整体超过90%。这条曲线还在陡峭上升。

这些模型现在已经达到了超越人类智能的智能水平。

沃顿商学院 Ethan Mollick 教授在这篇文章中提出了对Deep Research(深度研究)的独到见解。

Deep Research — 搜索的终结,研究的开始。

自主代理(Agent)和推理模型(Reasoners ),这两条平行线,终于在这里交汇。

既具备人类专家般深度与细腻度,又能以机器速度进行研究的人工智能系统 —— OpenAI的“Deep Research”它正展示了的这种融合,让我们看到了未来:AI能像人类专家一样进行深度研究,却比人类快得多。

推理模型(Reasoners ):AI思考的革命

过去的聊天AI很简单:输入就输出,一个字一个字回应(更准确地说,逐个令牌)。为了提升推理能力,研究者想出了"在回答之前一步步思考"的提示方法。这种方法被称为思维链提示,它显著提高了人工智能的性能。

现在的推理模型不一样了。它会先产生"thinking tokens",再给出答案。这一突破至少体现在两个重要方面:

第一,由于AI公司如今可以让AI通过优秀问题解决者的示例来学习推理,AI便能更高效地“思考”。

训练出的推理链比人工提示更有效,特别是在数学和逻辑这些难题上。而这些领域是旧聊天机器人无法解决的。

第二,推理模型思考时间越长,答案越好(尽管随着思考时间的延长,改进的速度会变慢)。

这意味着,提升AI不再只依赖更大的模型,而是给它更多思考的时间。因为此前提升AI表现的唯一方法是训练规模不断扩大的模型,而这既昂贵又需要大量数据。

推理模型表明,仅仅通过让AI在回答问题时(即在所谓的“推理时计算”中)生成更多思维令牌,就能显著提升其表现,而无需依赖训练阶段的大规模计算。

研究生级别的谷歌防御问答测试(GPQA)是一系列多项选择题,即便博士生具备互联网接入,在非专业领域的答题正确率仅为34%,而在其专业领域则能达到81%。这一测试展示了推理模型如何加速了AI能力的提升。

AI代理:自主行动的AI。

简单说,给它一个目标,它就能自己去完成。现在,AI实验室都在竞相开发通用代理,想要打造能应对一切任务的系统。

看看OpenAI的Operator实验:比如,可以设想这样一个过程:代理读取一份报告,并根据其中的统计数据生成图表。

开始时一切顺利:它定位到报告、解析数据、登录图表平台。但接下来遇到难题:平台对数据格式和数量有限制,任务受阻。它尝试了转换格式、拆分数据、寻找备用接口,但都没有成功。

这个过程既展示了通用代理的潜力,也暴露了现有技术的局限。

Deep Research:代理+推理模型。

但别急着否定AI代理。专注特定领域的代理已经展现出惊人能力。比如OpenAI的Deep Research,就让我们看到了专业AI代理的力量(后文有更多的例子)。

专注于特定任务、具备经济价值的窄域代理已经初具成效。这些专用系统依托现有的大型语言模型技术,能在各自领域内取得卓越成就。一个明显的例子便是OpenAI的新系统Deep Research,它生动展示了专注型AI代理的强大能力。

Ethan Mollick 教授 称他使用Deep Research写过一篇关于深度研究的文章,得到了一份惊喜结果:13页,近4000字的专业分析。

▲ 认真花点时间看看它的“思考”过程的这三个片段

引用质量让人印象深刻。不是随意的网络文章,而是高质量学术论文,甚至能直接定位到关键引文。虽然还受限于付费墙,但已经展现出近似人类学者的研究能力。

当然,如果Deep Research 解锁那些被限制访问的高质量资料,很可能会有更好的效果输出:

对比Google的同名产品,差异很明显。Google引用更多,但良莠不齐。像是在做资料汇总,而不是深度研究。用老版Gemini 1.5,产出更像优秀本科生的作业。

但别忽视重点:这两个系统都在几分钟内完成了通常需要数小时的工作。OpenAI说他们能处理15%的高价值研究项目,9%的顶级项目。这个数字,从我的测试来看,并非夸张。

知名LLM框架llama_index的CEO 介绍, 代理报告生成将成为企业的核心需求。OpenAI的Deep Research已经证明了这一点。

但要真正在企业中落地,还需要三个关键能力:

1. 专业模板系统:支持问卷、财务报告等不同场景,直接输出PDF、PPT等格式,适应不同业务需求。

2. 离线数据处理:建立完整知识库索引、实现"无限上下文窗口"、支持RAG等技术集成。

3. 人机协作机制:领域特定的编辑验证、法律、工程等场景定制、多工具深度集成。

AI的拼图正在完整。

推理模型提供思维能力,代理系统负责行动。现在,像Deep Research这样的窄域代理已经能完成一些高级专家团队的工作。

但专家不会消失,他们的角色在转变:从直接工作者变成AI系统的指挥者和验证者。

各大实验室都在押注未来:更好的模型将突破通用代理的瓶颈。让AI能自主浏览网络,处理各类信息,在现实世界采取行动。

Operator表明我们还未达到那一阶段,但Deep Research则暗示我们可能正走在这条道路上。

这不是终点,而是新起点,AI正在从工具走向伙伴。

接下来是Deep Research实践例子,注意每个例子后面的共享链接,你可以直接打开查看Deep Research的结果。

Deep Research实践例子

一份关于 TTRPGs(桌面角色扮演游戏,Tabletop Role-Playing Games)演变的研究报告。

报告长度:30 页,10,600 字。

https://chatgpt.com/share/67a152bf-0d1c-8000-a4b1-773e7777e735

关于微塑料如何影响人体的研究共识

https://chatgpt.com/share/67a0a271-8850-8001-bd35-73a44510ab6f

任何主题的专家,全天候的助手

对 DeepSeek 整个研发历史进行专家级业务和技术分析

https://chatgpt.com/share/67a0d59b-d020-8001-bb88-dc9869d52b2e

《2010年以来戏剧讲故事方式的变迁》的研究报告

https://chatgpt.com/share/67a1717b-1e74-800f-bb85-9ec7c4f882ae

调查肺癌的分子基础、风险因素及新兴治疗手段如免疫疗法和基因疗法。

分析可再生能源存储:电池技术、替代方案、挑战与未来解决方案。

https://chatgpt.com/share/67a0e321-7cd0-8013-9aaa-f72db00a8746

Deep Research + o1-pro 解决了 R1、Claude3.5 和 o1-pro 单独无法解决的图形问题

OpenAI 员工 - “过去几周使用 Deep Research 是我个人的 AGI 时刻。现在只需 10 分钟即可生成准确而全面的竞争和市场研究(包含来源),而以前我至少需要 3 个小时。”

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI进修生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
OpenAI“背水一战”:紧急上线Deep Research,比DeepSeek强三倍?网友直呼AI开源大战要来了!
今早,OpenAI 突然举行了一场“惊喜”直播。直播中,OpenAI 宣布,“我们正在推出一项名为深度研究(Deep Research)的功能,这是一个能进行多步骤研究的模型,它可以发现内容、整合内容,并对这些内容进行推理。它甚至会针对你的提示提出‘澄清性’问题,以确保其多步骤研究不偏离方向。”
深度学习与Python
2025/02/03
2180
OpenAI“背水一战”:紧急上线Deep Research,比DeepSeek强三倍?网友直呼AI开源大战要来了!
OpenAI 的最新 Deep Research,知多少?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent - Deep Research 。
Luga Lee
2025/02/06
5630
OpenAI 的最新 Deep Research,知多少?
刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
一觉醒来,OpenAI 又发新产品了,这次是面向深度研究领域的智能体产品 ——「Deep Research」。
机器之心
2025/02/05
1230
刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
OpenAI震撼推出Deep Research距人类造神只差半步
欢迎大家在评论区留言评论自己想了解的工具、方向或职业等互联网相关内容,点赞和推荐多的,波哥会优先安排解答!
IT运维技术圈
2025/02/06
3110
OpenAI震撼推出Deep Research距人类造神只差半步
o3 deep research: LLM 驱动的 Agent 综述
大型语言模型(LLM)的崛起在过去几年引发了人工智能领域的飞跃式发展。尤其是 2022 年底 OpenAI 推出的 ChatGPT,短短两个月内月活用户就突破一亿,成为史上用户增长最快的消费者应用 (ChatGPT sets record for fastest-growing user base - analyst note | Reuters)。ChatGPT 所展现的强大自然语言对话和内容生成能力,如一场“核爆”引发全球对于通用人工智能的极大关注,各行各业开始思考如何将这类大模型应用到实际业务中。紧随其后,OpenAI 发布了更先进的 GPT-4 模型,能够理解更复杂的指令,并支持图像等多模态输入。这场由 ChatGPT 引领的LLM浪潮,不仅催生了大量类似产品和开源模型,也让“ AI 更自主地完成复杂任务”成为下一个技术探索热点。在这种背景下,由 LLM 驱动的 Agent(智能代理)概念逐渐兴起,成为 AI 技术爱好者和产业从业者共同关注的前沿方向。
立委
2025/03/08
3330
OpenAI 王炸 o3/o4-mini!打通自主工具+视觉思考,大佬赞“天才级”!AI 终获“十八般武艺”全家桶?
OpenAI 正式官宣 o3 & o4-mini:迄今最强模型,AI 终于学会“十八般武艺”全家桶了。
AI进修生
2025/04/18
1680
OpenAI 王炸 o3/o4-mini!打通自主工具+视觉思考,大佬赞“天才级”!AI 终获“十八般武艺”全家桶?
OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
4 月 24 日,OpenAI 宣布所有美国用户从此可以免费使用 Deep Research(深度研究)。这是一款集成于 ChatGPT 的 AI 研究助手,旨在帮助用户高效地完成复杂的多步骤研究任务,生成结构化且可验证的研究报告。那么,Deep Research 和 o3 模型之间有什么区别?智能代理发展过程中存在哪些挑战?这个模型成功的关键因素又是什么?
深度学习与Python
2025/05/05
1550
OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
薅羊毛!OpenAI发布「轻量版」Deep Research,免费用户也能
长期跟踪关注统计学、机器学习算法、深度学习、人工智能、大模型技术与行业发展动态,日更精选技术文章。回复机器学习有惊喜资料。
Ai学习的老章
2025/06/08
1960
薅羊毛!OpenAI发布「轻量版」Deep Research,免费用户也能
OpenAI紧急直播,ChatGPT疯狂开挂「深度研究」!10分钟爆肝万字现AGI雏形,刷榜人类最后考试
OpenAI研究负责人Mark Chen带领三位工作人员,在20多分钟内向我们详细演示了Deep Research的功能。
新智元
2025/02/15
1400
OpenAI紧急直播,ChatGPT疯狂开挂「深度研究」!10分钟爆肝万字现AGI雏形,刷榜人类最后考试
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
今早,谷歌Deep Research迎来史上最强升级,正式搭载了Gemini 2.5 Pro全球顶尖模型。
新智元
2025/04/10
1140
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
o3满血版体验?!Deep Research 远超 R1 ,开启深度研究(推理)完美解析癌症病历,堪比PhD研究员!
OpenAI 刚刚投下了一颗重磅炸弹。持续思考30分钟输出1万字,什么?人类的最后一次考试 26.6 ? 📷 今早8点,OpenAI紧急技术直播,Opena
AI进修生
2025/02/03
5610
o3满血版体验?!Deep Research 远超 R1 ,开启深度研究(推理)完美解析癌症病历,堪比PhD研究员!
等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
OpenAI 新推出的 Deep Research 功能令人瞩目,但目前仅向订阅了 OpenAI 每月 200 美元 ChatGPT Pro 计划的用户提供。在该功能发布不到 24 小时后,来自人工智能开发平台 Hugging Face 的 5 名工程师,其中包括该公司联合创始人兼首席科学家 Thomas Wolf,表示他们打造出了 Deep Research 的免费开源版本。
深度学习与Python
2025/02/08
2690
等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
OpenAI o3-pro深度评测 + API Key获取指南:一文上手最新旗舰模型!
2025年6月11日北京时间凌晨,OpenAI 再次搅动了AI江湖,正式推出了其 o3 系列的旗舰推理模型——o3-pro。这不仅仅是一次常规的产品迭代,更像是 OpenAI 对高端市场的一次精准打击。官方将其定位为“迄今为止能力最强的模型”,专为那些对可靠性要求极高的复杂任务而生,在科研、编程和数学等硬核领域大秀肌肉。
攻坚克难的那份表
2025/06/11
4960
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
北京时间2月3日上午,OpenAI正式推出面向深度研究领域的智能体产品深度研究(Deep research)功能。
小腾资讯君
2025/02/06
3430
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。
新智元
2025/03/03
860
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
憋了大半年,Anthropic终于放出大招——首款混合推理模型Claude 3.7 Sonnet重磅登场!
新智元
2025/02/25
2820
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
紧急消息!OpenAI现已免费推出Deep Research功能,配备强大AI代理能力。
昨天凌晨4点30分,OpenAI发布了轻量级版本的Deep Research功能,显著提升了当前的速率限制,扩大了Plus、Team和Pro用户的使用范围。特别值得关注的是,从昨天起,免费ChatGPT用户也能够使用Deep Research,并且支持最新的o4-mini模型。
福大大架构师每日一题
2025/04/26
1000
紧急消息!OpenAI现已免费推出Deep Research功能,配备强大AI代理能力。
马斯克全新发布Grok3模型,坐拥20万张卡的新王!
在 200 多万人的见证下,马斯克的 AI 公司 xAI 正式推出 Grok 3!
Datawhale
2025/02/19
1670
马斯克全新发布Grok3模型,坐拥20万张卡的新王!
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
今天凌晨,OpenAI 宣布 Deep Research 已经面向所有 ChatGPT Plus、Team、Edu 和 Enterprise 用户推出(刚发布时仅有 Pro 用户可用),同时,OpenAI 还发布了 Deep Research 系统卡。
机器之心
2025/02/26
590
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
就在刚刚,人工智能初创公司 Perplexity 上线 Deep Research 功能,其能生成任何主题的深度研究报告。
机器之心
2025/02/19
2070
又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
推荐阅读
OpenAI“背水一战”:紧急上线Deep Research,比DeepSeek强三倍?网友直呼AI开源大战要来了!
2180
OpenAI 的最新 Deep Research,知多少?
5630
刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
1230
OpenAI震撼推出Deep Research距人类造神只差半步
3110
o3 deep research: LLM 驱动的 Agent 综述
3330
OpenAI 王炸 o3/o4-mini!打通自主工具+视觉思考,大佬赞“天才级”!AI 终获“十八般武艺”全家桶?
1680
OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
1550
薅羊毛!OpenAI发布「轻量版」Deep Research,免费用户也能
1960
OpenAI紧急直播,ChatGPT疯狂开挂「深度研究」!10分钟爆肝万字现AGI雏形,刷榜人类最后考试
1400
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
1140
o3满血版体验?!Deep Research 远超 R1 ,开启深度研究(推理)完美解析癌症病历,堪比PhD研究员!
5610
等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
2690
OpenAI o3-pro深度评测 + API Key获取指南:一文上手最新旗舰模型!
4960
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
3430
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
860
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
2820
紧急消息!OpenAI现已免费推出Deep Research功能,配备强大AI代理能力。
1000
马斯克全新发布Grok3模型,坐拥20万张卡的新王!
1670
今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
590
又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
2070
相关推荐
OpenAI“背水一战”:紧急上线Deep Research,比DeepSeek强三倍?网友直呼AI开源大战要来了!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档