发布

腾讯云TVP

专栏成员
458
文章
642044
阅读量
425
订阅数
Agent元年:从聊天机器人到数字员工的当代进化史
当ChatGPT核爆式走红时,全人类第一次意识到,AI不仅能回答问题,还能成为你的"赛博同事"。早期的Copilot(副驾驶)类助手就像乖巧的实习生——勤快听话,你问它答,你令它动。而如今的Agent(智能代理)已经进化成能独当一面的"数字员工",它不再是只会等待指令的被动助手,而是能自主规划、拆解任务、调用工具的智能管家。
立委
2025-03-08
40
Agent:数字代理的崛起与未来
在ChatGPT引发的人工智能热潮中,我们亲眼见证了AI应用形态的戏剧性演变。回想2022年底,当人们首次体验ChatGPT时,那种震撼感仍历历在目——一个能够理解复杂问题并提供流畅回答的聊天机器人(chatbot),彻底改变了我们对机器智能的期望。这种应用形态——我们姑且称之为"对话式AI"——本质上是大语言模型(LLM)应用的初级表现形式,一种简单的信息交换机制。
立委
2025-03-08
60
o3 deep research: LLM 驱动的 Agent 综述
大型语言模型(LLM)的崛起在过去几年引发了人工智能领域的飞跃式发展。尤其是 2022 年底 OpenAI 推出的 ChatGPT,短短两个月内月活用户就突破一亿,成为史上用户增长最快的消费者应用 (ChatGPT sets record for fastest-growing user base - analyst note | Reuters)。ChatGPT 所展现的强大自然语言对话和内容生成能力,如一场“核爆”引发全球对于通用人工智能的极大关注,各行各业开始思考如何将这类大模型应用到实际业务中。紧随其后,OpenAI 发布了更先进的 GPT-4 模型,能够理解更复杂的指令,并支持图像等多模态输入。这场由 ChatGPT 引领的LLM浪潮,不仅催生了大量类似产品和开源模型,也让“ AI 更自主地完成复杂任务”成为下一个技术探索热点。在这种背景下,由 LLM 驱动的 Agent(智能代理)概念逐渐兴起,成为 AI 技术爱好者和产业从业者共同关注的前沿方向。
立委
2025-03-08
70
【外一篇:推理范式演进中的概念】
- 训练时间(Training Time):参数空间Θ的优化过程,目标函数为误差最小化 minL(θ;D_train) - 推断时间(Inference Time):固定参数θ时对新样本x_test的条件分布预测p(y|x_test;θ)
立委
2025-03-07
370
思维链是大模型的符号神助攻
在人工智能发展的历史长河中,符号逻辑和神经网络一直如两条平行线,难以交汇。然而,2024年春节,DeepSeek发布的推理大模型R1揭示了一个令人惊叹的技术突破——思维链(Chain of Thought, CoT)的自主生成,其展现出的语言序列仿佛在模拟人类的符号逻辑。这一强化学习的进展或将重新定义符号逻辑与神经网络的融合路径。
立委
2025-03-05
1020
关注专栏作者,随时接收最新技术干货
TVP官方团队
腾讯 | 产品经理
PerfCloud王福
PerfCloud | 总经理
DeepSeek:大模型应用的极致性价比与机遇
2025年初,DeepSeek开源大模型R1的发布,打破了OpenAI的闭源金身,为人工智能领域带来了新的变革。DeepSeek不仅在性能上与OpenAI的模型相媲美,还在训练和推理成本上实现了显著降低。这使得原本对大模型应用望而却步的中小企业和开发者,能够以更低的成本、更高的效率参与到人工智能的开发和应用中来。本文将深入探讨DeepSeek的极致性价比如何降低门槛,并为实时性要求高、成本敏感的端侧、端边云场景带来新的机遇。
楼炜
2025-03-05
1300
The Three-Stage Scaling Laws Large Language Models
Mr. Huang's background features three S-curves, illustrating the scaling relay race across three stages of large language models, demonstrating a persistent spirit akin to the Chinese fable of the legendary Old Man Who Moved Mountains.
立委
2025-03-03
880
大模型三阶段的 scaling laws 接力赛
黄教主背后是三个S曲线,illustrate 的是大模型三个阶段的“做大做强”的 scaling 接力赛,颇显挖山不止的愚公移山精神。
立委
2025-03-03
890
深度学习的局限性研究综述
深度学习模型本质上是高维概率密度估计器,它的核心目标是通过参数θ找到条件概率分布P(y|x;θ)的最佳近似。模型通过学习大量的训练数据,试图捕捉数据中的大大小小的统计规律,并将其泛化到未知数据。然而,这种统计学习范式决定了一个根本性问题:模型学习的是P(y|x)而非P(x→y),即统计相关性而非因果关系。
立委
2025-03-03
640
左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练
在大模型后训练中,像deepseek R1那样交替使用监督微调(SFT)和强化学习(RL),而非单一依赖 RL 或蒸馏,背后的核心逻辑如下。
立委
2025-02-28
800
o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析
A: DeepSeek R1 采用了四阶段的训练流程,包括两个强化学习(RL)阶段和两个监督微调(SFT)阶段 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。这一多阶段策略旨在先通过少量数据稳定模型输出格式,然后大规模提升推理能力,接着扩展通用能力,最后对齐人类偏好,逐步打造出既擅长推理又安全实用的模型 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园) (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。具体来说:
立委
2025-02-28
2150
RPA 赛道与大模型Co-pilots早期创业者的困局
- 传统 RPA:依赖工程师编写脚本或流程图(如 UiPath 的拖拽式设计器),需精准定义每一步操作逻辑,如同教机器人跳格子,容错率低。 - LLM Agent:直接理解人类意图("把邮件里的发票信息录入系统"),自主拆解任务链条,动态调整执行路径。 - 典型案例:ChatGPT 插件系统已能调用 API 完成订机票、查数据等操作,而传统 RPA 实现同等功能需低代码脚本。
立委
2025-02-27
730
DeepSeek 技术跃迁:AI 应用的下一站在哪?
2025 年,DeepSeek 以颠覆性技术突破重构全球 AI 竞争格局,其创新的多模态架构与超大规模推理能力,不仅激起了 AGI 技术的进化浪花,更在产业实践的深水区掀起了一场智能化落地的应用热潮。
TVP官方团队
2025-02-27
1580
Linguists Should Find Self-Attention Intuitively Familiar
For linguists bewildered by large language models (LLMs), the confusion often stems from terminology and implementation details obscuring shared foundational principles. Let’s cut through the noise and focus on self-attention — the beating heart of the Transformer architecture.
立委
2025-02-25
510
语言学家应该很容易理解自注意力机制
如果语言学家以前觉得大模型烧脑和不解,那是因为窗户纸没有捅破,存在不同体系下的术语与机制细节的理解障碍,但底层逻辑并不乏不少共同的东西。本篇聚焦在大模型Transformer架构中的核心注意力机制的理解。
立委
2025-02-24
1140
符号主义被打入冷宫太久了,难道神经是AI的终结者吗?
虽然没人可以预测未来,虽然抛弃两条路线的一条感觉政治不正确,但的确不能排除这种单极主义的可能性。
立委
2025-02-24
600
立委科普:如何理解自注意力机制中的QKV分工?
为了学习序列上下文的依赖关系,为什么序列中的每一个 token 都要派生出三个分工角色:Q(Query),K(Key),V(Value)?
立委
2025-02-21
1970
Transformer 和注意力机制简介
基础大模型通过原始大数据的“自监督学习”(self-srupervised learning),利用多层神经网络,获得数据相关的知识。自监督学习是一种特别的监督学习,它利用“掩码”获得监督信号。我们知道监督学习的训练数据是标注了输出目标作为监督信号的学习,但自监督无需人类标注,而是在数据中遮盖了部分数据点,让系统学习预测它(“填空”或“接龙”),以被遮盖的数据点作为标准答案和监督信号。主流的GPT大模型的掩码就是遮盖住下一个词,让系统仅仅根据上文来预测它(叫 next token prediction),这是当前生成式AI的主流模型。
立委
2025-02-21
1490
DeepSeek重新定义未来应用场景,如何拿到新船票?
2025 年开年,技术圈迎来了“AI 领域的史普尼克时刻”。当全球 AI 竞赛进入深水区,DeepSeek 凭借其创新的架构设计与开源生态的双向突破,不仅掀起新一轮 AI 创新热潮,更引发业内对应用场景的广泛探索,国民级应用微信接入 R1 上线「AI 搜索」,各大厂商纷纷将 DeepSeek 嵌入业务。
TVP官方团队
2025-02-20
1410
True Story Behind DeepSeek: Learning to Think Slowly Without Human Supervision
InfoQ: "DeepSeek adheres to a pure reinforcement learning approach, but the industry often refers to RL as 'alchemy' - how did they make this process controllable and accessible? What's innovative about their reasoning paradigm?"
立委
2025-02-16
540
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档