腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
腾讯云TVP
专栏成员
举报
458
文章
642044
阅读量
425
订阅数
订阅专栏
申请加入专栏
全部文章(458)
企业(93)
腾讯云(84)
腾讯云开发者社区(45)
行业(41)
云计算(39)
模型(32)
数据(32)
开发者(31)
腾讯(31)
devops(29)
数据库(28)
人工智能(28)
大数据(28)
腾讯云 tvp(28)
科技(25)
开源(21)
架构(21)
视频(21)
运维(20)
互联网(20)
产品(19)
系统(19)
工作(17)
管理(17)
微服务(15)
程序员(15)
实践(15)
云直播(13)
数据分析(13)
服务(13)
研发(13)
微信(12)
架构师(12)
深度学习(11)
工具(11)
腾讯云架构师技术同盟(11)
DeepSeek(11)
区块链(10)
sql(10)
网络安全(10)
金融(9)
工业物联(9)
serverless(9)
编程算法(9)
二维码(9)
效率(9)
大模型知识引擎(9)
容器(8)
物联网(8)
aigc(8)
软件(8)
数据万象(7)
分布式(7)
小程序(7)
开发(7)
自动驾驶(6)
神经网络(6)
kubernetes(6)
LLM(6)
云函数(5)
网站(5)
无人驾驶(5)
机器人(5)
https(5)
汽车(5)
小程序·云开发(5)
cto(5)
创业(5)
官方文档(4)
云数据库 Redis®(4)
api(4)
数字营销(4)
智慧零售(4)
数据安全(4)
存储(4)
游戏(4)
安全(4)
系统架构(4)
架构设计(4)
教育(4)
智能制造(4)
程序(4)
设计(4)
音视频(4)
云原生(4)
重构(4)
云镜(主机安全)(3)
java(3)
python(3)
.net(3)
html(3)
ide(3)
容器镜像服务(3)
cdn 边缘计算(3)
腾讯云区块链服务平台 TBaaS(3)
出行(3)
http(3)
面向对象编程(3)
数据处理(3)
安全治理(3)
云开发(3)
CODING DevOps(3)
即时通信 IM(3)
连接(3)
网络(3)
云服务(3)
云服务器(2)
负载均衡(2)
NLP 服务(2)
javascript(2)
c#(2)
nosql(2)
linux(2)
unix(2)
spring(2)
实时音视频(2)
音视频点播加速(2)
消息队列 CKafka 版(2)
企业邮箱(2)
tencent hub(2)
TAPD 敏捷项目管理(2)
腾讯云测试服务(2)
图像处理(2)
腾讯乐享(2)
DevOps 解决方案(2)
游戏解决方案(2)
电商(2)
医疗(2)
自动化(2)
缓存(2)
html5(2)
推荐系统(2)
智能教育(2)
腾讯会议(2)
迁移(2)
智能推荐平台(2)
huggingface-transformers(2)
边缘计算(2)
低代码(2)
高可用(2)
工业互联网(2)
公有云(2)
基础(2)
计算机(2)
计算机视觉(2)
解决方案(2)
流量(2)
内核(2)
同步(2)
性能(2)
优化(2)
最佳实践(2)
自动推理(2)
第四期热点征文-大模型技术(2)
对象存储(1)
语音识别(1)
人脸识别(1)
创业扶持(1)
腾讯云学堂(1)
比特币(1)
数据挖掘(1)
机器学习(1)
ios(1)
go(1)
node.js(1)
oracle(1)
打包(1)
git(1)
github(1)
负载均衡缓存(1)
apache(1)
GPU 云服务器(1)
容器服务(1)
移动直播(1)
腾讯云可观测平台(1)
访问管理(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
devmaster(1)
cci 持续集成(1)
腾讯企点(1)
物联网通信(1)
视频处理(1)
mongodb(1)
高性能计算(1)
微服务与微计算(1)
互动课堂(1)
智慧市政(1)
微信生态上云方案(1)
互联网金融(1)
压力测试(1)
jvm(1)
强化学习(1)
unity(1)
自动化测试(1)
二叉树(1)
敏捷开发(1)
jenkins(1)
kernel(1)
spring cloud(1)
数据可视化(1)
企业组织(1)
游戏联机对战引擎mgobe(1)
对话机器人(1)
数据安全治理中心(1)
云开发静态网站托管(1)
sdk(1)
腾讯微服务观测平台 tsw(1)
实时数据集成(1)
服务网格(1)
微搭低代码(1)
智能创作(1)
腾讯云智绘(1)
数据集成(1)
项目管理(1)
持续集成(1)
产业互联网学堂(1)
chatgpt(1)
cloud(1)
it(1)
olap(1)
saas(1)
scaling(1)
soa(1)
vr(1)
笔记(1)
编译(1)
编译器(1)
表格(1)
布局(1)
部署(1)
大数据处理(1)
登录(1)
二进制(1)
分布式系统(1)
服务器(1)
工程师(1)
公众号(1)
工作流(1)
函数(1)
后台(1)
技巧(1)
集群(1)
架构模式(1)
监控(1)
教程(1)
进程(1)
开发环境(1)
开源软件(1)
框架(1)
蓝牙(1)
领域驱动设计(1)
浏览器(1)
敏捷(1)
软件开发(1)
生命周期(1)
事件(1)
事务(1)
时序数据库(1)
数据仓库(1)
数据管理(1)
通信(1)
图数据库(1)
团队管理(1)
性能优化(1)
虚拟机(1)
异步(1)
音频(1)
硬件(1)
有赞(1)
语音(1)
原理(1)
元宇宙(1)
终端(1)
组件化(1)
私有云(1)
云架构(1)
云函数(1)
OLTP(1)
深度学习框架(1)
脑机接口(1)
向量数据库(1)
腾讯混元大模型(1)
腾讯云TVP读书会(1)
幻兽帕鲁(1)
大模型部署(1)
搜索文章
搜索
搜索
关闭
Agent元年:从聊天机器人到数字员工的当代进化史
LLM
当ChatGPT核爆式走红时,全人类第一次意识到,AI不仅能回答问题,还能成为你的"赛博同事"。早期的Copilot(副驾驶)类助手就像乖巧的实习生——勤快听话,你问它答,你令它动。而如今的Agent(智能代理)已经进化成能独当一面的"数字员工",它不再是只会等待指令的被动助手,而是能自主规划、拆解任务、调用工具的智能管家。
立委
2025-03-08
4
0
Agent:数字代理的崛起与未来
LLM
在ChatGPT引发的人工智能热潮中,我们亲眼见证了AI应用形态的戏剧性演变。回想2022年底,当人们首次体验ChatGPT时,那种震撼感仍历历在目——一个能够理解复杂问题并提供流畅回答的聊天机器人(chatbot),彻底改变了我们对机器智能的期望。这种应用形态——我们姑且称之为"对话式AI"——本质上是大语言模型(LLM)应用的初级表现形式,一种简单的信息交换机制。
立委
2025-03-08
6
0
o3 deep research: LLM 驱动的 Agent 综述
LLM
大型语言模型(LLM)的崛起在过去几年引发了人工智能领域的飞跃式发展。尤其是 2022 年底 OpenAI 推出的 ChatGPT,短短两个月内月活用户就突破一亿,成为史上用户增长最快的消费者应用 (ChatGPT sets record for fastest-growing user base - analyst note | Reuters)。ChatGPT 所展现的强大自然语言对话和内容生成能力,如一场“核爆”引发全球对于通用人工智能的极大关注,各行各业开始思考如何将这类大模型应用到实际业务中。紧随其后,OpenAI 发布了更先进的 GPT-4 模型,能够理解更复杂的指令,并支持图像等多模态输入。这场由 ChatGPT 引领的LLM浪潮,不仅催生了大量类似产品和开源模型,也让“ AI 更自主地完成复杂任务”成为下一个技术探索热点。在这种背景下,由 LLM 驱动的 Agent(智能代理)概念逐渐兴起,成为 AI 技术爱好者和产业从业者共同关注的前沿方向。
立委
2025-03-08
7
0
【外一篇:推理范式演进中的概念】
大模型知识引擎
LLM
- 训练时间(Training Time):参数空间Θ的优化过程,目标函数为误差最小化 minL(θ;D_train) - 推断时间(Inference Time):固定参数θ时对新样本x_test的条件分布预测p(y|x_test;θ)
立委
2025-03-07
37
0
思维链是大模型的符号神助攻
大模型知识引擎
LLM
在人工智能发展的历史长河中,符号逻辑和神经网络一直如两条平行线,难以交汇。然而,2024年春节,DeepSeek发布的推理大模型R1揭示了一个令人惊叹的技术突破——思维链(Chain of Thought, CoT)的自主生成,其展现出的语言序列仿佛在模拟人类的符号逻辑。这一强化学习的进展或将重新定义符号逻辑与神经网络的融合路径。
立委
2025-03-05
102
0
关注专栏作者,随时接收最新技术干货
TVP官方团队
腾讯 | 产品经理
关注
王新栋
关注
用户7378374
关注
PerfCloud王福
PerfCloud | 总经理
关注
DeepSeek:大模型应用的极致性价比与机遇
腾讯云架构师技术同盟
DeepSeek
2025年初,DeepSeek开源大模型R1的发布,打破了OpenAI的闭源金身,为人工智能领域带来了新的变革。DeepSeek不仅在性能上与OpenAI的模型相媲美,还在训练和推理成本上实现了显著降低。这使得原本对大模型应用望而却步的中小企业和开发者,能够以更低的成本、更高的效率参与到人工智能的开发和应用中来。本文将深入探讨DeepSeek的极致性价比如何降低门槛,并为实时性要求高、成本敏感的端侧、端边云场景带来新的机遇。
楼炜
2025-03-05
130
0
The Three-Stage Scaling Laws Large Language Models
LLM
Mr. Huang's background features three S-curves, illustrating the scaling relay race across three stages of large language models, demonstrating a persistent spirit akin to the Chinese fable of the legendary Old Man Who Moved Mountains.
立委
2025-03-03
88
0
大模型三阶段的 scaling laws 接力赛
大模型知识引擎
LLM
黄教主背后是三个S曲线,illustrate 的是大模型三个阶段的“做大做强”的 scaling 接力赛,颇显挖山不止的愚公移山精神。
立委
2025-03-03
89
0
深度学习的局限性研究综述
深度学习
深度学习模型本质上是高维概率密度估计器,它的核心目标是通过参数θ找到条件概率分布P(y|x;θ)的最佳近似。模型通过学习大量的训练数据,试图捕捉数据中的大大小小的统计规律,并将其泛化到未知数据。然而,这种统计学习范式决定了一个根本性问题:模型学习的是P(y|x)而非P(x→y),即统计相关性而非因果关系。
立委
2025-03-03
64
0
左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练
LLM
大模型知识引擎
在大模型后训练中,像deepseek R1那样交替使用监督微调(SFT)和强化学习(RL),而非单一依赖 RL 或蒸馏,背后的核心逻辑如下。
立委
2025-02-28
80
0
o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析
大模型知识引擎
LLM
A: DeepSeek R1 采用了四阶段的训练流程,包括两个强化学习(RL)阶段和两个监督微调(SFT)阶段 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。这一多阶段策略旨在先通过少量数据稳定模型输出格式,然后大规模提升推理能力,接着扩展通用能力,最后对齐人类偏好,逐步打造出既擅长推理又安全实用的模型 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园) (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。具体来说:
立委
2025-02-28
215
0
RPA 赛道与大模型Co-pilots早期创业者的困局
大模型知识引擎
- 传统 RPA:依赖工程师编写脚本或流程图(如 UiPath 的拖拽式设计器),需精准定义每一步操作逻辑,如同教机器人跳格子,容错率低。 - LLM Agent:直接理解人类意图("把邮件里的发票信息录入系统"),自主拆解任务链条,动态调整执行路径。 - 典型案例:ChatGPT 插件系统已能调用 API 完成订机票、查数据等操作,而传统 RPA 实现同等功能需低代码脚本。
立委
2025-02-27
73
0
DeepSeek 技术跃迁:AI 应用的下一站在哪?
开发者
实践
视频
同步
DeepSeek
2025 年,DeepSeek 以颠覆性技术突破重构全球 AI 竞争格局,其创新的多模态架构与超大规模推理能力,不仅激起了 AGI 技术的进化浪花,更在产业实践的深水区掀起了一场智能化落地的应用热潮。
TVP官方团队
2025-02-27
158
0
Linguists Should Find Self-Attention Intuitively Familiar
huggingface-transformers
LLM
For linguists bewildered by large language models (LLMs), the confusion often stems from terminology and implementation details obscuring shared foundational principles. Let’s cut through the noise and focus on self-attention — the beating heart of the Transformer architecture.
立委
2025-02-25
51
0
语言学家应该很容易理解自注意力机制
深度学习
深度学习框架
如果语言学家以前觉得大模型烧脑和不解,那是因为窗户纸没有捅破,存在不同体系下的术语与机制细节的理解障碍,但底层逻辑并不乏不少共同的东西。本篇聚焦在大模型Transformer架构中的核心注意力机制的理解。
立委
2025-02-24
114
0
符号主义被打入冷宫太久了,难道神经是AI的终结者吗?
人工智能
深度学习
虽然没人可以预测未来,虽然抛弃两条路线的一条感觉政治不正确,但的确不能排除这种单极主义的可能性。
立委
2025-02-24
60
0
立委科普:如何理解自注意力机制中的QKV分工?
深度学习
大模型知识引擎
为了学习序列上下文的依赖关系,为什么序列中的每一个 token 都要派生出三个分工角色:Q(Query),K(Key),V(Value)?
立委
2025-02-21
197
0
Transformer 和注意力机制简介
huggingface-transformers
大模型知识引擎
基础大模型通过原始大数据的“自监督学习”(self-srupervised learning),利用多层神经网络,获得数据相关的知识。自监督学习是一种特别的监督学习,它利用“掩码”获得监督信号。我们知道监督学习的训练数据是标注了输出目标作为监督信号的学习,但自监督无需人类标注,而是在数据中遮盖了部分数据点,让系统学习预测它(“填空”或“接龙”),以被遮盖的数据点作为标准答案和监督信号。主流的GPT大模型的掩码就是遮盖住下一个词,让系统仅仅根据上文来预测它(叫 next token prediction),这是当前生成式AI的主流模型。
立委
2025-02-21
149
0
DeepSeek重新定义未来应用场景,如何拿到新船票?
模型
实践
视频
DeepSeek
二维码
2025 年开年,技术圈迎来了“AI 领域的史普尼克时刻”。当全球 AI 竞赛进入深水区,DeepSeek 凭借其创新的架构设计与开源生态的双向突破,不仅掀起新一轮 AI 创新热潮,更引发业内对应用场景的广泛探索,国民级应用微信接入 R1 上线「AI 搜索」,各大厂商纷纷将 DeepSeek 嵌入业务。
TVP官方团队
2025-02-20
141
0
True Story Behind DeepSeek: Learning to Think Slowly Without Human Supervision
DeepSeek
InfoQ: "DeepSeek adheres to a pure reinforcement learning approach, but the industry often refers to RL as 'alchemy' - how did they make this process controllable and accessible? What's innovative about their reasoning paradigm?"
立委
2025-02-16
54
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档