腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
专栏成员
举报
文章
阅读量
订阅数
订阅专栏
申请加入专栏
全部文章
搜索文章
搜索
搜索
关闭
轻松加载与应用:使用 Torch Hub 驾驭预训练 NLP 模型
腾讯技术创作特训营S12#AI进化论
用torch.hub工具进行模型的加载和使用。这些预训练模型由世界先进NLP研发团队huggingface提供。
JavaEdge
2025-04-03
114
0
是时候停止vibe,看清AI智能体的本质了!
腾讯技术创作特训营S12#AI进化论
AI快速发展大时代,一些术语几乎每周甚至每天都会被赋予新含义,让人一时失措,忽略很多基本原则。
JavaEdge
2025-04-01
246
0
构建⼈名分类器
腾讯技术创作特训营S12#AI进化论
以⼀个⼈名为输⼊,使⽤模型帮助我们判断它最有可能是来⾃哪⼀个国家的⼈名,在某些国际化公司的业务中具有重要意义,在⽤户注册过程中 , 会根据⽤户填写的名字直接给他分配可能的国家或地区选项 , 以及该国家或地区的国旗 , 限制⼿机号码位数等。
JavaEdge
2025-03-21
165
0
你的时序模型为何越训越慢?GRU两门控机制如何突破LSTM算力瓶颈
腾讯技术创作特训营S12#AI进化论
GRU(Gated Recurrent Unit)也称门控循环单元结构,传统RNN的变体,同LSTM一样有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象。
JavaEdge
2025-03-20
176
0
LSTM:克服长期依赖难题的循环神经网络升级方案
腾讯技术创作特训营S12#AI进化论
长短期记忆网络(Long Short-Term Memory)作为RNN的进阶架构,在序列建模领域具有里程碑意义。其核心突破在于通过智能门控系统,有效捕获跨越数百个时间步的语义关联,成功缓解了传统RNN存在的梯度消失/爆炸难题,在语音识别、金融预测等需要长程记忆的场景中表现卓越。
JavaEdge
2025-03-19
260
0
注意力机制:GPT等大模型的基石
腾讯技术创作特训营S12#AI进化论
人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制(Attention Mechanism)。
JavaEdge
2025-03-18
293
0
突破序列建模瓶颈:解密RNN为何成为NLP任务的核心引擎
腾讯技术创作特训营S12#AI进化论
RNN(Recurrent Neural Network,循环神经网络),以序列数据为输入,通过网络内部的结构设计有效捕捉序列之间的关系特征,一般也以序列形式进行输出。一种专门处理“序列数据”的模型。
JavaEdge
2025-03-17
159
0
数据增强正在杀死你的模型:90%开发者不知道的回译质量陷阱
腾讯技术创作特训营S12#AI进化论
目前文本数据增强方面效果较好的增强方法。回译数据增强(Back-translation Augmentation)是基于神经机器翻译的文本再生技术,其核心运作流程包含三个关键阶段:
JavaEdge
2025-03-16
243
0
从语料理解到模型优化:为什么你的文本分析总是差点意思?
腾讯技术创作特训营S12#AI进化论
本文旨在帮助Java 大佬们快速理解文本数据,如何检查语料可能的问题,并为后续模型训练提供超参数选择的参考。
JavaEdge
2025-03-12
204
0
90%的开发者都忽略的文本向量化技巧!
腾讯技术创作特训营S12#AI进化论
将一段文本使用张量表示,一般将词汇表示成向量,称作词向量,再由各个词向量按序组成矩阵形成文本表示,如:
JavaEdge
2025-03-11
250
0
还在手动整理知识?云端满血版DeepSeek助你快速搭建个人专属知识库!
腾讯云大模型知识引擎xDeepSeek
最新刚结束上一次技术年终总结创作的领奖环节,最近也在公司内部推行基于 DeepSeek 的内部知识库,上了腾讯云,发现点进去我才发现,腾讯云最近就上新了这个带有阳光普照奖的活动!
JavaEdge
2025-02-27
840
1
ChatGPT的Canvas画布功能竟然能做到这些!
腾讯技术创作特训营S11#重启人生
图片展示了一款垂直工具栏,包含五个按列排列的图标,背景为柔和的粉彩色调。顶部起第三个图标是一本打开的书,其旁边有标签标注为“阅读等级”。
JavaEdge
2024-12-25
696
0
大陆用户也能用IDEA的AI Assistant了!
腾讯技术创作特训营S9
AI Assistant 可以自动补全单行、函数和整个代码块,并与您的编码样式、项目上下文和命名约定保持一致。AI Assistant 还可以根据您的自然语言提示直接在编辑器中提供代码选项建议。
JavaEdge
2024-09-27
1.9K
0
使用AI进行需求分析的案例研究
腾讯技术创作特训营S9
生成式 AI 的潜在应用场景似乎无穷无尽。虽然这令人兴奋,但也可能让人不知所措。因此,团队在使用这项技术时需要有明确的目标:关键是要明确生成式 AI 在团队工作中能产生哪些实质性影响。
JavaEdge
2024-09-25
746
0
对于大模型,到底微调还是不微调?
腾讯技术创作特训营S9
调整开源大语言模型(LLM)的系列博客的第二篇文章。本文讨论:“什么时候应该进行微调,什么时候应该考虑其他技术?”
JavaEdge
2024-09-16
562
0
一篇教你玩转腾讯混元大模型!
玩转腾讯混元大模型
基于混元大模型,腾讯云推出文本生成、图像创作、视频创作产品方案,覆盖全场景AIGC应用:
JavaEdge
2024-09-14
757
0
如何微调:关注有效的数据集!
腾讯技术创作特训营S9
本文关于适应开源大型语言模型(LLMs)系列博客的第三篇文章。在这篇文章中,我们将探讨一些用于策划高质量训练数据集的经验法则。
JavaEdge
2024-09-14
206
0
改进大语言模型的方法
腾讯技术创作特训营S9
这是一篇关于适应开源大语言模型(LLMs)的三部系列博客的第一篇。本文探讨将LLM适应领域数据的各种方法。
JavaEdge
2024-09-13
175
0
AI大模型应用开发实战-Agent应用对话情感优化
腾讯技术创作特训营S8
JavaEdge
2024-08-07
326
0
从0到1搭建一个基于FastAPI的智能聊天机器人应用
腾讯技术创作特训营S8
先点击 connect,再输入要发送的消息:你好。点击 send 即请求,响应了你好!
JavaEdge
2024-08-02
375
0
点击加载更多
活动推荐
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档