首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场

专栏成员
文章
阅读量
订阅数
轻松加载与应用:使用 Torch Hub 驾驭预训练 NLP 模型
用torch.hub工具进行模型的加载和使用。这些预训练模型由世界先进NLP研发团队huggingface提供。
JavaEdge
2025-04-03
1140
是时候停止vibe,看清AI智能体的本质了!
AI快速发展大时代,一些术语几乎每周甚至每天都会被赋予新含义,让人一时失措,忽略很多基本原则。
JavaEdge
2025-04-01
2460
构建⼈名分类器
以⼀个⼈名为输⼊,使⽤模型帮助我们判断它最有可能是来⾃哪⼀个国家的⼈名,在某些国际化公司的业务中具有重要意义,在⽤户注册过程中 , 会根据⽤户填写的名字直接给他分配可能的国家或地区选项 , 以及该国家或地区的国旗 , 限制⼿机号码位数等。
JavaEdge
2025-03-21
1650
你的时序模型为何越训越慢?GRU两门控机制如何突破LSTM算力瓶颈
GRU(Gated Recurrent Unit)也称门控循环单元结构,传统RNN的变体,同LSTM一样有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象。
JavaEdge
2025-03-20
1760
LSTM:克服长期依赖难题的循环神经网络升级方案
长短期记忆网络(Long Short-Term Memory)作为RNN的进阶架构,在序列建模领域具有里程碑意义。其核心突破在于通过智能门控系统,有效捕获跨越数百个时间步的语义关联,成功缓解了传统RNN存在的梯度消失/爆炸难题,在语音识别、金融预测等需要长程记忆的场景中表现卓越。
JavaEdge
2025-03-19
2600
注意力机制:GPT等大模型的基石
人类观察事物,能快速判断一种事物,是因为大脑能很快把注意力放在事物最具辨识度的部分从而作出判断,而非从头到尾一览无遗观察一遍才能有判断。基于这样的观察实践,产生了注意力机制(Attention Mechanism)。
JavaEdge
2025-03-18
2930
突破序列建模瓶颈:解密RNN为何成为NLP任务的核心引擎
RNN(Recurrent Neural Network,循环神经网络),以序列数据为输入,通过网络内部的结构设计有效捕捉序列之间的关系特征,一般也以序列形式进行输出。一种专门处理“序列数据”的模型。
JavaEdge
2025-03-17
1590
数据增强正在杀死你的模型:90%开发者不知道的回译质量陷阱
目前文本数据增强方面效果较好的增强方法。回译数据增强(Back-translation Augmentation)是基于神经机器翻译的文本再生技术,其核心运作流程包含三个关键阶段:
JavaEdge
2025-03-16
2430
从语料理解到模型优化:为什么你的文本分析总是差点意思?
本文旨在帮助Java 大佬们快速理解文本数据,如何检查语料可能的问题,并为后续模型训练提供超参数选择的参考。
JavaEdge
2025-03-12
2040
90%的开发者都忽略的文本向量化技巧!
将一段文本使用张量表示,一般将词汇表示成向量,称作词向量,再由各个词向量按序组成矩阵形成文本表示,如:
JavaEdge
2025-03-11
2500
还在手动整理知识?云端满血版DeepSeek助你快速搭建个人专属知识库!
最新刚结束上一次技术年终总结创作的领奖环节,最近也在公司内部推行基于 DeepSeek 的内部知识库,上了腾讯云,发现点进去我才发现,腾讯云最近就上新了这个带有阳光普照奖的活动!
JavaEdge
2025-02-27
8401
ChatGPT的Canvas画布功能竟然能做到这些!
图片展示了一款垂直工具栏,包含五个按列排列的图标,背景为柔和的粉彩色调。顶部起第三个图标是一本打开的书,其旁边有标签标注为“阅读等级”。
JavaEdge
2024-12-25
6960
大陆用户也能用IDEA的AI Assistant了!
AI Assistant 可以自动补全单行、函数和整个代码块,并与您的编码样式、项目上下文和命名约定保持一致。AI Assistant 还可以根据您的自然语言提示直接在编辑器中提供代码选项建议。
JavaEdge
2024-09-27
1.9K0
使用AI进行需求分析的案例研究
生成式 AI 的潜在应用场景似乎无穷无尽。虽然这令人兴奋,但也可能让人不知所措。因此,团队在使用这项技术时需要有明确的目标:关键是要明确生成式 AI 在团队工作中能产生哪些实质性影响。
JavaEdge
2024-09-25
7460
对于大模型,到底微调还是不微调?
调整开源大语言模型(LLM)的系列博客的第二篇文章。本文讨论:“什么时候应该进行微调,什么时候应该考虑其他技术?”
JavaEdge
2024-09-16
5620
一篇教你玩转腾讯混元大模型!
基于混元大模型,腾讯云推出文本生成、图像创作、视频创作产品方案,覆盖全场景AIGC应用:
JavaEdge
2024-09-14
7570
如何微调:关注有效的数据集!
本文关于适应开源大型语言模型(LLMs)系列博客的第三篇文章。在这篇文章中,我们将探讨一些用于策划高质量训练数据集的经验法则。
JavaEdge
2024-09-14
2060
改进大语言模型的方法
这是一篇关于适应开源大语言模型(LLMs)的三部系列博客的第一篇。本文探讨将LLM适应领域数据的各种方法。
JavaEdge
2024-09-13
1750
AI大模型应用开发实战-Agent应用对话情感优化
JavaEdge
2024-08-07
3260
从0到1搭建一个基于FastAPI的智能聊天机器人应用
先点击 connect,再输入要发送的消息:你好。点击 send 即请求,响应了你好!
JavaEdge
2024-08-02
3750
点击加载更多
活动推荐
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档