腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
腾讯星火计划
科技少年,点燃未来
关注
分享
专区首页
>
优选文章
全部文章
成员作品
项目动态
其他
热度
时间
如何在 Ubuntu 上安装 Windows11(使用 virt-manager)
虚拟机
windows
署名:本文章在 cnblogs 第一次发表 ,作者为本人,目前迁移到腾讯云开发者社区。
小Y小Y抽卡别歪
2024-03-15
1.2K
0
一文带你了解检索增强生成中的神兵利器 —— 近似近邻搜索
LLM
星火计划
information-retrieval
nlp
随着大语言模型Chatgpt的横空出世,大语言模型(Large Language Model, LLM)频繁地出现在公众的视野中,成为了商业、娱乐、教育等领域讨论的热点。在LLM众多的出色能力中,其强大的检索能力(Information Retrieval)能力备受瞩目。大语言模型本身不联网,但却好像能回答互联网上能搜到的大部分问题,包括包括事情发生的具体时间、人物关系和前因后果等等。然而,LLM的记忆能力和检索能力也不是无限的。比如,LLM的幻觉(Hallucination)问题就是学术界和工业界目前致力于解决的问题 [1]。幻觉指的是即使在不确定答案的情况下,LLM不但不会承认无法回答,还会以自信的口吻凭空捏造出事实,通常可以以假乱真。为了解决这一现象,许多研究方向被提了出来,而检索增强生成(Retrieval-Augmented Generation, RAG)就是其中的一种方法。对于用户的提问,RAG首先生成信息检索请求,然后在数据库中寻找相关的信息,最后,结合相关信息和用户的提问向大语言模型进行提问(流程示意图见图1)。因为在数据库中寻找到的信息都是真实可靠的,大语言模型会根据提供的真实数据进行回答,减少其幻觉的可能。不仅如此,RAG的范式极大的扩展了大语言模型的应用场景,使得其可以实现大规模内容的记忆与整理。许多应用也由此催生出来,包括虚拟人设、文章理解/总结等。在RAG中,如何在大量的内容向量(数以万计)中找到与检索向量相匹配的内容直接决定了生成的质量和效率。能否在短时间内得到丰富翔实的内容对于最后回答的生成起到了近乎决定行性的作用。在本篇文章中,我们将介绍近似近邻搜索的概念,并介绍其中三种常见的方法。
飞翔的西红柿
2024-02-29
1.1K
3
ggml教程|mnist手写体识别量化推理 - plus studio
数据
mnist
教程
量化
模型
MNIST手写体识别是经典的机器学习问题,可以被称作机器学习的hello world了,我希望通过mnist来作为系列教程的第一节,来介绍如何使用ggml量化,推理一个模型。这个教程将会使用pytorch来训练一个简单的全连接神经网络,然后使用ggml量化,最后使用ggml推理这个模型。
plus sign
2024-02-29
633
0
腾讯最隐秘人才计划曝光!今年IOI金牌全员现身,数物化竞赛顶流星聚
安全
行业
科技
算法
腾讯
4人夺金,总金牌突破100……与此同时,针对这些天才少年的争夺也暗流汹涌、愈加激烈。
量子位
2023-11-18
588
0
专访清华裘捷中:亚洲高校首个KDD最佳博士论文奖是如何炼成的?
编程算法
监督学习
深度学习
AMiner x 量子位 发自 凹非寺 量子位 | 公众号 QbitAI 今年的KDD最佳博士论文奖RUNNER UP,由毕业于清华大学的裘捷中博士斩获。 值得一提的是,这是亚洲高校的学者首次获此殊荣。 SIGKDD(简称 KDD),是数据挖掘领域公认的顶级会议,获得 KDD 颁发的奖项是该领域研究者至高无上的荣誉。 为表彰数据科学、机器学习、数据挖掘领域中杰出的博士论文工作,KDD 每年都会评选出「最佳博士论文奖」(下设 1 名「WINNER」和至多 2 名「RUNNER UP」)。 裘捷中博士获奖的工
量子位
2022-08-26
396
0
Sora技术报告 视频生成模型作为世界模拟器 笔记 - plus studio
网络
笔记
模型
视频
数据
技术报告原题目叫做 Video generation models as world simulators,翻译一下就是 视频生成模型作为世界模拟器,地址在这里 。我写的时候是翻译和笔记并行,翻译感谢gpt4出色的翻译能力。
plus sign
2024-02-29
305
0
roofline model - plus studio
优化
model
模型
内存
性能
定义 \[运算强度 = 运算量/访存量\] 运算量是 一个样本进行一次前向传播的浮点运算次数 访存量是 一个样本进行一次前向传播的内存交换数量
plus sign
2024-04-11
232
0
没有更多了
2
粉丝
7
内容
0
讨论
团队成员
腾讯星火计划
提问
plus sign
星火计划成员
擅长5个领域
提问
机器学习
深度学习
机器人
计算机视觉
LLM
飞翔的西红柿
提问
小Y小Y抽卡别歪
星火计划成员
提问
0reg
星火计划成员
擅长1个领域
提问
安全漏洞
butter
星火计划成员
提问
腾讯青少年科技学习中心
腾讯青少年科技学习中心, 以腾讯在科技方面的积累及视野出发, 联动腾讯公司内外多个人才培养、高精尖实验室及新科技产品团队, 探索基础教育阶段的科技教育理念及实践,助力未来人才。
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
领券