51长假第二天,突然发现许久不更新的NVIDIA Chat With RTX聊天机器人,迎来的重大更新!
这次真的是改头换面,因为名字已经从Chat With RTX变成了ChatRTX,更加简洁,页面也更新了,彷佛之前的名字从来没出现过一样。
什么是ChatRTX
可能新朋友还不知道ChatRTX是什么。
ChatRTX是NVIDIA推出的一款基于GPT(Generative Pre-trained Transformer)的聊天机器人示范程序,它结合了检索增强生成(Retrieval-Augmented Generation,RAG)技术与TensorRT-LLM软件,并通过RTX加速,为用户提供快速且准确的回答。
ChatRTX可以连接到用户自己的文件、笔记、图片或其他数据,并根据用户的需求提供相关信息和解答。该程序支持多种文件格式,如.txt、.pdf、.doc/.docx、.xml等,方便用户查询和检索各种类型的数据。
这次更新,使得ChatRTX具备语音查询能力,用户可以通过语音指令与机器人进行交互。新版本的ChatRTX还增加了对jpeg、gif及png等图片格式的支持,以及通过CLIP神经网络进行图像识别,进一步丰富了用户的数据查询方式。
ChatRTX支持多种开源大型语言模型,除了先前Mistral、Llama 2模型之外,这次加入了Google Gemma模型,这是Google DeepMind和其他Google团队共同开发的一系列轻量级、先进的开放模型。Gemma与Ready-to-use Colab和Kaggle笔记本以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,使得入门变得非常容易。
ChatRTX还支持ChatGLM3模型,这个模型是由智谱AI和清华大学KEG实验室联合发布的新一代对话预训练模型。
ChatRTX的硬件条件
安装Tips
安装过程中的注意事项:
安装步骤
与您的数据聊天
在没有数据集的情况下与ChatRTX聊天
该应用程序使用一种称为检索增强生成 (RAG) 的技术来查找您指向的本地文件,并在向 LLM 提交您的问题时使用该信息提供上下文。禁用 RAG 将导致 LLM 完全基于最初训练的数据生成响应。为了查看 LLM 在没有 RAG 的情况下如何响应,您可以通过从右侧下拉菜单中选择“AI 模型默认值”来禁用 RAG(见下图)
使用CLIP视觉和语言模型
除了预安装的 Mistral LLM 模型外,您还可以从“添加新模型”选项下载并安装 CLIP 视觉和语言模型。安装模型后,您可以将应用程序指向您的 jpeg 图像文件夹并与您的图像聊天。这些图片不必标记。您可以提出诸如“向我展示有猫的图像”、“向我展示在户外拍摄的照片”、“向我展示有花朵的图像”等问题。对问题的回答的准确性取决于 CLIP 模型训练和准确性。
使用语音输入问题
此版本的 ChatRTX 还集成了进行音频到文本翻译的 Whisper 模型。要使用此功能,请确保系统上的麦克风已启用,然后单击“麦克风”图标并提出您的问题。问完问题后,单击“停止”图标停止录制。该应用程序将识别您的问题并将其输出到聊天窗口中。然后,您可以单击“发送”将文本呈现给 LLM 以获得响应。Whisper 模型支持多种语言,例如法语、西班牙语、普通话等。
查询结果
指引 ChatRTX 加载到向量库中的数据被分解成块(您可以将其视为文档中的段落),根据其相关性选择这些块来制定对查询的响应。这种存储数据的方法使 ChatRTX 适用于请求在整个数据集中几个块中涵盖的信息的查询,但不适合涉及一次对整个数据集进行推理的查询。例如,要求提供几份文件中涵盖的一些事实可能比要求提供一份或一组文件的摘
要产生更好的结果。
与大多数 AI 用例一样,响应质量往往会随着数据的增加而提高。将 ChatRTX 指向有关特定主题的更多内容往往会产生更好的响应。
已知bug
当前版本中存在以下已知问题
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有