前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >NVIDIA Chat With RTX还没更新么?原来改头换面啦!

NVIDIA Chat With RTX还没更新么?原来改头换面啦!

作者头像
GPUS Lady
发布于 2024-05-06 06:54:58
发布于 2024-05-06 06:54:58
3430
举报
文章被收录于专栏:GPUS开发者GPUS开发者

51长假第二天,突然发现许久不更新的NVIDIA Chat With RTX聊天机器人,迎来的重大更新!

这次真的是改头换面,因为名字已经从Chat With RTX变成了ChatRTX,更加简洁,页面也更新了,彷佛之前的名字从来没出现过一样。

什么是ChatRTX

可能新朋友还不知道ChatRTX是什么。

ChatRTX是NVIDIA推出的一款基于GPT(Generative Pre-trained Transformer)的聊天机器人示范程序,它结合了检索增强生成(Retrieval-Augmented Generation,RAG)技术与TensorRT-LLM软件,并通过RTX加速,为用户提供快速且准确的回答。

ChatRTX可以连接到用户自己的文件、笔记、图片或其他数据,并根据用户的需求提供相关信息和解答。该程序支持多种文件格式,如.txt、.pdf、.doc/.docx、.xml等,方便用户查询和检索各种类型的数据。

这次更新,使得ChatRTX具备语音查询能力,用户可以通过语音指令与机器人进行交互。新版本的ChatRTX还增加了对jpeg、gif及png等图片格式的支持,以及通过CLIP神经网络进行图像识别,进一步丰富了用户的数据查询方式。

ChatRTX支持多种开源大型语言模型,除了先前Mistral、Llama 2模型之外,这次加入了Google Gemma模型,这是Google DeepMind和其他Google团队共同开发的一系列轻量级、先进的开放模型。Gemma与Ready-to-use Colab和Kaggle笔记本以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,使得入门变得非常容易。

ChatRTX还支持ChatGLM3模型,这个模型是由智谱AI和清华大学KEG实验室联合发布的新一代对话预训练模型。

ChatRTX的硬件条件

  • ChatRTX 目前专为具有至少 8GB GPU 内存的 RTX 3xxx 和 RTX 4xxx 系列 GPU 构建(目前不支持 vGPU 配置)
  • 至少 100 GB 可用硬盘空间
  • Windows 10/11
  • 最新的 NVIDIA GPU 驱动程序

安装Tips

安装过程中的注意事项:

  • 安装程序将下载各种软件库、AI 模型权重和引擎文件。下载的总大小约为 11 GB,具体取决于所选的型号。下载和安装应该需要 10 到 30 分钟,具体取决于您的互联网连接和服务器上的负载。(全程挂梯子)
  • 请确保在安装过程中禁用系统的睡眠功能
  • 如果安装失败并显示错误消息。重新运行安装程序,它将从停止的位置恢复并继续安装过程
  • 如果在安装某些组件后安装失败。请在下次安装尝试时选择“进行全新安装”。
  • 即使安装程序包含大多数必需的大文件,它仍然必须从公共服务器下载一些文件。如果这些服务器关闭,则安装程序可能会失败或暂时停止
  • 如果您选择将应用程序安装在默认安装位置以外的其他文件夹中,请确保文件夹路径或文件夹名称中没有空格。这是一个已知问题,将在将来的版本中修复
  • 如果多次尝试后安装仍然失败,请在尝试安装之前删除以下文件夹:C:\Users\<username>\AppData\Local\NVIDIA\RAG

安装步骤

  • 双击setup.exe文件以启动安装程序。安装程序将通过验证您的系统是否具有兼容的 GPU 来检查系统兼容性。
  • 您可以选择默认安装文件夹,也可以通过单击“浏览”按钮并选择自定义文件夹位置来选择其他文件夹。
  • 安装完成后,将创建一个桌面图标并启动应用程序。
  • 将打开一个浏览器窗口选项卡,显示 ChatRTXUser 界面,如下图所示。同时,还将显示显示错误日志的 Windows 命令提示符。

与您的数据聊天

  • 该应用程序将默认为 Mistral(特别是 Mistral 7B int4)模型和包含 GeForce 新闻文章集合的默认数据集文件夹。您可以就此新闻文章集进行聊天和提问,或将应用程序指向您自己的数据文件夹。
  • 该应用程序目前适用于.txt、.pdf 和 .doc 文件格式。
  • 您可以通过单击标有“选择 AI 模型”的选择框来选择您已安装的其他 TensorRT-LLM 兼容模型(例如 Llama 2 7B int4)
  • 您可以通过单击“添加新模型”选项并从可用列表中选择一个模型将 AI 模型添加到应用程序。这会将 AI 模型下载到您的本地系统
  • 您可以通过单击显示当前数据文件夹路径的行旁边的笔图标并导航到所需文件夹来指向所选数据集。默认数据集(首次启动时加载的数据集)是最近在 GeForce 新闻上发布的文章样本。此数据集的示例问题也以 UI 上的按钮形式提供。
  • 选择新的数据文件夹时,应用程序必须使用所选文件夹中包含的文档重新创建数据集矢量嵌入。执行此操作所需的时间将因文件夹中文件的大小和数量而异。
  • 应用程序重新创建矢量嵌入后,您可以与此新数据集聊天。
  • 如果将新文件添加到所选文件夹,则必须重新生成文件夹的矢量嵌入。添加文件后,通过单击位于“数据集”单元格右侧的“刷新”图标重新生成嵌入
  • 注意:回答的准确性和相关性取决于所提问题的具体性、所使用的人工智能模型的准确性以及数据集的准确性。

在没有数据集的情况下与ChatRTX聊天

该应用程序使用一种称为检索增强生成 (RAG) 的技术来查找您指向的本地文件,并在向 LLM 提交您的问题时使用该信息提供上下文。禁用 RAG 将导致 LLM 完全基于最初训练的数据生成响应。为了查看 LLM 在没有 RAG 的情况下如何响应,您可以通过从右侧下拉菜单中选择“AI 模型默认值”来禁用 RAG(见下图)

使用CLIP视觉和语言模型

除了预安装的 Mistral LLM 模型外,您还可以从“添加新模型”选项下载并安装 CLIP 视觉和语言模型。安装模型后,您可以将应用程序指向您的 jpeg 图像文件夹并与您的图像聊天。这些图片不必标记。您可以提出诸如“向我展示有猫的图像”、“向我展示在户外拍摄的照片”、“向我展示有花朵的图像”等问题。对问题的回答的准确性取决于 CLIP 模型训练和准确性。

使用语音输入问题

此版本的 ChatRTX 还集成了进行音频到文本翻译的 Whisper 模型。要使用此功能,请确保系统上的麦克风已启用,然后单击“麦克风”图标并提出您的问题。问完问题后,单击“停止”图标停止录制。该应用程序将识别您的问题并将其输出到聊天窗口中。然后,您可以单击“发送”将文本呈现给 LLM 以获得响应。Whisper 模型支持多种语言,例如法语、西班牙语、普通话等。

查询结果

指引 ChatRTX 加载到向量库中的数据被分解成块(您可以将其视为文档中的段落),根据其相关性选择这些块来制定对查询的响应。这种存储数据的方法使 ChatRTX 适用于请求在整个数据集中几个块中涵盖的信息的查询,但不适合涉及一次对整个数据集进行推理的查询。例如,要求提供几份文件中涵盖的一些事实可能比要求提供一份或一组文件的摘

要产生更好的结果。

与大多数 AI 用例一样,响应质量往往会随着数据的增加而提高。将 ChatRTX 指向有关特定主题的更多内容往往会产生更好的响应。

已知bug

当前版本中存在以下已知问题

  • 该应用程序目前适用于Microsoft Edge和Google Chrome浏览器。由于一个错误,该应用程序不适用于 FireFox 浏览器。这将在将来的版本中修复。
  • 应用程序不记住上下文。这意味着后续问题不会根据先前问题的上下文得到回答。例如,如果你之前问过“RTX 4080 Super的价格是多少?”,然后问“它的硬件规格是什么?”,应用程序不会知道你在问RTX 4080 Super。
  • 响应中的源文件归属并不总是正确的。这将在以后的版本中得到改进。
  • 观察到一些应用程序卡在无法使用状态的情况下,无法通过重新启动来解决。这通常可以通过删除preferences.json文件来解决(默认情况下位于 C:\Users\<user>\AppData\Local\NVIDIA\ChatWithRTX\RAG\trt-llm-rag-windows-main\config\preferences.json)
  • 在极少数情况下,重新安装失败,请尝试删除安装目录(默认位于 C:\Users\<user>\AppData\Local\NVIDIA\ChatWithRTX)
  • 如果您选择将应用程序安装在默认安装位置以外的其他文件夹中,请确保文件夹路径或文件夹名称中没有空格
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
python: input()、raw_input() 探究
实验 a = input('请输入:') print a 如果输入字符串,则马上报错: 请输入:str Traceback (most recent call last): File "<stdin>", line 1, in <module> File "<string>", line 1, in <module> 但是如果输入整数,却不会报错: 请输入:10 10 如果把 input 改成 raw_input ,则可以正常记录键盘输入的字符串: a = raw_input('请输入:
JNingWei
2018/09/28
1.2K0
Python2和Python3的一些语法区别
Python2和Python3的一些语法区别 python 1.print 在版本2的使用方法是: print 'this is version 2 也可以是 print('this is version 2') 但到了3,就只能加上括号,像一个函数一样来使用 print: print('this is version 3') 2.input 2里面有两个用来从命令行接受输入的函数:input 和raw_input。 value = input() input接收的是一个值或变量,也就是说,你如果输
用户1214487
2018/01/23
1.4K0
Python2和Python3的一些语法区别
python简单学-----------
2.对中文的支持 python2和python3不一样,python3默认支持,python2 需要加上
py3study
2020/01/20
8160
Python 教程之输入输出(1)—— 在 Python 中接受输入
开发人员经常需要与用户交互,以获取数据或提供某种结果。今天的大多数程序都使用对话框来要求用户提供某种类型的输入。而 Python 为我们提供了两个内置函数来读取键盘输入。
海拥
2022/09/16
1.8K0
Python 教程之输入输出(1)—— 在 Python 中接受输入
详解Python 2.x 与 Python 3.x 的区别
如果你是刚接触 Python 的初学者,那你可能是直接学习 Python 3.x 版本。对于 Python 2.x 的版本是不会有所接触。官方也宣布在 2020 停止对 Python 2.x 的维护。我也建议初学者直接去学 Python 3.x 版本。但我们还是要去了解下 Python 3.x 与 Python 2.x 之间都有哪些改变,通过对比能让你对 Python 有更加深刻的理解。并且在很多面试过程中,面试官都会问:Python 2.x 与 Python 3.x 的区别。今天就给大家列举 Python 3.0 主要改变的几个方面。
用户2966292
2018/08/30
1.2K0
python中的变量
通过上面的对比可以看到,python2中在运行赋值运算符的时候,变量始终是整型,而在python3中,变量在做除法运算符的时候会变为浮点型。
嘻哈记
2021/03/20
2.2K0
笨办法学Python - 习题5: Mo
学习目标:了解用户输入方法,明白pthon2和Python3之间的用户输入的区别。了解格式化字符串(format string)的概念,学会如何创建包含变量内容的字符串。使用专门的格式和语法把变量的内容放到字符串里,然后进行格式化的打印输出。
py3study
2020/01/21
6570
13条Python2.x和3.x的区别?
从今天开始,小明将和你一起过一下,那些在面试「Python开发」岗位时面试官喜欢问的问题。内容基础,但是你不一定会噢。
py3study
2020/01/10
5920
Python3与Python2的具体区别
有赞的数据库管控平台是基于Python 2(py2)开发的,目前已经升级到python3(py3) 版本,主程序基于python 3.6.x。写本文是梳理一下 两个版本之间的语法,函数等差异。
用户1278550
2020/08/04
8750
Python 内置函数大全(上)
divmod() 函数把除数和余数运算结果结合起来,返回一个包含商和余数的元组(a // b, a % b)。
Python知识大全
2020/02/13
5660
Python基础知识总结
WHY Python首先,学一门语言都会问:点解要学这门语言而学Python的原因很简单,原因就是…..好鬼简单.(这句话不是我说的) 很喜欢Python极简的代码风格,以及众多功能强大的模块…… 学了两天Python有点点体会,觉得应该总结一下有哪些应该注意的地方. 基本问题 学习途径 初学者推荐一个公众号:Crossin的编程教室(喜欢作者的教学方式) 环境配置 用Mac或者Linux的同学是幸福的,直接在终端输入idle就好了,这两个系统都是默认自带Python的,如果想直接在终端打开Python S
Locker
2018/08/01
1.6K0
Python基础知识总结
python之条件-循环和其他语句
如何使用print来打印表达式----不管是字符串还是其他类型进行自动转换后的字符串。
py3study
2020/01/15
8050
Python中zip()函数的解释和可视化
返回一个元组迭代器,其中第i个元组包含每个参数序列或可迭代对象中的第i个元素。当最短的可迭代输入耗尽时,迭代器将停止。使用单个可迭代参数,它将返回1元组的迭代器。没有参数,它将返回一个空的迭代器。
统计学家
2020/02/12
1.5K0
Python中zip()函数的解释和可视化
第1章 python 基础语法(3)
=================目录================== 1.8 字典 1.9 字典练习 2.0/2.1 流程控制-if条件判断
py3study
2020/01/03
5660
第1章  python  基础语法(3)
1-python基础
​ 同一个变量a可以反复赋值,且可以是不同类型的变量. 这种变量本身类型不固定的语言称为动态语言, 比如python, javascript. 而与之相对应的静态语言,静态语言必须在定义的时候指定扁蕾类型,如果赋值时类型不匹配则会报错.
用户3106371
2018/09/12
1K0
1-python基础
首发:吴恩达的 CS229的数学基础(线性代数),有人把它做成了在线翻译版本!
这是两个方程和两个变量,正如你从高中代数中所知,你可以找到 和 的唯一解(除非方程以某种方式退化,例如,如果第二个方程只是第一个的倍数,但在上面的情况下,实际上只有一个唯一解)。在矩阵表示法中,我们可以更紧凑地表达:
统计学家
2019/11/07
1.4K0
首发:吴恩达的 CS229的数学基础(线性代数),有人把它做成了在线翻译版本!
python2与python3的区别
说明:标注?????是暂时没遇到且看不懂的,做个标记。常见的区别有print,range,open,模块改名,input,整除/,异常 except A as B
py3study
2020/01/09
1.2K0
[PYTHON] 核心编程笔记(14.P
在python中有多种运行外部程序的方法,比如,运行操作系统命令或另外的python脚本,或执行一个磁盘上的文件,或通过网络来运行文件
py3study
2020/01/06
6830
《Python核心编程》第五章
   在大多数32位机器上,标准整型的取值范围是-2^31~2^31-1,如果在64位机器上使用64位编译器编译的Python,则整型是64位的。而长整型能表示的数值仅仅与机器支持的虚拟内存大小有关,长整型是标准整型的超集。
py3study
2020/01/16
4250
从零开始学Python-day2
    这个岗位最近已经越来越火,作为一个刚毕业没两年的小青年,职位规划与目标都是迷茫的。仅此记录一下日常点滴。
py3study
2020/01/09
7900
相关推荐
python: input()、raw_input() 探究
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档