00:00
简而言之,就是我们把知识放到一个知识库里面,然后把它投位给这个人,就是我们需要用一个量化的手段,把知识量化给人工智能,让他能够看得懂,然后看得懂之后呢,然后那人工智能可能就知道了啊,他知道这些知识了,那么以后你在问的时候,他就可以在知识库中把那些知识提取出来,然后再根据这个这个知识库里面的内容,或者是一些文档啊,里面写了一些东西啊,然后给你来回答你的问题啊,这就是相当于你本地去投喂你自己的不同的数据,比如说你的销售数据,比如说你的一个呃流量数据,比如说你要做很多不同的统计,就是你的一些统计数据,还有比如说你公司或者说你个人的很多之前的一些信息,你可以把它放到知识库里面,然后给AI去识别,然后让他去给你进行一个总结啊,这个都是,呃,对于个人来说就是比较好用的一个方法,它很easy,就是它比较方便,你想问什么,他直接就给你。
01:00
拿出来了,懂了这个之后呢,那么我们去投喂的时候,那你就要根据这个东西去做,对吧?所以呢,我们首先需要有一个知识库,然后还要有一个能够把它量化的一个工具,然后再有一个本地部署的AI,对吧?所以我们本地部署AI做好之后,那么首先我们要有一个知识库,在这里呢,其实有很多不同的方法,有很多很多的这个IG的工具,开源的免费的也好,都是有的,我说两个方法,第一个就是我们之前的用到的配角system,这个里面其实你如果摸索的话,就能够看到这个IEG的设置,对吧?然后文本嵌入模型这里面可以直接选,那这东西是什么呢?我现在跟你讲,那为什么会存在这个文本嵌入模型呢?啊,那就在于我们的AI其实不能直接读你的文档,它读不了,它需要有一个工具把它给整量化成一些数据,让它能够读的数据,所以我们刚刚说的这个量化工具,它就是一个文本嵌入的模型,用ALA。
02:00
你可以直接进入到models,就可以列出最近比较火的这些模型,你直接找这个叫no in的text,就这个模型,你直接去找到这个模型之后,在这里复制,复制之后呢,你就可以直接在终端terminal终端里面,然后输入进去,然后它就直接会给你下载了,我这个是下载好了,所以就它就没有重新再下载,就很快就下载好了,如果说你没有下载的话,它就会出现一个进度,然后下载好了之后,直接会显示success,然后就代表你成功了,那这个时候你再刷新一下,打开你的pagecheist,这里面就能找到这个模型no,这你找不到的话,你就要刷新一下,然后进去IG,在这里面就能找到你所有的模型,就是no,找到它之后,这里面就默认大小就好了,然后这里有一个IG的提示词,嗯。
03:00
呃,我觉得这个你可以配置,也可以不配置,其实没有什么太大的所谓,然后你把这个搞好之后,说明你又有一个量化工具,对不对?那么现在呢,你需要什么呢?我们之前说有知识库,然后有量化的工具,然后有AI,本地AI,那么现在我们的量化工具和本地AI都都有了,那么现在就需要一个知识库,那我们在pageist里面有一个管理知识,在这里面你就可以添加新的知识,非常的简单对不对?我觉得应该也就几分钟的时间就能搞好,然后把你的文件拖进来,我直接就把这里面找了两个拖进来,你看直接就演示文档,进来之后,它就状态已完成,就说明它已经直接给你导入到知识库里面去了,那模,然后我们回到这边,直接进入新聊天,在这里面我们可以选一个近义词,选IG也好,不选IG也好,就是这样的。在这里这个。
04:00
里面大家看一下就有一个知识可以直接选你刚刚上传的,对吧,我刚刚是直接上传了一个放到这个里面的,然后前面我是单独上传的,所以我直接选这个,这个之后直接问IPHONE15和IPHONE16有什么区别,它就能直接跟你说,从文档里开始,我看到了咱们的详细规格,那这些内容都是根据之前上传的文档它生成的,然后都是根据文档里面的内容给你进行的总结,你可以看一下这些文档里面内容,然后跟它对比一下,基本上是差不多,当然它也不一定是对的,有一些差别,那你能够上传除了PDF之外,还有CSF啊,还有MD,还有TST这些文件都可以去上传,然后投喂给他,那这是配写C里面的一个,呃,上传文件的功。
05:00
能,然后那另外一个我想也是是一个开源的IG的软件,然后它叫anything l的,然后它也是基于A拉ma,然后来运行的,呃,你可以在这个网站里面下载适合你电脑的版本,然后那你刚打开的时候可能是英文的呀,那你可以到这置里面的外观把语言给改成中文的,然后这样你就可以看到中文的界面了,那首先呢,你需要创建一个你的工作区啊,创建好了工作区之后呢,在这里边有一个设置,这置里面有几个设置,我们看里面有聊天的设置啊,这里有一个工作区LM们的提供者,其实就是说你的大模型是哪一个,然后就这里我们选拉拉,下面有,呃,你下载下来的模型我们选deep sick, 我电脑的话就选8B的,这个就选适合你电脑的一个模型的大小,然后就在下面放在下面,其他的都会默认就好了,然后放在下面之后一定要点这个update,一定要更新。
06:00
中心的话,其实它就是没有改,然后第三个就是下到数据库,这个的话就是一个刚刚说到了一个你投喂给人工智能的这个铃档,它变成下档之后,它的下面的大小,然后在代理配置里面,第4个里面,我们把它也改成这个拉玛,然后同样的选这个deep模型,然后这里同样要update一下,然后这一个提示成功了,那你选好了你所有的人工智能的这个模型之后呢,你还需要一个能把文本转变成人工智能,能够就是向量的这样的一个模型,对吧?我们前面说到的,那么你就需要进入到这个大的设置里面,点击这个向量数据库,那一般呢,我们就用这个默认的这个向量数据库就好了。第三个就是embeded首选项,这个就是我们刚刚在配置sister里面选的那个,呃,向量识别模型是一样的,呃,这个里面我们仍然选择拉ma,然后。
07:00
选择这个no的text,这个模型其实就跟那个是之前是一样的,我们仍然是这么选择,然后给它保存一下,那这样子就已经做好了我们的准备工作,其实它跟配件sister的原理是一样的,那其实就是一个RG的一个原理,对吧?你懂了这个原理之后,其实每个软件它组成的这个呃模式其实都差不多的,只不过它的这个表现形式就是外观啊和一些呃翻译的概念啊,其实可能有一些维的不同,然后这个时候我们就看这个设置的左边有一个上传的箭头,然后我们点击进去之后,你就可以看到有一个窗口在这里面,你就可以把你的文档都拖进去,那我们就准备拖入我之前准备的两个文档这样的,那这时候给它幕到我们的工作区里面去啊,引用了之后呢,一定要点这个C的,然后这样的话,它。
08:00
能够把它转变成向量,然后让你的AI能够读取到,我们可以看到它这个里面可能能够容纳这个数据啊,比配景S要多一点,它甚至还能容纳音频的数据,好像图像好像也可以,甚至还有网页也可以传,这个相当于它的一个模型量会更大,就是可以投入的数据更多,然后现在呢,我们就可以试一下了,就跟之前一样,我们用来去问它一个iPhone数5什数的区别,然后刚开始的时候我遇到一个问题,是是的是8B的,可能他这个有点吃诈,他回答的都是错误的,然后呢,我后面改到14B之后呢,他的回答就正常了,那这就说明这个模型的大小对它这个本地模型的这个智能化就是影响非常大,如果说你的电脑比较强上,你有很高的内存的话,那么建议你选择最大的一个模型大小这样。
09:00
你到时候投喂给他的数据越来越多之后,他可能也会变得更加智能,他能够读取的数据量也会越大,我个人是这么认为的,它也会变得更加的智能啊,不会像经常出现这种犯错的情况。
我来说两句