“ 经过前期的探索和准备,我们终于迈出了第一步:使用 ChatGPT 和 LangChain这些强大的工具,初步完成了专属知识库的搭建。”
01
—
继昨天部署 ChatGLM2-6B 成功后,工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功,今天继续向“专属知识库”的目标前进。
在成功部署 ChatGPT 模型的基础上,用咱们国产的大模型 ChatGLM ,以及 LangChain 开源框架搭建“个人专属知识库”。
LangChain:是现在最流行围绕大语言模型构建的框架,可用于聊天机器人、生成式问答 (GQA)、摘要等。
朋友们可以上传自己感兴趣的文章、资料到这个知识库中。之后,大模型就可以根据这些个人资料,利用其强大的推理能力,回答朋友们提出的相关问题。
例如:收集某位喜欢的公众号或博主的文章,上传到自己的知识库。当您对这些内容有任何疑问时,知识库就可以为您提供解答。这就像拥有一个私人的、基于自身兴趣的问答专家。
因为之前经历过一次次踩坑填坑的过程,这次搭建过程还算顺利,没过多久,Web 界面就成功启动了。
02
—
您已进入知识库测试模式,您输入的任何对话内容都将用于进行知识库查询,并仅输出知识库匹配出的内容及相似度分值和及输入的文本源路径,查询的内容并不会进入模型查询。
知识相关度 Score 经测试,建议设置为 500 或更低,具体设置情况请结合实际使用调整。3. 使用"添加单条数据"添加文本至知识库时,内容如未分段,则内容越多越会稀释各查询内容与之关联的score阈值。
单条内容长度建议设置在100-150左右。
用一个问题试试知识库:
往期热门文章推荐:
又一家顶级的大模型开源商用了!Meta(Facebook)的 Llama 2 搅动大模型混战的格局
Claude 2 解读 ChatGPT 4 的技术秘密:细节:参数数量、架构、基础设施、训练数据集、成本