对大部分刚刚上大学的计算机系学生来讲,C语言或是python,Java,C++毫无疑问都是十分头疼的专业课,知识面广,知识程度深导致编程的入门难度并不小,更不用提在学习过程中可能遇到的许多稀奇古怪的Bug。
可能大部分同学会选择看网课,读书籍的方式去学习,然而每个人对知识的接受程度不同,网上的教程大多会尽可能地为大多数同学打造,甚至说只是为了赚钱,并不能保证完全适合每一个人,遇到一些课程或书籍中没有讲到的问题时,只能自己一点点摸索,效率极低。
即使是已经开始工作的程序员,在面对远比学习环境复杂的开发环境,也可能会束手无策,需要进行进一步的学习。
本博客着力于介绍腾讯混元大模型的模型搭建全流程,并介绍如何自行搭建模型进行个性化编程学习。
腾讯混元大模型提供了强大的多种能力,可以在在官方地址查看详细介绍。
可以看到,现在混元大模型已经有了9大功能,其中比较常用的是:混元生文、混元多模态和混元生图。
• 混元生文:专注于文本生成,适用于各种语言处理任务,如文章撰写、摘要生成、对话系统等。
• 混元多模态:能够处理多模态数据,包括文本、图像等,适用于需要多维度信息的场景。
• 混元生图:专注于生成高质量的图像,适合创意设计、广告制作等场景。
根据需求,我们使用混元生文模型。
那么现在就要开始正式搭建我们的大模型了。
先对这个页面各个板块的功能进行介绍。
4.2. 上下文改写最好开启,但记忆轮数自行把握,效果上轮数越多越拟真,效果也就越好,但相应的token就用得多。
4.3. 输出配置。
输出格式:流式就是生成一个字就显示一个字,会有动画效果;而非流式就是生成完毕后一下子全部显示出来。
依我个人来看,目前混元模型的流式动画还有待优化,推荐使用非流式。
4.4. 回复设置
当大模型遇到知识库中找不到答案的问题时,如开启保守回复,就会按照给定的模版回答,否则就可能会胡言乱语。
由于上面我们开启了搜索增强,所以大概率是遇不到这样的问题的,所以可以自行选择。
提示词是大模型的核心,这里以编程导师为例,介绍一下怎么快速生成提示词模版。
首先随便写一些相关的提示词进去:
你是一名资深程序员,你喜欢帮助初学者或是同行解决问题,共同进步。
输入之后,点击一键优化,就可以得到一个提示词的模版了。
点击应用即可,即使对优化不满意,重新优化也很难达到预期,不如后续自行修改。
如果你对大模型的输出不满意,可以随时进行修改,也可以在提示词中增加你的个性化要求,比如只给代码不做说明,也可以要求进行详细的解释。
当然要注意的是,如果没有启用搜索增强功能,可能由于其自身知识库中有这些简单问题的模板,并不能很好地执行个性化指令。
另外在添加个性化指令之后,就不要再使用一键优化功能了,可能会丢失个性化指令。
一个方便进行修改的提示:按住这里并拖动可以增加文本框面积
知识库是自行搭建大模型的核心,也是我们选择腾讯混元大模型而不是其他模型的理由。
搜索增强就是从搜索引擎中获取数据,不再赘述,其他三个功能中我们主要介绍第一个——文档。
先说说参数设置,参数设置中关于文档知识库的有两个选项:
这里保持默认就好,当然也可以根据需求修改。
接下来我们进入知识管理界面,添加知识库。
我们可以看到这样的界面:
我们点击左上角导入,从网页导入。
接下来就是输入网页了,可以输入优质博主的优质博客的网页,你可以在这里输入你想要学习的方向的一些博主的博客链接,让它导入后成为知识库的一部分来为你解答。
这里以我的一篇博客(https://cloud.tencent.com/developer/article/2454910)为例:
这样在提问时,模型就会从导入的博客中自动获取内容并用来回答了。
但是请注意,由于知识库容量有限,所以一方面建议只导入优质博主的优质博客,并且是和所需方向切合的,比如初学者就可以把@fhvyxyci 这个博主截止目前的所有博客都导入进去,相信会对你有帮助。
另一方面,建议删除自动爬取时爬到的一些广告或是其他与博客实质内容无关的网页内容,可以尽可能地多导入进去一些博客。
优质博主可以直接在腾讯云开发者社区年榜和CSDN周榜与年榜或是其他博客平台上进行扫榜,寻找与所需知识相关的博主。
注:CSDN的博客链接直接复制出来可能是这样的:
https://blog.csdn.net/fhvyxyci/article/details/142601044?spm=1001.2014.3001.5502
注意要把details/数字之后的问号开始的全部内容删掉,不然无法导入:
https://cloud.tencent.com/developer/article/2454910
效果展示:
这与我的博客中的内容是完全一致的。
但是,请注意,不清楚是Bug还是设计原因,当在知识库中勾选文档之后,就不会在搜索引擎上搜索了,这会导致文档中搜索不到的内容,大模型会直接回答失败,因此如果是要发布出去给别人使用,建议多导入一些博客内容。
到这里,大模型的搭建就基本完成了,你可以点击右上角的发布,与所有人共享你的大模型,也可以不发布进行独享。
这是进行模版讲解的大模型:https://lke.cloud.tencent.com/webim_exp/#/chat/BWUSBw
谢谢你的阅读,喜欢的话来个点赞收藏评论关注吧!
我会持续更新更多优质文章
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。