Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Byzer-LLM 利用大模型解决实际业务实战Demo

Byzer-LLM 利用大模型解决实际业务实战Demo

作者头像
用户2936994
发布于 2023-04-28 07:02:05
发布于 2023-04-28 07:02:05
1.2K02
代码可运行
举报
文章被收录于专栏:祝威廉祝威廉
运行总次数:2
代码可运行

Byzer-LLM 的使命

让每家公司都可以将自己的业务数据注入进商业或者开源大模型,完成私有化大模型应用。

Byzer-LLM 介绍

Byzer-LLM 是基于 Byzer(一个面向 Data + AI 的 Infra 和 Language)上的一个插件。

目前市面上基于大模型的想法其实可以落到三个层面:大模型,Finetune/RLHF, 以及应用层。所以我们相当于是在 Fintune层部分,当然,其实会部分涉及到应用层。目前用户使用大模型过程中,无论是因为场景或者因为技术原因诸如prompt context 长度限制,还是数据法律法规,亦或是隐私安全考虑,未来企业使用SaaS服务的概率都会偏低,都有私有大模型的需求。所以 Byzer-LLM 的使命就是让模型私有化。

Byzer-LLM 优势

那我们的优势在哪里呢?

  1. 第一个是Byzer是可以端到端,比如现在有非常多的开源的fintune的库,但是他们仅限于一个Lib, 你需要组装非常多的上下游的库,才能完成一个实际的业务场景,这件事情的难度对于普通程序员(比如一个前端,一个分析师,一个web工程师)可能是超出你想象的,此外,你还要给这些所有的库提供运行的环境,你可能需要引入各种基础设施,甚至还要使用调度系统去调度这些组件库才能协同工作。使用Byzer,你可以使用类SQL语言连接任何业务库,获取数据加工数据 ,并且注入到大模型内进行fintune,然后一键部署成函数,从而能够在流,批,API中调用。整个事情可能六条语句就完成了。
  2. 第二个是简单,门槛低。 Byzer 尽管也有很好的Python支持,但是你也可以在只懂SQL的基础上完成上述工作。 此外,我们做了非常多的细节。比如模型和数据都可以统一保存成表,方便管理,避免到处手动拷贝数据,模型等等。
  3. 第三个是性能, Byzer 支持从单机到分布式部署,支持GPU调度,可以根据用户需求随时进行算力和存储的扩展。

最后,Byzer 是从业务角度去帮助企业的。用户不用关心是大模型还是什么,对他来说,我要解决一个实际的需求,你能不能让我随便找个人一天就搞定? Byzer 就可以做到,只要是个研发(可能是个前端,可能是个分析师,一个后端web工程师,甚至可能只是一个稍微懂一点点SQL的同学),就可以帮企业搞定业务知识。第二个是,其私有化使命也可以让用户可以保护自己的数据资产,通过自己数据喂养出足够多的大模型副本,从而让自己拥有更好的护城河。

Byzer-LLM 使用示例

第一步来看看业务需求:

上面我们使用一个虚构的业务故事来描绘如何使用 Byzer-llm 解决实际业务问题

--------------------------------------------------------------------------------------------------

假设我是一家电商企业,大概20-30人,目前在淘宝上已经有十万个SKU, 之前淘宝限制描述SKU的字数,所以写的特别精简。现在淘宝突然放开了,允许200字。那么这件事要不要做呢?肯定要做的,我们希望新的描述可以更好的吸引女性用户。这个时候人工去写这十万个描述么?在以前,可能真需要,因为AI很烂,而且性价比还低,还要招算法工程师。那现在呢?老板找了做微信小程序的研发,说两天之内把这事搞定。当然了,研发有两条路可以走,第一条是去调现成的大模型API。这个方式第一个是要花钱,第二个发送的数据很可能有被买卖的风险。 所以他选择了第二条路,找了一个开源的大模型,为了部署测试效果,他使用Byzer, 四条命令就把数据库里十万条记录都跑了一遍,发现效果不好。接着他自己花了第一天剩余的时间自己用excel标了1000条数据,然后上传后使用两条命令fintune了一把,重新部署成函数,再跑一把十万条记录,效果还不错。第二天,他把效果导出成excel给到老板看。老板满意,接着他用一条Byzer 指令把新的描述更新到了数据库,此时完成了整个业务场景。

第三天,他刚准备泡杯茶休息下,老板来了一个新的需求,他希望把大概100万条数据里所有衣服的实体词都抽出来,比如高筒袜这样的。小哥用了三条Byzer 指令拿上次的大模型加上临时学习的一些prompt engineer的知识,快速的完成了这件事情。

我们可以看到,对于业务而言,所谓大模型,只是一个更好用的工具。我们在现有的条件下,不依赖专业人员,直接去各种实际场景的解决业务问题,而不是利用AI聊天打屁。

公司目前十万个SKU的标题都是这样的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
类型#裤*版型#宽松*风格#性感*图案#线条*裤型#阔腿裤

现在平台放开,可以展示更长的文本,需要将原本存量上述文字转化为更友好的描述,比如

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
宽松的阔腿裤这两年真的吸粉不少,明星时尚达人的心头爱。毕竟好穿时尚,谁都能穿出腿长2米的效果宽松的裤腿,
当然是遮肉小能手啊。上身随性自然不拘束,面料亲肤舒适贴身体验感棒棒哒。系带部分增加设计看点,
还让单品的设计感更强。腿部线条若隐若现的,性感撩人。颜色敲温柔的,与裤子本身所呈现的风格有点反差萌。

我们使用大模型来完成这个工作。

--------------------------------------------------------------------------------------------------

现在,让我们开始开工。首先我们安装部署好 Byzer后,安装一个插件:

Byzer 会把模型和数据进行统一管理,都是以表的形式存在数据湖

部署下原始模型看看效果:

现在我们开始琢磨如何注入私有的业务数据或者自己手动标的数据(比如使用excel标注的数据):

数据和模型都可以在侧边栏看到:

现在,可以部署我们新的模型和验证效果:

做一些 Prompt 优化下效果:

验证对外提供的 API服务:

完工!

总结

可以看到,一个懂SQL的同学就可以完成一个实际的业务场景需求。真正实现了 Byzer-LLM 的使命: 让每家公司都可以将自己的业务数据注入进商业或者开源大模型,完成私有化大模型应用

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南
基于此,越来越多的企业将构建围绕于 LLM 的应用,而这些应用在当前以辅助人类设计为主。未来,我们将保持一种观点:LLM as Member,即 LLM 应该是我们的伙伴,而不再是一个辅助的工具。
Phodal
2023/08/11
6520
以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
prompt(提示词)是我们和 LLM 互动最常用的方式,我们提供给 LLM 的 Prompt 作为模型的输入,并希望 LLM 反馈我们期待的结果。 虽然 LLM 的功能非常强大,但 LLM 对提示词(prompt)也非常敏感。这使得提示词工程成为一项需要培养的重要技能。
汀丶人工智能
2024/05/09
3.8K0
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
AI最佳应用篇——什么时候需要微调你的大模型(LLM)?
在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业。相信现在各大公司都在进行着不同程度的AI布局,有AI大模型自研能力的公司毕竟是少数,对于大部分公司来说,在一款开源可商用的大模型基础上进行行业数据微调也正在成为一种不错的选择。
山行AI
2023/06/26
1.3K0
AI最佳应用篇——什么时候需要微调你的大模型(LLM)?
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
**Modelscope **是一个交互式智能体应用基于ModelScope-Agent,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。AgentFabric围绕可插拔和可定制的LLM构建,并增强了指令执行、额外知识检索和利用外部工具的能力。AgentFabric提供的交互界面包括:
汀丶人工智能
2024/05/26
6800
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
大型语言模型智能应用Coze、Dify、FastGPT、MaxKB 对比,选择合适自己的LLM工具
Coze、Dify、FastGPT 和 MaxKB 都是旨在帮助用户构建基于大型语言模型 (LLM) 的智能应用的平台。它们各自拥有独特的功能和侧重点,以下是对它们的简要对比:
星哥玩云
2025/04/08
3520
大型语言模型智能应用Coze、Dify、FastGPT、MaxKB 对比,选择合适自己的LLM工具
分分钟手搓一个知识快应用!10年积淀,「云中问道」大模型重新定义知识管理
近日,Llama2正式发布了商用化的开源许可,效果可以媲美GPT-3.5,这将极大地推动大模型的开源商业生态的落地与发展。猎豹CEO傅盛第一时间表态,对大模型应用创业来说是极大利好。
新智元
2023/09/09
5550
分分钟手搓一个知识快应用!10年积淀,「云中问道」大模型重新定义知识管理
LLM安全专题
提示词 是指在训练或与大型语言模型(Claude,ChatGPT等)进行交互时,提供给模型的输入文本。通过给定特定的 提示词,可以引导模型生成特定主题或类型的文本。在自然语言处理(NLP)任务中,提示词充当了问题或输入的角色,而模型的输出是对这个问题的回答或完成的任务。
h3110_w0r1d
2025/02/06
1090
LLM安全专题
关于 LLM 和图数据库、知识图谱的那些事
本文整理自 NebulaGraph 布道师 wey 在「夜谈 LLM」主题分享上的演讲,主要包括以下内容:
NebulaGraph
2023/08/16
1.3K0
关于 LLM 和图数据库、知识图谱的那些事
关于语言模型私有化部署的讨论 | AIGC实践
上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。
睿齐
2024/02/26
4620
关于语言模型私有化部署的讨论 | AIGC实践
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等
汀丶人工智能
2024/08/05
11.3K0
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
[译文] LLM安全:3.网络LLM攻击及提示注入知识普及(PortSwigger)
这是作者新开的一个专栏,主要翻译国外知名安全厂商的技术报告和安全技术,了解它们的前沿技术,学习它们威胁溯源和恶意代码分析的方法,希望对您有所帮助。当然,由于作者英语有限,会借助LLM进行校验和润色,最终结合自己的安全经验完成,还请包涵!
Eastmount
2024/06/18
7270
[译文] LLM安全:3.网络LLM攻击及提示注入知识普及(PortSwigger)
AI大模型企业应用实战-“消灭”LLM幻觉的利器 - RAG介绍
大模型一定程度改变了我们生活工作的思考方式,越来越多的个人和企业在思考如何将大模型应用到更加实际的生产生活。
JavaEdge
2024/08/17
1820
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
SWIFT支持了开源模型,尤其是中小型模型(7B、14B等)对Agent场景的训练,并将loss-scale技术应用到agent训练中,使中小模型API Call能力更稳定,并支持使用单张商业级显卡进行Agent推理和部署,可以直接在生产场景中全链路闭环落地使用。
汀丶人工智能
2024/05/26
1K0
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
通向 AGI 之路:大型语言模型(LLM)技术精要
作者丨张俊林 本文经授权转载自知乎:https://zhuanlan.zhihu.com/p/597586623?utm_campaign=shareopn&utm_medium=social&utm
AI科技评论
2023/02/23
2.5K0
通向 AGI 之路:大型语言模型(LLM)技术精要
保姆级教程:使用dify源码本地部署LLM应用开发平台
现在大模型应用平台让人挑花了眼,想创建个人智能体的选择越来越多了,列举一些国内主流AI平台:
languageX
2024/06/16
29K0
保姆级教程:使用dify源码本地部署LLM应用开发平台
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
嘿,大家好!作为一名技术宅,我在2024年与AI的大型语言模型(LLM)技术有了不少“亲密接触”,感觉就像是和一位日益聪明的老友并肩前行。
汀丶人工智能
2025/01/25
5860
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
我独到的技术见解:LLM的演进与发展
2024年已经过去快两个月了,是时候对2023年get的新技术进行一次的沉淀和总结了。
languageX
2024/01/22
4.4K1
我独到的技术见解:LLM的演进与发展
LLM智能体工程落地思考
人工智能领域著名教授吴恩达在今年3月份红杉资本的人工智能峰会(AI Ascent)以及最近Snowflake峰会开发者日上都发表了关于AI Agent(人工智能体)的演讲。演讲中,其分享了对AI Agent未来发展潜力的展望。认为AI Agent能够让人工智能胜任更多种类的任务,甚至可能比下一代基础模型带来更大的AI进展。
colorknight
2024/08/01
1940
LLM智能体工程落地思考
LangChain:打造自己的LLM应用
导读 随着LLM的技术发展,其在业务上的应用越来越关键,通过LangChain大大降低了LLM应用开发的门槛。本文通过介绍LangChain是什么,LangChain的核心组件以及LangChain在实际场景下的使用方式,希望帮助大家能快速上手LLM应用的开发。
京东技术
2023/11/05
2.1K0
LangChain:打造自己的LLM应用
USENIX Sec'25 | LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
本文介绍对 LLM 提示词注入攻击(prompt injection)的通用防御框架。首篇论文已被安全顶会 USENIX Security 2025 接收,第一作者陈思哲是 UC Berkeley 计算机系博士生,Meta FAIR 访问研究员,研究兴趣为真实场景下的 AI 安全。他的导师是 David Wagner (UCB), 郭川 (Meta), Nicholas Carlini (Google)。
机器之心
2025/02/14
1530
USENIX Sec'25 | LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
推荐阅读
以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南
6520
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
3.8K0
AI最佳应用篇——什么时候需要微调你的大模型(LLM)?
1.3K0
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
6800
大型语言模型智能应用Coze、Dify、FastGPT、MaxKB 对比,选择合适自己的LLM工具
3520
分分钟手搓一个知识快应用!10年积淀,「云中问道」大模型重新定义知识管理
5550
LLM安全专题
1090
关于 LLM 和图数据库、知识图谱的那些事
1.3K0
关于语言模型私有化部署的讨论 | AIGC实践
4620
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
11.3K0
[译文] LLM安全:3.网络LLM攻击及提示注入知识普及(PortSwigger)
7270
AI大模型企业应用实战-“消灭”LLM幻觉的利器 - RAG介绍
1820
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
1K0
通向 AGI 之路:大型语言模型(LLM)技术精要
2.5K0
保姆级教程:使用dify源码本地部署LLM应用开发平台
29K0
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
5860
我独到的技术见解:LLM的演进与发展
4.4K1
LLM智能体工程落地思考
1940
LangChain:打造自己的LLM应用
2.1K0
USENIX Sec'25 | LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
1530
相关推荐
以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验