前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >美亚4.6,写给程序员看的大模型入门实战书来了!

美亚4.6,写给程序员看的大模型入门实战书来了!

作者头像
数据STUDIO
发布2024-06-04 18:20:21
670
发布2024-06-04 18:20:21
举报
文章被收录于专栏:数据STUDIO数据STUDIO

Part.1

什么是生成式AI?

“所有产品都值得用大模型重做一次。”是近几年在AI圈子非常火爆的观点。

当大家都在热议大模型和生成式AI时,怎么让这些炫酷的技术快速落地,真正帮到商业和社会,成了个大难题。不过,AWS已经把大模型和生成式AI的门槛大大降低了。

什么是生成式AI?

生成式AI是一种利用机器学习技术(特别是深度学习)来创造新的、原创内容的通用技术。它能够基于从大量数据中学习到的模式和规则,利用大型语言模型(LLM)和基础模型(FM)来生成文本、图片、声音、视频、代码、网页等多种形式的内容。

(生成式 AI 项目生命周期框架)

目前已有多种类型的多模态生成式AI任务,比如:

· 文本摘要

生成一段较短的文本,同时保留主要思路。通常在客户支持中使用摘要功能,以快速地概述客户与客服代表之间的互动。

· 重写

修改文本措辞以适应不同的受众、正式程度或语气。

· 信息提取

从文档中提取诸如姓名、地址、事件、数据或数字等信息。

· 问答(Question Answering,QA)和视觉问答(Visual Question Answering,VQA)

直接针对一组文档、图像、视频或音频提出问题。

· 有害内容检测

作为问答任务的扩展,你可以询问生成式模型一组文本、图像、视频或音频中是否包含有害内容。

· 分类和内容审查

为给定的内容(如文档、图像、视频或音频剪辑)分配一个类别。

· 对话式界面

通过提供类似聊天界面的方式处理多轮对话,以完成相应任务。

· 翻译

语言翻译是生成式AI最早的用例之一。

· 源代码生成

根据自然语言代码注释或者手绘草图生成源代码。

· 推理

通过问题推理来发现潜在的新解决方案、权衡或隐藏的细节。

· 掩蔽个人身份识别信息

可以使用生成式模型从给定的文本语料库中掩蔽个人身份识别信息。对于许多需要处理敏感数据并希望从工作流中删除PII数据的用例,这非常有用。

· 个性化营销和广告

根据用户个人资料特征生成个性化的产品描述、视频或广告。

在这些生成式AI的用例和任务中,模型创建的内容已接近于人类对语言的理解,这确实令人惊叹。这是由Transformer 的神经网络架构来实现的。

那AWS是如何实现生成式AI落地的最后一公里的?

AWS,即Amazon Web Services的简称,是Amazon公司提供的云计算平台,它致力于提供企业级的安全性和隐私性,同时提供工具和基础设施来构建和扩展生成式AI应用程序。

(支持生成式AI的AWS服务和对应功能)

我们通常从模型中心开始生成式AI项目,比如在本书中,我们将用到模型中心里Hugging Face Model Hub 和Amazon SageMaker JumpStart的资源来探索Meta的Llama 2、TII的Falcon和Google的FLAN-T5等基础模型。

不过,生成式AI应用程序的构建不仅限于生成模型本身。为了创建一个既可靠又可扩展,同时确保安全性的应用程序,并且最终能够交付给用户或其他系统作为服务,需要多个组件的密切协作和整合。而AWS便能帮你完美地组合起来,它不仅提供像Amazon CodeWhisperer这样的打包生成式AI服务,更提供了构建端到端生成式AI应用程序所需的广泛服务。

(AWS提供了构建端到端生成式AI应用程序所需的广泛服务)

提高选择的灵活性、企业级的安全和治理能力、先进的生成式AI能力、通过全托管的服务降低运营成本,以及持续创新的能力。这些都是我们选择AWS来构建生成式AI项目的重要原因。

Part.2

为什么选择这本书学习大模型?

如果你是程序员,对O'Reilly动物书就不会陌生,这本书延续了O'Reilly动物书的风格,封面上是一只可爱的嘲鸫鸟。O'Reilly出版社40多年来专注于前沿技术,帮助专业人士掌握最佳实践,引领科技创新。

这本书美亚4.6星,口碑保证!

三位AWS生成式AI专家编写,深入浅出,引领大模型学习。

Chris Fregly

AWS生成式AI首席解决方案架构师,也是O'Reilly图书Data Science on AWS的合著者。

Antje Barth

AWS生成式Al首席开发倡导者,也是O'Reilly图书Data Science on AWS的合著者。

Shelbee Eigenbrode

AWS生成式AI首席解决方案架构师,她在各个技术领域拥有超过35项专利。

这样一本符合时代需求的好书自然而然地得到了AWS、Meta、Snowflake、Lepton AI、CSDN、百川智能等科技巨头的大佬和行业专家的联袂推荐。

Part.3

这本书可以帮你学习什么?

理论

在本书中,你将先探索生成式AI的概念及其在产品和服务中的应用潜力,了解生成式AI项目的完整生命周期。接着学习提示工程、小样本上下文学习、生成式模型预训练、领域自适应、模型评估、参数高效微调(Parameter Efficient Fine-Tuning,PEFT)和基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)等主题。

实践

翻开这本书,你将了解当今产业界和学术界常用的生成式AI用例和任务。

首先,你将和作者一同探讨多种模型类型,如大语言模型和多模态模型,并了解通过提示工程和上下文学习来优化这些模型的实际技巧。了解如何构建这些前沿的生成式模型,获得实践经验后,你可以选择是重用现有的生成式模型还是从头开始构建一个新模型。然后,你将学习如何把这些生成式模型适配到特定领域的数据集、任务和用例中,以支持商业应用。

你想要学习的LORA、RLHF、LangChain和ReAct等关键的生成式AI技术,在本书中都能找到。如何利用LoRA技术对模型进行微调?如何通过RLHF使模型与人类价值观对齐?如何利用LangChain和ReAct等开发agent?此类技术的详细解析和实际应用案例应有尽有。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据STUDIO 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档