00:00
各位小伙伴们大家好,首先我们来看一下第一章节AIGC是什么的相关内容,AIGC它的全称是AI generated content,翻译成中文呢就是人工智能内容生成,也就是使用人工智能技术来进行内容生成。那么AIGC具体使用了什么样的人工智能技术,又能产生什么样的内容呢?下面我们就给大家来具体分析一下。首先我们从技术上来给大家去说明一下AIGC具体使用了哪些技术,首先第一个就是内容孪生,内容孪生呢简单来讲就是从一种模态的数字内容映射到另一个模态的数字内容,也就是去产生另一个模态的内容。内容孪生主要包括智能增强和智能转移,增强呢就是对数字内容进行修复去噪。
01:00
细节增强等,而转译就是对数字内容转换,比如说我们常见的机器翻译,内容孪生的目的是将现实世界的内容进行智能增强与智能转移,更好的完成现实世界到数字世界的一个映射。那主要的应用场景就包括图像超分,比方说我们拍摄了一张照片,但是这张照片的图像分辨率呢非常低,这时候我们就可以通过智能增强技术将图片的分辨率进行放大,同时呢增强图像当中的细节信息来生成一张高清的图片。再比如对于老照片来讲,图像当中的像素是有缺失的,那我们也可以通过智能增强的技术来对它进行一个复原。那智能转移是关注于不同模态之间的相互转换,那比如我们常间的语音转字幕,我们录制了一段音频,可以通过智能转译技术将这段音频转换成字幕,或者呢,我们有一段文本,我可以自动生成语音,也就是语音转字幕,文字转语音的应用,这是第一个技术,内容孪生。除了内容孪生之外,我们还使用到了内容编辑的技术,那内容编辑是指通过对内容的理解以及对它的属性控制来实现对内容的更改。比方说在计算机视觉领域当中,通过对视频内容的理解来实现不同场景视频片段的剪辑,也就是场景剪辑。
02:41
或者通过人体部位的检测以及目标衣服的变形控制与截断处理啊,将目标衣服覆盖在人体部位上来实现虚拟事业,还有在语音信号处理领域当中,通过对音频信号的分析,实现人声和背景声的分离,这都是内容编辑的应用场景。除了内容孪生和内容编辑之外,第三种技术就是内容生成。内容生成指的是通过对海量数据当中进行学习,学习其中的抽象概念,并且通过对这些概念的组合来生成全新的内容。比方说我们常见的AI绘画,就是从海量绘画作品当中学习不同的笔法、不同的内容、不同的艺术风格,并基于学习到的这些内容重新生成特定风格的绘画作品。再比如在跨模态领域当中,通过对输入文。
03:42
本输出特定风格与属性的图像,不仅呢文本能够描述图像当中的主体数量、主体的形状、颜色等属性信息,而且呢,也能够描述主体的行为、动作以及主体之间的关系。除了AI绘画之外,常见的文本生成、AI写作,然后视频生成、多模态生成,这都是内容生成的相关技术。
04:09
AIGC从技术上的应用我们就给大家说明这些,接下来我们来看一下从生成内容上来看AIGC具体能够生成哪些内容。首先第一个就是文本生成,也就是基于NLP的文本内容,根据使用场景哈,我们可以把它分为非交互式和交互式的文本生成。那非交互式的文本生成呢,就包括摘要标题的生成,文本风格的迁移、文章的生成等,而交互式的文本生成就是包括我们的聊天机器人、文本交互游戏等代表性的产品呢,就是拆gpt、文心一言等都是来进行文本生成的。第二个就是图像生成,那图像生成又分成图像编辑修改与图像的自主生成,图像编辑修改呢是指的我们的图像超分、图像修复、人脸替换图像、去水印图像。
05:09
背景去除等。而图像自主生成指的是端到端的生成,比方说利用真实的图像来生成卡通图像,利用真实的图像来生成素描图像,以及我们的文声图,代表性的作品有made journey day、文心一格等都是来进行图像生成的。那除了文本生成和图像生成之外,我们还可以进行音频生成。音频生成一般用在C端产品当中,比方说我们常见的语音克隆,根据一个人的人生生成另一个人的人生。另外呢,还可以用于文本生成,特定场景的语音,比方说数字人、播报新闻、语音客服等,代表性的作品呢,就是deep music VI ne都是来进行音频生成的。还有我们的视频生成,视频生成与图像生成是类似的,主要分为视频编辑和视频的自主生成。视频。
06:09
编辑能够用在视频的超分视频修复啊,比方说老电影上色呀,画质修复呀,视频画面的剪辑,根据识别出来的画面内容自动进行场景剪辑,那视频自主生成呢,就可以用于图像生成视频,比如给定参照图像生成一段运动视频,或者是文本生成视频,给定一段描述性文字生成符合内容的视频,这是视频生成的应用,那代表性的产品就有deep fake video j PT的最后一个就是多模态生成,多种模态进行组合搭配啊,进行模态间的转换生成,比方说文本生成图像,我们根据提示词生成特定风格的图像,文本生成音频啊,比方说我们的AI作曲,根据提示词生成特定场景的音频,文本生成视频,我们可以根据一。
07:09
在描述性的文本生成语义内容相符的视频片段,或者是图像生成文本、图像生成视频等,这都是多模态生成的应用。多模态生成的代表作品呢?有大Y呀、mid journey stableion,这都是多模态生成的代表作品。好,AIGC是什么?我们就从技术和生成内容上给大家介绍完成了。如果大家想要了解更多AIGC大模型相关技术,请关注AI大模型技术与应用训练营。
我来说两句