00:00
好,各位小伙伴们大家好,接下来我们来看一下图像生成这一部分的相关内容,那在这一部分呢,我们把主要内容分成两个章节,一个章节就是我们的图像生成算法,那在图像生成算法这一部分,我们会给大家介绍相应的图像生成方法,然后第二章节呢,就是基于扩散模型的图像生成算法,那在这里老师会给大家去介绍扩散模型是如何来进行图像生成的。好,那首先我们来看一下第一部分图像生成算法,那现阶段比较常见的图像生成算法呢,我们主要可以分成这三类,那分别是我们的变分子编码器,生成对抗网络和扩散模型,那变分子编码器呢,也叫做va ae,那VAE生成的图片呢是相对逼真一些,所以在很多场景下,我们都会使用VAE来进行图像生成。然后第二种。
01:00
算法就是我们的生成对抗网络,也就是大家常常听到的干网络,那干网络呢,它是使用一种零和博弈的学习策略来进行图像生成,那在图像生成当中的应用也是非常广泛的,那除了上面介绍的vee和GA之外,那现阶段比较流行的就是我们的扩散模型,那我们现在的这些大模型来进行图像生成的时候,一般都是以这个扩散模型为基础的。好,那首先我们来看一下这三种算法分别是如何来进行图像生成的,首先我们来看变分子编码器,那变分子编码器呢,是在2014年的时候提出的啊,他跟我们传统的自编码器呢是不一样的,变分子编码器呢,它是通过数值的方式来对浅空间进行描述,它不是在对我图像空间进行描述,而是对图。
02:00
放的潜在空间进行描述,那他在对这个潜在空间进行描述的时候,是使用这种统计的方式,也就是说概率的方式对图像的潜在空间进行观察,观察得出这个潜在空间的统计分布之后,然后利用这些统计分布来生成新的图片,那利用变分字编码器生成的图片呢,相对要逼真一些,所以它在数据生成方面的应用价值啊也比较高一些,这是我们的变分子编码器,那第二种算法,我们的干网络啊,也是在2014年提出来的,那这个干网络啊,它是最著名的生成模型,GA网络呢,它使用零和博弈的这种策略来进行学习,在图像生成当中是非常广泛的,那在这个网络结构当中啊,它分成两部分,一部分是我们的生成器,一部分是我们的判别器,它通过随机噪声啊,一步一步的。
03:00
通过生成器来进行图片的生成,然后通过判别器来判别这是真的图片还是网络生成的图片,那以干为基础呢,它产生了很多的变种啊,比如说我们常见的这个DC game,然后style干,还有我们的C干,这都是我们比较常见的一些图像生成算法。好,那除了VE和干算法之外,我们刚刚说我们最流行的一种算法呢,就是我们的扩散模型,那这个扩散模型呢,它是受到非平衡热力学的启发,然后我们定义了一个扩散步骤的马尔可夫链,那就是假设我有一个清晰的图片,我就往这个图片当中哈,一步一步的去添加噪声,随着你添加噪声的步数的增加,大家想一下,最后我这张清晰的图片会变成什么样子,最后我这张清晰的图片会变成一个噪声,就是这里面我们几乎看不到有图像的。
04:00
身影,那我们的扩散模型来进行图像生成的时候,就是刚刚介绍的这个扩散过程的一个逆过程,也就是说我们要学习什么呀,学习从噪声当中一步一步的去去除,最后返回我们一张清晰图片的过程,也就说我们学习扩散过程的逆过程,然后从噪声当中构建出我们所需的样本,那对我们来讲所需的样本就是图片,那扩散模型它在最初设计的时候,它并不是为了去进行图片生成的,而是用于去除图像当中的噪声,那随着我们这个降噪系统哈,它训练的时间越来越长,哎,就是步骤越来越多,然后呢,效果越来越好,也是说它去噪的效果越来越好,当我们把一个纯噪声输入到这个系统当中的时候,我们可以生成。
05:00
逼真的图片,那这就是扩散模型啊,它的一个思想就是把纯噪声送入系统当中,系统返回一个逼真的图片,那这就是我们扩散模型生成图片的思想。好,那在这里呢,我们把这三种常见的图片生成算法给大家简单介绍了一下,那接下来我们详细来看一下每一种算法具体是如何来进行图像生成的,那接下来老师先把这个视频暂停一下,稍后我们来看一下VAE如何来进行图片生成。
我来说两句