跳过主导航

甘斯生成面临如何?

在这里,我们看看对手的概念可以变成我们的优势,通过生成随机的,逼真的图像。
人以二进制投射到它们
©约克大学

在这里,我们看看对手的概念可以变成我们的优势。我们要关注的任务生成随机的,逼真的图像的面孔。一种方法在2014年提出这个任务被证明是非常成功的。这种方法被称为生成对抗网络(甘)和由两个网络。的发电机将一个随机向量转换成一个图像。的鉴频器试图区分真实和假的图像。两个网络并行训练,玩一种游戏:发电机正试图愚弄鉴频器的鉴频器,试图发现发电机的假货。

发电机

第一个网络是将合成图像。建筑看上去有点像一个cnn的向后版本到目前为止您已经看到。需要一个矢量,\ (z \),在第一层作为输入和输出图像,\ (i = g (z) \),从最后一层。这种架构可以用层你已经看到。例如,完全连接层可以从输入向量映射到一个张量较低的空间分辨率。然后一系列卷积层可以处理张量的增加空间分辨率,直到最后一层。唯一一点我们还没有看到某种对面池,而不是降低分辨率,增加它。为此,我们可以使用某种upsampling像使用当你调整照片的图像编辑工具。最简单的是近邻upsampling每个像素只是复制4次:

近邻unsampling例子

在现实中,发电机的结构是非常重要的,很多微妙的技巧已经开发的良好表现。但完全连接层的基本组合,upsampling、卷积和ReLU会工作的很好。

我们说的矢量发生器的输入是一个点潜在的空间的模型。这个潜在的空间数据的压缩表示(在我们的例子中脸图像)类似的图像也有类似的潜在的向量(即靠的很近的潜在空间)。这有点像我们的人脸识别网络的嵌入在早些时候计算。在氮化镓,我们决定在潜在空间的分布。通常,我们说他们遵循多元正态分布,你可能会遇到数学概念的研究。

当训练我们的甘,我们随机生成潜在向量的抽样分布。所有这一切都意味着我们生成随机数,遵循分布。我们为随机潜在的矢量发生器,它输出图像。一旦训练完成后,我们预期这张照片看起来就像一张脸的照片。

鉴频器

鉴别器是一个分类CNN就像你见过的。需要一个图像,我,作为输入和输出d (i),图像的概率是一个真正的脸图像。在培训过程中,鉴别器给出真实的脸图像一半的时间从我们的发电机另一半和输出。对于真正的脸的图像,这意味着我们需要一个大的数据集的脸图像,类似于人脸识别的训练数据网络。

氮化镓培训

培训过程使用一个非常轻微的扭曲的反向传播。鉴频器是正常训练。它给出了一个真实的或者合成假图像作为输入,并分类损失计算。这鉴别器的损失是用于更新权重在鉴别器网络(即帮助鉴别器更好地发现假货)。

鉴频器训练

然而,当提供了假的图像作为输入,计算与翻转标签分类损失——即我们希望它分类假形象。这个损失的梯度backpropagated通过鉴别器(没有更新鉴别器的重量),然后进入发电机(权重更新)。这些更新将使鉴别器执行更糟糕的是通过改变输出像素值,这样虚假的形象更接近于归类为真实的。

发电机的培训

这一过程持续进行直到找到一个平衡的鉴别器分配真实和假图片概率为0.5,即它不能区分真实和假的图像。此时,发电机也希望学到真正的真实数据的分布。在我们的例子中,这意味着它可以生成可能面对的整个空间图像。

©约克大学
本文从免费在线

智能系统:介绍深度学习和自治系统

FutureLearn——终身学习

我们的目的是将受教育的机会。

我们提供多样化的选择来自著名大学的课程和来自世界各地的文化机构。这些都是一步一个脚印,并可以在手机、平板电脑和桌面,所以你可以学习你的生活。

我们认为学习应该是愉快的,社会经验,所以我们的课程提供了机会与他人讨论你的学习,帮助你作出新的发现和形成新的想法。
你可以解锁新的机遇与无限制地成百上千的在线短期课程一年通过订阅我们的无限的包。电竞博彩app有什么与顶尖大学和组织建立你的知识。dota2竞猜吧

了解更多关于如何FutureLearn正在改变的受教育机会