【⽣成对抗⽹络】ConditionalGAN(CGAN,条件GAN)详细解读
对应论⽂:不忘沟壑
Conditional GAN (CGAN,条件GAN),是 Mehdi Mirza 于2014年11⽉份发表的⼀篇⽂章,也是 GAN 系列的早期经典模型之⼀,是⽬前许多GAN应⽤的前⾝。
⽂章的想法是 希望 可以控制 GAN ⽣成的图⽚,⽽不是单纯的随机⽣成图⽚。具体地,Conditional GAN 在⽣成器和判别器的输⼊中增加了额外的 条件信息,⽣成器⽣成的图⽚只有⾜够真实且与条件相符,才能够通过判别器。
【参考解读】
[1]
[2]do you remember the time
[3]
⼀、论⽂解读
原始的 GAN 模型没有任何条件限制,⽣成图像是随机的。因此作者考虑 加⼊⼀些条件信息,⽐如 类别标签 或者是 其他类型的数据,使得图像⽣成能够朝规定的⽅向进⾏。
举个例⼦,⽐如输⼊⼀只狗在奔跑,输出即为⼀只狗在奔跑的图。packageinstaller
⽅法思路
Conditional GAN 的原论⽂⽐较短,主要是想法的阐述,对于具体的实现⽅式并没有做太多限定。
⽹络模型
为了实现条件GAN的⽬的,⽣成⽹络和判别⽹络的原理和训练⽅式均要有所改变。
模型部分,在判别器和⽣成器中都添加了额外信息 y,y 可以是类别标签或者是其他类型的数据,可以将 y 作为⼀个额外的输⼊层丢⼊判别器和⽣成器。
obama victory speech
在⽣成器中,作者将输⼊噪声 z 和 y 连在⼀起隐含表⽰,⽽对抗性训练框架在如何构成这种隐藏表⽰上具有相当⼤的灵活性。(需要注意的是,Conditional GAN中并没有⽤到卷积操作,所以这么操作是没有任何问题的。)
损失函数
⼆⼈极⼤极⼩博弈的⽬标函数为:
六级分数分布
MNIST实验
mba分数线在该实验中,作者使⽤MNIST的类别标签的one-hot编码作为条件信息y。具体的⽹络模型可以参考原⽂。
雅思报名官网打不开
作者在MNIST数据集上的实验效果:
publisher⼆、Conditional GAN的延伸
sweet什么意思Conditional GAN的想法在各⽅⾯的细节上,⽐如条件y的具体内容(类别标签、实际的图⽚…),⽣成器、判别器中条件y的表⽰⽅式,判别器的打分⽅式(真实度和条件符合度放在⼀起打还是分开来打)等,有各种实现形式,因⽽延伸出了丰富的应⽤。
(1)text-to-image(⽂本⽣成图像)
(2)image-to-image(图像转换)
(3)Speech Enhancement(语⾳增强)
编制会计分录(4)Video Generation(视频⽣成)