我为什么弃用GAN？

输出单一、调参麻烦、损失函数不能收敛、稳定性差。

苏黎世理工大学的博士Andreas Lugmayr历数了各种GAN的“罪状”，说出了今后弃用GAN的话。

说出“弃用”，当然是已经有了B计划。

Andreas Lugmayr博士和他的团队开发了一种新的标准化流(Normalizing Flow)模型，能够弥补GAN在生成任务中的的种种缺陷。

这项研究成果“SRFlow”，还被ECCV 2020 Spotlight收录。

那么SRFlow到底有多厉害？能在多大程度上替代GAN呢？

SRFlow“又多又好”

从肉眼可见的生成任务结果上，可以看出SRFlow至少在两个方面超越了GAN，一是生成结果的多样性，二是提高图片分辨率后的保真度。

输入一个低分辨率马赛克图像，基于GAN的ProgFSR模型和SRFlow生成结果对比：

在提升4倍分辨率的任务中，SRFlow的生成结果也比基于GAN的ERSGAN更加清晰真实。

对于众多的GAN变体来说，有一些缺陷是难以避免的，比如图像复原生成任务，生成器广泛忽略了随机向量，因此，大多数基于GAN的图像到图像映射都是单一确定的。

GAN训练中的损失函数，包括了生成器伪造图像，而鉴别器却无法知道哪些图像是假的。

另一方面，鉴别器的职责就是确定一个图像是来自生成器还是来自训练集。

这两个相互冲突的目标导致了学习参数的持续漂移，导致输出结果不同程度的失真。

那么基于标准化流的SRFlow，是如何弥补这些缺陷的呢？

SRFlow不会忽略随机向量

对于GAN忽略输入的随机向量，导致输出单一的问题，传统的GAN策略是，在模型中增加一个控制信号，并抛弃重建损失函数。

△放大16倍分辨率下的SRFlow输出结果

而SRFlow在训练过程中，算法核心—标准化流模型将高分辨率图像转化为高斯分布。图像条件标准化流的情况并非如此。

为了避免GAN的判别器损失通常会导致模式崩溃，SRFlow采用单一损失进行训练的，并且对随机输出进行内采样。

模型稳定超参数少，调参方便

条件GAN需要仔细的超参数调整。很多GAN的变体模型中，总损失由多个损失的加权和组成。

所以降低失真需要很大的精力来调整不同的损失函数权重。

此外还必须平衡生成器和判别器，使训练过程稳定。

在图像生成任务中SRFlow使用最大似然策略（maximum likelihood），输入的图像被转化为一个高斯潜空间。通过简单的计算得到高斯向量的似然。然后使用现成的Adam优化器，这个损失函数会稳定地收敛。

△SRFlow的单一损失稳定且可收敛

Normalizing Flow本质上是稳定的。因为模型只有一层网络和一个损失，超参数要少得多，训练起来也更容易。

特别是对于开发新模型的研究人员来说，这一点非常实用。

新手可以更容易地比较不同的架构的Normalizing Flow变体。

输入输出保持高度稳定

在没有进一步干预的情况下，有条件的GAN是不具备输入一致性的。对于提升分辨率任务，一个重要的问题是，高分辨率的图像是否与低分辨率的输入保持最大程度一致。

如果不能，那么该方法到底是真的提高分辨率还是仅仅生成一个类似图片？这点十分值得怀疑。

GAN模型里有一个不受监督的损失函数，会导致模型自行生成图片像素。而标准化流模型避免了这种可能。它以且只以输入图像为条件，来模拟高分辨率图像的分布。

将SRFlow的输出与输入对比，可以看出与GAN的结果不同，具有高度一致性。

生成任务只需1张GPU训练

研究团队说，论文中的实验基于GLOW网络，使用多达40个GPU来训练图像生成。

但如果只是应对简单的图片生成任务，只需要一块GPU就能完成对SRFlow的训练。

什么是标准化流模型？

机器学习中有一类是概率模型。训练一个模型时，常见的一种处理方法是调整参数以使得模型在训练数据集的概率最大。

为了达到这个目的，需要假设模型满足一定的概率分布模式。

那么到底需要什么样的分布，既具有接近真实样本的表达能力，又具有统计机器学习模型较好的解释性呢？

高斯分布可以基本满足：采样方便、解析的密度已知、KL距离容易计算，还有中心极限定理的保证。最常使用的两种方法是用于分类的Categorical以及用于回归的Gaussian。

但这两种方法仍然有一些问题，因为真实世界中样本的概率密度函数一般来说，与范畴分布以及高斯分布相差甚远。

如果简单地使用高斯作为图像生成的似然函数，那最后得到的生成结果可能很糟糕。

而标准化流（Normalizing Flow）可以把简单的概率密度(比如高斯分布)形式转化成某种更高级分布形式。

Flow指的是数据流经过一系列双射(可逆映射)。最终映射到合适的表征空间，normalizing指的是表征空间的变量积分是1，满足概率分布函数的定义。

标准化流这种工具，可以产生更强大的分布函数。

从另一个视角来看，标准化流可以看作是一种参数化对先验概率q的逼近的方法，并且也可以用在其它似然函数方程场景下。

与GAN不同，标准化流模型在采样、训练稳定性、损失函数收敛、和一致性方面具有优势。

标准化流模型更加适合用在图像生成、强化学习、变分推断之类的任务。

SRFlow的团队，已经将这个基于标准化流的模型开源。

那么你的下一个机器学习任务，会使用SRFlow吗？

论文地址

https://arxiv.org/abs/2006.14200

开源地址

https://github.com/andreas128/SRFlow?

荐：

【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

声明

来源：量子位，人工智能产业链联盟推荐阅读，不代表人工智能产业链联盟立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

展开阅读全文

页面更新：2024-03-14

标签：变体向量生成器概率密度函数高分辨率模型图像分辨率损失参数稳定简单方法

1 2 3 4 5

自动抢红包开发商赔偿475万，一男子为当吧主行贿宝马X5

1、自动抢红包外挂开发者被判赔偿475万法院认定五方面不正当竞争行为（快科技）近期北京知识产权法院就审结了一起与 “ 自动抢红包 ” 有关的不正当竞争纠纷案。该款软件的开发及运营者掌上远景公司被判赔腾讯科技

中国大学的现实是：大学层次越低，上课越多，学生读书越少

中国大学的现实是，上课和大学的层次地位是相反的。大学层次越低，上课越多；大学层次越低，学生读书越少。事实上，在中国，“研究型大学”基本上是一流大学，而“教学型大学”基本上是三流大学。“研究型大学”最重要的特征就是强

贾跃亭旗下FF挂牌上市，华为云电脑将停止运营服务

1、贾跃亭旗下 FF 将在纳斯达克挂牌上市，恒大汽车持有 20% 股份（凤凰网科技）据证券时报报道，美国时间 7 月 22 日，法拉第未来（ FF ）将在纳斯达克挂牌上市，恒大汽车持有 FF 20% 股份。当地时间 7 月 20 日，Property Solutio

中国手机是怎样征服世界的？百页报告看我国手机产业有多强

浦银国际：《中国智能手机品牌征战全球》（完整版.pdf ）以下仅展示部分内容 O后台回复“20200906”由于今日头条后台需求量较大，一概不予回复，请VOX搜索“人工智能产业链联盟”进行回复。看点：未来十年，中国手机引领世界，走向

十问亿级神经元类脑计算机：AI领域有望突破，哪些还需火候

来源：澎湃新闻近日，浙江大学联合之江实验室共同研制成功了中国首台基于自主知识产权类脑芯片的类脑计算机（Darwin Mouse）。研究团队在9月1日的成果发布会上指出，该类脑计算机在神经元规模上超越了德国海德堡大学的BrainSca

以太坊联合创始人退出币圈，“熟蛋返生”相关组织被取缔

1、又一币圈大佬金盆洗手：以太坊创始人宣布退出币圈（快科技）据外媒报道，日前，作为第二大市值的加密货币以太坊（ ETH ）联合创始人 Anthony Di Iorio 表示，出于个人安全考虑，将退出币圈。根据 Anthony 的说法，目前出现的一些

Copilot将来会成为自动编程的AI吗？

相信不少人都用过代码工具或代码助手（不要狡辩），但是这次的AI不同于以往的工具，其他的工具需要抓取网络库已有的代码填填补补，而它可以更大范围的去试着理解已知代码，从而生成更详尽更适合的新的代码。不仅如此，甚至我们可以

鹅城这次真的来了，腾讯新大厦即将落成

还记得愚人节时腾讯的愚人节笑话么，说是要建一座全自动科技大厦，官方图放出来绝美无比，所以也骗到了很多小伙伴。不过这次腾讯要动真格了。虽然是愚人节开的玩笑，不过也可以从中看出来腾讯的野心。当时是说腾讯将建设世界

开课吧CEO方业昌发布全员内部信，宣布完成6亿元B1轮融资

7月11日，开课吧创始人、CEO方业昌博士在对全员的内部信中宣布完成6亿元B1轮融资。信中提到，开课吧正在进行业务和品牌的双重升级，升级后的开课吧定位于在线职业教育，将投身于更多元化的职业教育及人才服务中，帮助用户实现

阿里华为腾讯在2021年世界人工智能大会发布AI新技术进展

人工智能早已不是新鲜事，AI的发展已经不能用“走进人们生活”来形容了，如今人工智能已经成为人类不可或缺的一部分了。就在上周，今年的世界人工智能大会在我国上海召开。虽然只有短短三天，但是干货满满，本文来给大家盘点一

新版的office界面可以切换主题和颜色

Win11已经正式发布，预览界面大家应该已经见过了，预计今年12月份开始陆续给用户免费更新。而因为预览版进入大家眼帘，随之而来的还有新的Office。UI界面又是一番大改动，这一次的视觉更新为整个Office应用程序提供了一个简

抖音网页版成新摸鱼工具，如何玩转抖音？

各位打工人都应该知道微信pc版目前更新后是可以刷朋友圈的了，这一摸鱼神器得到大家的喜爱，而抖音作为另一个占据当代职场人大部分时间的软件，也回归了pc网页端。随着移动端的增长乏力，抖音这个炙手可热的火爆产品也遇见了

开课吧获6亿元B1轮融资，单月营收将破2亿元

在线职业教育品牌开课吧已于近日完成6亿元B1轮融资。对于融资用途，将主要用于教学教研、产品技术开发、线下场景搭建和组织建设等领域。早在去年8月，开课吧就曾完成由高榕和高瓴资本联合投资的5.5亿元A轮融资。开课吧成

冰岛4天工作制休3天，工资不减，效率却增高

这项进行了4年的振奋人心的实验，终于以一个大家都很满意的结果展现在世人眼前。外网疯狂讨论，并纷纷表示十分羡慕十分向往。到底是怎么回事我们一起来看看。什么叫三休，就是星期一到星期四上班，星期五到星期日休息。劳动

职场女性：华尔街首个女性大型银行CEO诞生

由于拥有生育成本，不得不说，女性在大部分行业受到的歧视会比男性更多。在千百年来社会范式和刻板化印象之下，我们看到，有一些人在努力跳出框架，越来越多的女性勇敢走出家庭，在企业高层占领一席之地。我们从出生就被贴上了性

上滑加载更多 ↓