一键就美化人教版毒教材，从历史到技术突破AI绘画经历了是什么

最近一段时间，AI绘画从绘画能力到版权争议，让艺术圈和技术圈吵得沸沸扬扬。究其原因，还是因为AI技术最近在绘画领域突飞猛进。

包括此前轰动性的教育圈大事件，被吐槽配图“形象丑陋”的数学教材频上热搜。

随后新教材插图绘制工作由中央美术学院的设计团队，经过三个月的精心绘画之后，让小学生们的教材大变样。

而人工绘画也暴露出一些问题，比如缺乏时效性、耗费资金、费时费力等等。

于是就有人用AI绘画技术来修复“丑”插图，更快呈现出高质量的人物图像。

英国智能科技公司旗下的stable diffusion平台就可以实现这样的修复，效果如下图。

由于原图中人物的脸型存在较大的错误，所以曾有修复者放弃在原图的基础上修改，而是使用stable diffusion上的img2img(以图画图）功能在保持原来的构图的基础上重画。

具体操作是首先用PS去除图片周围的不相关部分，然后是在stable diffusion的网页操作界面中上传待修复的图片，粘贴通用的反向提示词，输入正向指示词指导AI作画。

接着是调整批量参数，让AI生成16张图，最后生成的结果为16张图片。

由于AI画图结果存在随机性，所以需要多生成几张图，挑选最符合大众审美需求的图片，经过仔细挑选对比，选出了最贴合传统人教版教材的小男孩形象，且增加了一些新时代元素，获得一众网友好评。

从这个角度看，AI技术在绘画领域，取代画师的一些基础工作已经完全可能，难怪让很多人再次感受到了来自人工智能的威胁。

看到这里，也有很多人感慨，AI才发展了多少年，怎么这么快就能取代人类画师呢？

AI绘画史发展背景

人工智能自1956年以来有六十余年的发展历程，在学术界和业界都可谓仁者见仁，智者见智。而AI绘画也在上个世纪就已经出现了。

我们将人工智能绘画史的发展历程划分为以下四个阶段：

第一个阶段是AI应用发展期：20世纪70年代初至80年代中期。

20世纪70年代出现的专家系统模拟人类专家的知识和经验，解决特定领域的问题，人工智能逐渐走下神坛，走入寻常百姓家中。

从一般推理型策略探讨转向。AI在医疗、化学、地质等领域取得成功，人工智能发展自此走入新高潮。

同时1973年，Harold Cohen就已经开始尝试和电脑程序“AARON”携手进行绘画创作，与当下AI绘画不同之处在于，ARRON使用机械手臂在画布上进行绘画，而非数字绘图。

第二阶段是低迷发展期：20世纪80年代中至90年代中期。

随着人工智能的应用规模不断扩大，专家系统存在的应用领域狭窄，缺乏常识性知识获取困难，推理方法单一。

不过科学家们仍在进行艰难的探索和尝试。进入20世纪80年代，ARRON学会了对三维空间物体的绘画表现方法；90年代，它学会了使用颜色进行绘画的功能，已经绘制出了多种作品，直到今天，它仍在进行创作。

第三是稳步发展期：20世纪90年代中期至2010年。

在这个阶段，由于网络技术特别是互联网技术的发展，加速了人工智能的创新研究，促使人工智能技术进一步走向实用化。

一九九七年，国际商业机器公司深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫、智慧地球的概念横空出世，这些都是这一时期的标志性事件。

第四阶段是蓬勃发展期：2011年至今。

随着大数据、云计算、互联网、物联网等信息技术的发展，泛在感知数据和图形处理器等计算平台，人工智能技术飞速发展，出现了图像分类、语音识别、知识问答、人机对弈、无人驾驶的人工智能技术，实现了从不能用、不好用到可以用的技术突破迎来爆发式增长的新高潮。

从Google趋势提供的搜索指数来看，2004年至2007年期间，“AI painting”就已经成为检索热词；2008年之后，检索热度开始下降并进入平缓期；直到如今，AI绘画再一次成为公众关注的焦点。

AI绘画为何发展突飞猛进，还需要从AI的核心技术-—深度学习开始说起。

从简单到复杂的AI绘画进阶史

深度学习在计算机视觉领域的发展可以追溯到二零一二年。AI学者吴恩达和Geff等人的猫脸识别实验。

通过一千台电脑创造出多达十亿个连接的神经网络，上万张猫脸图片的模型训练后，最终画出了一个模糊的猫脸，这意味着机器自主学会了识别猫的面孔。

此后，科学家们在AI图像生成的方向上继续深入研究，提出了GAN生成对抗网络，通过生成器与判别器的互相博弈来不断提升生成能力。

就像有一位老师在检查学生画得像不像，不像的话学生就重新修改如此循环。

2015年至2022年，研究人员对绘画模型进行了很多探索，但这个时候AI还做不到根据文字来生成图片。

直到2021年1月，OpenAI接连发布了两个连接文本和图像的神经网络dalle和clip。

Clip基于大规模图文数据集进行了对比学习训练可以提取文本和视觉特征来互相匹配。也就是说AI能够将文字猫与猫的图像相关联，且关联的特征是非常丰富的。

在clip推出一年后2022年2月somani等几个开源社区的工程师制作了一款ai图像生成器disco diffusion。

它能理解输入的主体内容、艺术风格、结构、视角和修饰词，且生成的图片更华丽。

disco diffusion作为免费开源项目，搭载谷歌colab上使用浏览器即可运行，AI绘画从此进入了大众视野。

不过大众真正开始了解AI绘画，需要从2017年4月开始算起，Google提出Sketch-RNN模型的时候。

Sketch-RNN基于Seq2Seq模型构建，并使用了变分推理方法，模型的训练使用了一个包含几百个种类的上千张手绘简笔画图片。

通过训练，模型能够绘制一些简笔画。Google在论文《A Neural Representation of Sketch Drawings》中对这一模型进行了详细介绍，并在之后开源了相关代码。

Sketch-RNN模型得到了人们的广泛关注，一些开发者还基于该模型开发了一些有趣的应用。其中一个在线应用叫做“Draw Together with a Neural Network”，人们可以用鼠标随意画一个图形，并选择一个希望生成的图形类别，该网站便能以多种方式自动帮你补充完整个图形。

在Sketch-RNN模型之后，大量的AI绘画模型不断涌现。

2017年7月，创造性对抗网络（Creative Adversarial Networks, CAN）模型出现，尝试使AI绘制风格和图片类型更加多样的图画。

与传统的GAN结构一样，CAN也包含生成器和鉴别器两个部分。

在人工评测中，人们认为CAN模型的绘画和人类艺术家绘画的创意性不相上下。尽管创意性是一个比较主观的评价指标，不过这仍是AI学习绘画历史性的一步。

人类是有高级审美趣味的智慧生物体，对于技术所呈现的作品，人们会选择注入人的智慧和妙想，而没有完全依赖技术生成刻板的作品。

人的创意体现在创造技术和使用技术的方方面面。

技术对传统审美的再复现

海德格尔曾经说过，技术是人类的座驾，技术能否造福人类，就看使用者怎么去用它。

用在这里是再恰当不过了，或许传统画师的工作还没有被代替，就已经被不良用心者扰乱了健康的艺术环境吧。

无论是美术，还是关于美术的观念，从来没有停止过演化的步伐，AI不仅产生新的艺术形式，也将塑造关于美的观念，美术在未来会继续活下去，至于新的美术形式还会有怎样的转变，一切还有待讨论。

作者：李泽彤排版：孔瀚越

图片源于Q仔互联网冲浪所得，若有侵权，后台联系，Q仔滑跪删除~

展开阅读全文

页面更新：2024-03-24

标签：画师发展期技术人工智能模型图像人类年代教材领域历史图片

1 2 3 4 5

一键就美化人教版毒教材，从历史到技术突破AI绘画经历了是什么

AI绘画史发展背景

从简单到复杂的AI绘画进阶史

技术对传统审美的再复现

数字经济带来新职业，你的工作够“新”吗？

2022中国信息通信大会将在蓉召开

微软公司创始人，前微软公司董事长、CEO-比尔·盖茨的辉煌人生

两大巨头同时宣布：停止！烧光数百亿……

涨！2022年10月30日鸡蛋价格行情早报

570元/平方米！鹤岗、阜新部分房源“白菜价”？但房价仍在跌

坐火箭蹿升：潮汕80后神秘富豪赵伟斌，5年干出一家500强民营企业

11月上旬这三个板块或将迎来大幅上涨

不要再瞪着上证指数了

海通开元董事长张向阳18岁参加工作他的工学学士何时获得的呢？

被困住的蓝月亮

11月全国糖酒会有哪些值得关注？

2000年，美国GDP占全球的30.4%，而我国GDP仅占3.5%，现如今呢？

7 大主力品牌一体两翼，慕思股份：打造中高端及年轻时尚品牌矩阵

美股最近为什么这么强？

人类长大后就丧失了很多先天能力，先天更比后天强

中国屏下指纹识别技术行业现状深度研究与发展前景分析

地球有94种化学元素，人类身体用了60多种，造一个人要花多

「三星“半导体减产”原因」资本、生产规模、技术竞争

美敦促盟友限制对华技术出口，日本荷兰拒绝，仍继续对华出

社会主义社会是人类的共同目标

历史上，3000点以下都发生了什么？

A股估值击穿三次历史大底 11月股市反转？边风炜：最后的机

历史上著名的“风雨雪”

全国智能无人艇搜救大赛大连启幕促无人船领域产学研