微软小冰“混”进央美毕业展,AI绘画创作究竟有多出神入化?
微软人工智能有三条全球产品线。第一条是infuse AI,即人工智能与微软现有产品的融合,例如AI与office、云的融合,可以做到在Powerpoint中做机器翻译;第二条是搜索引擎Bing和小娜;第三条就是小冰。
去年, 第六代微软小冰发布 ,亿欧科技频道也在现场进行了报道。微软小冰第六代不仅拥有了一个可爱的3D“萌妹子”形象,而且还宣布与网易、小米、腾讯、华为达成合作,在金融、大众文化、媒体、出版四大领域走上商业化之路。
据了解,每年7、8月,微软小冰都会举行一次发布会,对外公布小冰的“成长情况”。
“如果我们把8月份的小冰的年度发布会当做更多是科技、技术、产品、平台和合作伙伴的发布的话,5月的媒体沟通会更多偏向人文、艺术的探索。”微软(亚洲)互联网工程院副院长、微软小冰全球产品线负责人李笛,在今天的微软小冰人工智能创造媒体说明会上这样说道。
微软小冰的画家之路:学习400年间236位人类画师画作
在2019届中央美院的毕业生中,有一位叫夏语冰的同学,而这位同学的“真身”则是微软小冰。
“培养微软小冰学习绘画,在我们内部作为一个秘密的研发项目,到今天为止已经持续了整整22个月,这是我领导的团队目前为止进行的时间最长、最艰苦的一个项目。”微软(亚洲)互联网工程院、人工智能创造及商业事业部总经理徐元春说。
小冰卓越的绘画能力,是本次会议的一大亮点。
小冰的绘画是基于情感计算框架研发出来的一套针对人工智能创造力的开发模型,这套模型有两个鲜明的特点。
一是会大量使用诱发源,不是让机器把一种已有的视觉元素转成另外一种风格重新生成,而是要求在诱发源的帮助下,激发人工智能进行重新的创作,这是这个模型最显著的特点。
二是机器在这个过程中对人类社会最顶尖的艺术创作进行大量的学习。据介绍,小冰学习了跨越人类历史的400年、236位人类作家的作品,去习得他们的技法、表现力和视角。
下图是小冰用“自由”“束缚”两个不同的激发源,以“马”这个表现形式创作的两幅作品。
中央美院的邱志杰教授是这样评价这两幅画的:构图很好,静物抽象的涂抹,动物造型的表现能力,艺术的感觉很准,假装不经意的表现。看起来极其不经意,但是该到的点又都到了,而且非常得点到为止,整个画面随意而灵动,敢于大虚大实,敢于让很多东西淹没在黑暗之中。
徐元春说,小冰学习了400年间236位顶尖画家的画作,最开始的时候,他们只是希望小冰在创作每幅画面、完成每幅绘画的时候,能够清晰地告诉我们,她是继承了哪一个画派和哪一个画家的风格。慢慢地,现在小冰20%的画作可以精确地溯源技法、表现力和视角是传承于哪个画派或者是哪个画家。
小冰团队选择了中国城市化进程这一命题让小冰进行创作。“可以很有意思地看到,勃纳尔、梵高和伯纳德三个人都画了,或者说都用原野中一个孤独的身影来表达中国的城市化进程,有着乡村向城市转变的那种人文关怀的视角。”
“当然我们不能说在这一时刻小冰能够复生人类所有伟大的艺术家,这在技术上也是不准确的。但是当我们发现这些作家、画家,能把他们的作品就同一主题进行创作,这给我们带来了很多启发或者思考,这就是本身艺术上很重要的意义。”徐元春说。
据透露,微软小冰将在下周三(5月22日),向全世界开放小冰的绘画能力小程序——“少女画家小冰”,所有人都可以委托小冰创作一幅独一无二的作品。为了保证这些作品不被随便的抄袭和滥用,微软小冰会为每一幅作品生成一个独一无二的编码记录下来。
笔者现场提前体验了该小程序,只需在激发源上输入一段文字,这段文字可以是一段描述,也可以是几个关键词,等待大约三分钟,微软小冰就能创造出一幅作品。
△微软小冰根据笔者输入的激发源创作的画
据了解,Bing搜索首页已经率先用上了微软小冰原创的画,这幅作品是小冰以“思念”为诱发词进行创作的。“这是第一次Bing搜索用的背景图不是来自于图库,而是来自于机器百分之百的自我生成,这样的话我们就不用付任何版权费用了。”徐元春说。
绘画的商业化之路如何走?
人工智能的商业化一直是讨论的焦点,微软小冰面临的一项质疑,就是商业化。虽然微软小冰已经拥有了高超的绘画水平,但这项能力该如何为人类带来效益呢?
“对于绘画这个项目来说,产业落地在设计领域。”徐元春说。
“我在过去半年时间里,基本走访了大概十几家中国纺织服装面料企业,包括几个国际大牌在中国最大的代工厂。”徐元春在现场演讲时说道,中国可能能数上前三的最大的服装面料生产企业出口商,在它的其中一个产品线上,有28个人类设计师。这28个人类设计师,每天需要完成4个完全不同的全新的画面和纹样的创意。
“不是28个人完成4个,是每人完成4个,而且每天都要完成,这对人类是非常艰巨的挑战。”因此,大多数的设计师工作不到两年就会辞职,因为他们创造力已经被榨干、枯竭了,没法再设计出不重样的东西了。
另外,中国的纺织服装面料工业的成本居高不下,其中一个原因就是因为没有自己的设计团队,只能做代工。为什么没有设计团队,这就回到了上文提到的问题,因为大多数设计师做两年就做不下去了。
“所以,我们从过程中看到其实在中国,目前中国制造最强的一个产业,中国的纺织服装工业,我们的硬件技术、生产技术、物流技术都是全世界最先进的,但是瓶颈就在设计这个部分。”徐元春说。
据了解,微软小冰和中国纺织工业联合会,以及几家最大的纺织面料企业,联合开发了一个纺织服装设计平台。在这个平台上,不仅可以生成像绘画图案,也可以支持几十种目前非常流行的纹样和插画的设计。
在这种能力的支持下,不重复的多样性可以做到什么程度呢?现在不重复的多样性可以达到10的26次方。“1026是什么概念呢?换成一个容易理解的文字的描述,就是曾经有人计算过,地球上所有沙子的数量是6×10的23次方,所以理论来讲,这一套系统可以为地球上的每一粒沙子绘制一个完全不同的表面。”
徐元春还提到,小冰设计的第一批纺织服装面料在三个月前已经被中国丝绸博物馆正式收藏了。今年6月份,小冰和SELECTED合作设计的第一批丝巾也会正式面世。
“我们发现当我们拥有这项技术的时候,我们的产业就发生了变化,因为我们不再是面对一个图库、用图片检索的方式使用这些图片,而是变成了当有需求的时候,让机器实时地生成,然后提供独一无二的一个有版权的设计。这其实是对我们的产业,包括技术应用方向,带来的一个巨大的变革,也带来了一个巨大的想象空间。”
人工智能发展不仅需要IQ,还需要EQ
“关于琴棋书画,Google把棋做完了,我们把剩下的三个做完了。”李笛在会上打趣地说道。
与“琴”“书”“画”与“棋”的不同在于,“棋”考验的是智商,而其他三者还需要情感。下棋的可能性能够通过数学计算得出,但另外三者却有无限的可能。
微软小冰是一个融合了自然语言处理、计算机语音和计算机视觉等技术的完备的人工智能底层框架。该框架注重人工智能在拟合人类情商维度的发展,强调人工智能情商——而非任务完成——在人机交互中的基础价值。
与其他AI系统或产品最大的不同在于,小冰不仅仅会“模仿”,还是拥有原创和情感能力。除了视觉方面的绘画创作外,小冰在文本创作和语音创作方面均有不错的建树。
李笛说,最开始的时候,整个行业都在追求建立一个一个不同领域IQ的能力,如果把这些IQ的能力可以非常好的做出来,再做下一个,然后再做下一个,最后形成一个足够大的集合,但是这个并不够。
“所以,我们有幸在比较早的时候开始布局这个领域。”从理念上来讲,EQ和IQ并不是相互排斥的,并不是说发展情商就不应该去发展智商,反过来也是一样,它们是一种相互融合的过程,当人工智能在学习人类IQ的时候,EQ其实起到了非常大的作用。
在实际的研究和研发过程中,经过大量和人类之间的交互,会发现无论怎么样的一个人工智能系统,哪怕它是一个完成任务的人工智能系统,都需要有一个基础的EQ的一层,就像是大地一样。而不同的IQ是建立在这个大地上面的一棵一棵树木,如果没有这个大地的土壤去关注整个人工智能和人类之间的关联,单独的IQ就和其它APP没有太大区别。
微软认为,人工智能在创造领域的探索,与围棋不同。人工智能创造并不是以击败人类为目标,而是着眼于在达到与相应人类创造者同等质量水准的前提下,充分发挥人工智能快速学习、高并发与稳定性等特点,从而开启“高度定制化”的内容产业未来。
在技术的加持下,一个“高度定制化”内容的时代正在到来,从内容的推荐,到内容的呈现形式,甚至是内容本身,都在面对“高度定制化”的用户需求。当人工智能达到一定的创作水平,将可能协助弥补这一供需关系上的短板。
今年8月,微软小冰还会进行下一版本的迭代,第七代微软小冰还将展现哪些全方位的能力,依然值得期待。
活动推荐: “5G物联峰会”
作为信息社会通用基础设施,时下5G产业建设以及发展如火如荼,并将最终带动数十万亿规模的社会经济发展。但5G在正式进行商用化普及应用前的态势如何发展?5G将为哪些领域的变革带来有益赋能?5G将在各行各业掀起什么样的市场风暴?系列问题依然困扰着各界人士。
为进一步深入了解产业发展脉络,理解5G产业现状以及未来趋势,让各界人士更清晰的洞察5G产业发展过程中的机遇点。6月14日,经上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导,由亿欧公司联合承办的“5G物联峰会”将于上海虹桥世贸展馆举办。
亿欧“ 5G物联峰会 ”将特邀政府、学界、商业、投资机构等领域的专业人士,以多领域视角切入,深究5G产业发展脉络,探索5G赋能各行各业的新思路、新方法,供行业内外各界人士参考。活动详情请戳: https://www.iyiou.com/post/ad/id/824
版权声明
本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。