AI学会了制作表情包,但真的好笑吗?
现在没有几个看得过去的表情包,谁还好意思出来聊天?曾经的亚洲表情三大巨头:篮球巨星姚明、韩国演员崔成国、以及日本动漫声优花泽香菜的囧脸,你没用过也一定见过。
但你是不是以为只有人会做表情包?
难道还有什么外星人也学会了我们的表情包大法?外星人用不用表情包我们不知道,但是AI最近却利用深度学习做了一大堆表情包,想请各位看官观赏一下。下面有三张表情包,其中哪个是由人类制作的,哪个是由AI制作的,你能分辨得出来吗?(反正我是看不出来。)
这个表情包深度学习模型是由斯坦福大学的两个学生用超过40万个表情包训练得来。其基本的框架是一个编码器—解码器图说生成系统,需要先技能型CNN图像嵌入,然后再使用LSTM RNN进行文字生成。
从目前的反馈来看,AI表情包生成器表现良好。大多数人表示一时难以分辨人类制作与AI制作的表情包。但在仔细辨别之后,AI所生成的表情包当中大概会有30%被认为是人类的作品。另外,对于表情包的搞笑程度也有评分,人类制作的表情包搞笑程度一般为7分(满分为10分),而AI生成的表情包最高达到了6.8,这乍一看,可以说是很高的分数了。
但是AI真的有那么懂幽默吗?
在科幻电影《霹雳五号》当中曾有这样一段情节,颇有深意。一名逃跑的机器人有了意识,并跟众人说它自己是有生命的。而男主角最终测试它所言非虚的办法就是测试它听不听得懂笑话。在男主角讲完笑话几秒后,这个机器人突然发出了一连串的笑声。这时,男主角认为它真的具备了自我意识。实际上,现在评判机器是否具有意识的标准并不统一,但是的确有很多人把机器人有没有幽默感作为判断机器是否进化到具有人类思维的重要标准之一。
之前,李开复做客综艺节目时,曾发表观点称:人工智能会在很多领域替代人类工作,但在娱乐领域不会,因为人工智能不懂什么叫幽默。就这个AI表情包生成器而言,它距离懂幽默还有一段很长的距离。
首先,它还不会断句。在中英文当中,不同的断句方式会使句子的语义发生很大的改变。这里说一个关于断句的笑话,可以自行理解一下:“一男子扬言要整成都教授,成都教授纷纷搬家;草帽路飞说要当上海贼王,上海居民加紧防盗。”很明显,语义的改变还会影响一句话的幽默程度。
再则,幽默具有地域性,各国各地的幽默文化各不相同,而机器学习笑点的模型不具有迁移性。比如中式幽默的核心是在社会系统性的碾压面前,你我都是同路人。而英式幽默的核心是居高临下式的损人。
美国最著名的则是色情幽默,并且已经到了大色若空的地步,但在中国是不适合这样大尺度的色情幽默的。所以说,机器要生成一张配带文字说明的图片是简单的,但是要让其真正get到大众笑点却是困难的。
最后,我们知道新的表情包是层出不穷的。从三巨头到张学友、蔡依玲、尔康、可云、佟湘玉,人类开发表情包极具创造性,而AI则只会依葫芦画瓢。
AI能主动把韩国亲子节目当中的“宋民国”打造成现在的表情包大户吗?能从过去零几年播出的影视剧当中寻找最能引发共鸣的gif吗?能知道“假笑男孩”的假笑原来那么具有魔性吗?或许AI真的应该谦虚地说实话,而不是吹嘘自己现在搞笑的能力,否则就真的好笑了。
怎么成为比人类更合格的表情包制造好手?
AI的幽默品质还需慢慢进化,不过在进化的过程当中,这里有两点建议可以帮助AI做一个更加合格的表情包生产大户。
一是去掉训练内容中的糟粕。AI表情包生成器在训练当中同时汲取了数字文化的精华与糟粕。很多的训练数据都与咒骂、种族主义和性别歧视相关。在未来的训练过程当中应当过滤掉这些内容,同时这也是自然语言处理当中一个普遍存在的大问题。
因为对于机器学习系统而言,AI的学习过程就像是婴儿学习一样,透过观察与模仿所选择的系统行为类型。只要系统的当中某一部分是经由人为操作的行为,那么就可能因为人们观察事情的角度或者说所谓的偏见而影响到机器。这就像是“酒与污水定律”:一匙酒倒进一桶污水,得到的是一桶污水;把一匙污水倒进一桶酒里,得到的还是一桶污水。一个节点的缺失或者坏节点的进入就会毁灭整个体系。
二是增加网感。在中国,表情包的网感有很大一部分在于“模糊”的画质。有没有发现中国表情包有一个很大的特色那就是“模糊”。AI要成为表情包生产的专家就必须对表情包文化进行更深入的了解。
在互联网初期,表情包1.0时代,美国卡耐基·梅隆的一串ASCII字符是人类计算机历史上第一个“表情包”,在当时那个视觉效果就是非常模糊的。
另外,当下中国表情包的主体使用人群是80、90后,《武林外传》、《还珠格格》、《情深深雨蒙蒙》等影视剧都是属于这两代人的集体记忆,也是最能引发共鸣和传播效应的内容。而这些影视剧大多数都有10多年以上的历史,画质非常之糊。
还有从美术的角度来说,一个东西画的越实越明确表达的情绪就越理性,反之,越虚越模糊表达的情绪就越主观。模糊的表情包更有接近市井文化的通俗诙谐,也会给人更多的联想空间。模糊,是一个表情包在被无数人上传下载,压缩画质之后的证明,也是它在社交网络当中摸爬打滚的印记,这样的表情包使用起来,一看就很有网感。因此,可想而知,AI制造的表情包要想在中国通行,画质上还得做一点特殊处理。
目前,表情包早已不仅仅是个娱乐大众的工具,它也具备了更多的商业价值。“长草颜文字日常”的IP化为其开发者创造了巨大的利润,仅靠收版权费就能赚上不小的一笔数。很多广告主也有想用表情包提升自己品牌的知名度的想法,想想用表情包进行病毒式传播确实不失为一种绝妙的营销方式。小细节处有大商机,AI表情包生成器的开发真的是有趣又有金。(本文首发钛媒体,文 | 杨苏颖)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App