图加科技首席技术顾问：人工智能究竟会带来什么

加速会 • 8年前扫码分享

本文内容来自中国首届“时尚科技营销创新年会”，作者王延青，图加科技的董事兼首席技术顾问。

正文：

我今天讲的角度有点大，我主要是从我的体会、以及科研、创业过程中发生的一些事情和思路。现在人工智能是比较热的，大家讲座、论坛很多，再加上微信，大家都很忙，有的时候我们一直在奔跑，忘了我们跑的方向，更重要的是有时候忘了我们为什么要跑。所以我这时候讲的东西都是我们比较有体会的，同时有一点比较从源头去讲。

我主要讲三个题目，还是很具体的，人工智能究竟改变了什么？一是人类的基本需求，二是人工智能的突破，三是现代媒体的变革。

一、人类的基本需求

左边这位我给年轻人看，他们不认识，这是乔布斯年轻的时候，中间这位是比尔盖茨。先讲一个故事，乔布斯在83年的时候，他亲自说的，我溜进了人机互动实验室看到了互动界面、互联网、面向对象的计算，他说这个界面光芒四射，把他的眼睛都照瞎了。他回去以后就成功了。

第二位是比尔盖茨，大家都说他是企业家，不是创新者，95Window非常成功，所以他写了一本书《信息高速公路》。

第三位大家都不认识，第三位叫Stuart Card，我查了一下百度，没有中文名字翻译。前两位是佩服的人，我最后一位是我崇拜的人，Stuart Card是当年人机互动实验室的主任，你每次用鼠标的时候都要感谢他。因此当这两个公司打架的时候，苹果告微软说他偷他的图形界面的时候，最后苹果没有赢的原因，因为他是从Stuart 那边偷的。因此这位是先知先觉的，他是斯坦福大学认知心理学的教授。

我当学生的时候，比较有幸的是他是我的老师，我曾经是他的学生。他写了一本书《人机互动心理学》，应该是人机互动领域的圣经，如果没读过这本书不算是专业人员。他有一个非常特殊的东西，他可以根据研究人的心理需求、文化需求，根据不同的发展阶段，叫以人为本的设计，所有的产品都是为人服务的，但是你要知道人需要什么，他第一建立理论，指出你的途径，15年、20年以后，你就刚好走到那个地方，这是非常厉害的，已经验证两次了。乔布斯还有比尔盖茨，他都稍微有点看不起，这是我在博士答辩的时候正式的，他说乔布斯偷了我的主意，从来没有当面感谢我。

当时叫信息高速公路，他也是看不上的，他说信息高速公路每个人都可以建，信息爆炸要解决的并不是进高速公路，你要建一条羊肠小道，怎么样把信息送到你家里去。

这里我要讲到的人类基本需求，就是进化。在我们进化的过程中，肌肉包括视力可能是下降的，但是很多人认为大脑是增加的，信息处理能力是大大增加了。但是如果说现在的人比一百年前的人更聪明，这是没有证据的，我们无法证明这件事情。比如说最简单的，这是9位数，你看一样，你是可以重复的，比如打电话、说8位数你是可以记忆的，短期记忆相当于计算机的内存，就是人处理数据信息的能力，非常有限，在心理学上叫7 2-2，聪明一点的可以记住9位数，差一点的可以记住5位数。这个电话号码让你去打，你肯定记不住的，这是多大的数呢？这就是1K。

但是给你看这张图，这是毛、这是狗，你知道这个数量有多大？2000兆，跟数字处理就不在一个量级上，恭喜你，已经可以进行大数据处理了，不要说人没有大数据处理能力，这如果是文字的话，是半个图书馆。

这里是什么问题呢？人在进化当中，实际人的大脑70%是处理图象的，跟人的生存有关系，你首先看到东西，跟说话没关系，你首先要看到，人的右脑在做这部分。左脑是数据和处理，教育主要是教育左脑的问题，我很反对人去学画，画基本不用学，但是数理逻辑要学，通过逻辑可以把7、8个数联系起来。

因此，就在人与机之间有一个关系，人的图象处理能力很强，但是在信息爆炸的年代，数字信息的处理能力跟过去相比没有长进，非常弱。但是计算机呢？大家知道计算机本来就是算数的，因此它的数字处理能力很强，但是在以前这两者之间交流是不顺畅的。

所以，第一个话题就得出一个结论，对于人来说，作为处理的最基本的需求，作为数字信息或者文字信息，这类信息需要最简短的信息，全世界的大事放在奥巴马的桌子上，三页纸搞定，你不能把多少文件和视频放在他那里，太多信息等于没信息。第二就是以图象来提供，因为人处理图象的能力非常强，基本就是这两条，你让机器适应人，而不是人适应机器，这就是基本需求，是刚需。

这就是我佩服Stuart Card在1997年提出的理论，刚好是比尔盖茨发表《信息高速公路》那本书的时候，我在吃饭的时候问他是什么看法？他说得很不客气，说基本是胡说八道。在这种情况下，形成了一个所谓的生态系统，因为疯狂增长，遵守丛林法，这个理论是基于70年代动物觅食的理论，比如狮子要吃鹿，都是花费最少的能量，找到最适合他吃的鹿，不是最壮或者最漂亮的那个，这是觅食理论。把这个理论应用到信息上，基本上接近于兔子只吃窝边草。

Stuart Card当时提出来，为了解决人的信息处理能力，有三个渠道：第一是结晶化，现在说就是大数据，现在已经过去20年了，所以他很厉害。第二是个性化，只吃窝边草，是减少信息的过程，比如今日头条。第三就是视觉化，就是图象，因为那是人的能力特别强的。

二、人工智能的突破：瓶颈

人工智能每20年活跃一次，在这以前人工智能有一个很大的弱点，是仓储式，你放东西少一个地方，数据越大、越复杂，就死机了，只能等着计算能力增加，所以那是有限的，隔段时间就遇到瓶颈。

人工智能的突破：神经网络，这是一帮教授，相当一部分教授是加拿大的，研究出来神经网络，以前也有，但是以前的问题也是越算越大，现在神经网络的特点，相当于人学语言，你学了第一种语言外语很难，但是你学了10种外语，再学11种的时候，就容易了，并不是语言越多越难，反而变得容易了，这是一个非常革命性的变化，这个东西和数据的量正好成反比，以前数据的量越大越慢，这是一个很颠覆性的东西，大家不在这个领域是不知道的。

因为有了这个以后，我们找到机器成长是怎么成长的，人工智能在国内大部分叫机器智能、机器学习，可以像人一样进化，你要看过科幻电影，机器人一定是完美的，并且是成人，因为当时的情况设计他什么样就是什么样，自我学习功能不强，我们现在不需要，你不用从成人阶段开始设计，可以从孩子时期开始设计，让他自己长。比如现在大家都在吹自动驾驶，有一个小伙子说我这个自动驾驶什么也没有，就定一些规则，你就开吧，他一年以后就学会一样，从你家开到工作场地，其他的他不知道，这是利用机器自身的学习自己净化，而不是事先设定好的。因此，这是一个很革命性的变化，这是人工智能这一块。

在人工智能突破里面，从应用的角度，真正接近应用并且能够产生大面积的影响，是在图像这一块，很多新词搞得你不知道是什么，比如自动驾驶，最重要的是视觉，你把视觉做好了，放在谁的车上都可以，这是没关系的。

比如说机器人，机器人是眼手之间的配合，非常重要，其实他并不是那么至关重要的一件事，比如无人机，无人机追求的是躲障碍和追踪人。

三、现代媒体的变革：媒体时代

由于媒体本身从消费端也是有所转化的，这几个总统有什么共性？他们都是当时媒体的赢家，罗斯福当时是坐轮椅的，但是他是收音机之王。这位当时的对手是尼克松，当时的媒体是电视，颜值上一下子就把对方干倒了。这位是互联网的赢家。特朗普我们都知道了，他是第一个用社交媒体进行宣传的，社交媒体的运行出神入化，很多东西跟我们烧钱、挣眼球的做法很接近。前面大部分一年半的时间都在抓眼球、搞话题，其实后来做了一个反顾，CNN是反对他的，做了一个评估，说我们基本都上当了，我们用90%的时间在谈论他，但是他就像微信一样，最后要收官了，最后两个星期一句废话没有，全谈他的施政。因此他刚开始的竞选活动就当做一个媒体活动来做。

现在是泛媒体时代，许多东西跟媒体不相关，实际有很本质的相关。下面这个例子，比如手机，最早像摩托罗拉，大哥大、通讯工具。然后诺基亚过来了，是人换手机最频的时候，定义为时尚。但是最终苹果出来以后，它定义的是媒体，产品的基本定位是非常重要的，比如说这个房子，许多人认为它和媒体没有关系，但是这个公司一年半的时候快倒闭了，没人找他做，后来他发现大家租房子看的是照片，因此他在一年半的时候快倒闭了，雇了20个摄影师，拍摄影师免费到你家照相，因此就成功了。

因此我不是搞服装的，但是我稍微引申一下，服装最早是保暖的工具，现在是时尚，时髦、同时也有自己的个性。但是我觉得许多人穿衣服一定程度上是一个媒体，因为你是要传达的，尽管你说我自己看着好看，但是实际是一个媒体。这方面许多东西似乎和媒体没有关系，实际关系很大，比如苹果应该是第一把产品发布会当做一个媒体来做的，最早的时候，操纵媒体的天才是希特勒的宣传部长，他把美女放在坦克拍了一张照片。因此很多东西是有媒体因素的，但是大家并不是这种一步到位，比如说我们在网购，实际大家买的是衣服吗？买的实际是照片，然后才是衣服。买完衣服以后，像我们许多人到健身房，你就照一张照片回来了，然后用媒体发布出去。

有一位全世界收入第四的女演员，时代周刊报的，这里面就体现一个东西叫媒体价值。媒体价值是什么意思呢？媒体主要是传播，我们现在的产品用马克思的理论就是使用价值和交换价值，事实上这两个价值是不够的，一定会有一个媒体价值，这位实际是媒体价值超出了她的直接价值。但是我们不能单凭这件事情，说这是一个演出什么的，因为你要是做商务或者股票，你炒作，涨了就是涨了，后面没有什么道德约束，这是不需要的。

现在包括你看微信朋友圈，四年前我们公司差不多40%左右，现在是60%左右，这个数非常有意思，非常接近人脑图象和文字力之间的比例，你们也看了我今天的演示，也是这样，一张大图加一个标题当，你要算一下比例，图差不多占70—80%，文字占10—20%，我相信最终会达到匹配。

现代媒体的变革：图短平快。互联网媒体，这是按照时间顺序出来的独角兽，这里面有两个特点，第一是信息变得越来越短，第一个邮件很长，现在推特什么也没干，短就完了。发微信还是发什么数字都太短，可以直接才能照片。第二个特点，图象的比例越来越大，这个是纯图象，这但是这些都是独角兽公司，最牛的是后面这个公司，给了25亿美元没卖，现在上市了，40几亿。

我们图加也是在这个领域的，这个题目是巧合了，图短平快，就是这个意思。

计算机视觉视觉应用。在人工智能这块，真正的突破点是视觉这一点，而视觉在媒体里面有两方面的变化，一个是技术方面最大突破是视觉。另一方面媒体里面，已经逐渐转成了视觉应用，这两者现在刚好是碰撞的时候，因此会有很多的机会在里面。

应用案例：花颜色周期，这个是结合人工智能和互联网，这是通过互媒体的照片，我们可以搜到女孩穿的各种各样的衣服，然后按照月份进行统计，这个东西实际是有周期的，到一定的时候是有周期的，可能对营销，比如什么时候什么颜色的到你店里可能是有所帮助的，这种东西以前没有人工智能是做不出来的。

淡雅颜色周期，这个也是有周期的。

霓彩颜色周期，这算是一个比较有意思的案例了。

我们公司实际上现在假如想做的话，说街上流行红裙子，你怎么知道？我们是可以知道的，我们输入社交媒体的照片，把这件事情就完成了。

这是我们新近做的一个应用，利用视觉智能收养流浪狗，国外有很多流浪狗收养所，但是很多人家里面或者他的狗去世了，他要找一个一样的狗，或者有的就是喜欢邻居的狗，他拍一张照片就可以把这个狗找出来。

这里面有一个小食品的东西，注意一下。这是很先进的技术，我们这个APP可以把相机打开，对着活的狗，他就告诉你狗是什么品种的，这个可以用在衣服上，是一样的。

所以，我们不做人脸识别，我们做狗脸识别，这是很有意思的。

从大的角度来讲，人工智能是改变了人和机器以及环境之间的某种关系，比如以前人这方面图象能力强，数字能力不强，机器是数字能力强，图象不行。现在如果通过人工智能把人这部分补下去，第一次人和机器之间有某种平衡关系，我们叫智能互动，这也是一个趋势。具体这个领域往哪里走，大家有很多的讨论，应当是一个挺大的改变。

下面我讲一下我们的技术改变，第一在人工智能这一块，特别是视觉这一块，最大的一个东西叫深度学习，主要的领军在加拿大的一帮教授，Google花了60万美金买了一个，听说百度花了一千万从Google买了一个，我们做的比较早，和政府申请项目，在这些大佬当中也有一个和我们合作，我们在源头上跟他们是一样的。第二我们很专注，我们有各种各样的用户，但是我们只专注一张照片，然后我们研究照片之间的关系，这是社交的图谱，于是我们试图建立以图片连接世界。第一步你要知道图里是什么，有什么意义，这是我们不能专注干的一件事情。

当然，你技术不一定是最好的。大家如果有兴趣，我们这里因为产权等各方面的商业秘密，在公开场合不能讲一些东西，我们还有一些比较好玩的，如果大家感兴趣，我们后面再继续交流。

谢谢大家！