图加科技首席技术顾问:人工智能究竟会带来什么
正文:
我今天讲的角度有点大,我主要是从我的体会、以及科研、创业过程中发生的一些事情和思路。现在 人工智能 是比较热的,大家讲座、论坛很多,再加上微信,大家都很忙,有的时候我们一直在奔跑,忘了我们跑的方向,更重要的是有时候忘了我们为什么要跑。所以我这时候讲的东西都是我们比较有体会的,同时有一点比较从源头去讲。
我主要讲三个题目,还是很具体的, 人工智能 究竟改变了什么?一是人类的基本需求,二是 人工智能 的突破,三是现代媒体的变革。
一、人类的基本需求
左边这位我给年轻人看,他们不认识,这是乔布斯年轻的时候,中间这位是比尔盖茨。先讲一个故事,乔布斯在83年的时候,他亲自说的,我溜进了人机互动实验室看到了互动界面、互联网、面向对象的计算,他说这个界面光芒四射,把他的眼睛都照瞎了。他回去以后就成功了。
第二位是比尔盖茨,大家都说他是企业家,不是创新者,95Window非常成功,所以他写了一本书《信息高速公路》。
第三位大家都不认识,第三位叫Stuart Card,我查了一下百度,没有中文名字翻译。前两位是佩服的人,我最后一位是我崇拜的人,Stuart Card是当年人机互动实验室的主任,你每次用鼠标的时候都要感谢他。因此当这两个公司打架的时候,苹果告微软说他偷他的图形界面的时候,最后苹果没有赢的原因,因为他是从Stuart 那边偷的。因此这位是先知先觉的,他是斯坦福大学认知心理学的教授。
我当学生的时候,比较有幸的是他是我的老师,我曾经是他的学生。他写了一本书《人机互动心理学》,应该是人机互动领域的圣经,如果没读过这本书不算是专业人员。他有一个非常特殊的东西,他可以根据研究人的心理需求、文化需求,根据不同的发展阶段,叫以人为本的设计,所有的产品都是为人服务的,但是你要知道人需要什么,他第一建立理论,指出你的途径,15年、20年以后,你就刚好走到那个地方,这是非常厉害的,已经验证两次了。乔布斯还有比尔盖茨,他都稍微有点看不起,这是我在博士答辩的时候正式的,他说乔布斯偷了我的主意,从来没有当面感谢我。
当时叫信息高速公路,他也是看不上的,他说信息高速公路每个人都可以建,信息爆炸要解决的并不是进高速公路,你要建一条羊肠小道,怎么样把信息送到你家里去。
这里我要讲到的人类基本需求,就是进化。在我们进化的过程中,肌肉包括视力可能是下降的,但是很多人认为大脑是增加的,信息处理能力是大大增加了。但是如果说现在的人比一百年前的人更聪明,这是没有证据的,我们无法证明这件事情。比如说最简单的,这是9位数,你看一样,你是可以重复的,比如打电话、说8位数你是可以记忆的,短期记忆相当于计算机的内存,就是人处理数据信息的能力,非常有限,在心理学上叫7 2-2,聪明一点的可以记住9位数,差一点的可以记住5位数。这个电话号码让你去打,你肯定记不住的,这是多大的数呢?这就是1K。
但是给你看这张图,这是毛、这是狗,你知道这个数量有多大?2000兆,跟数字处理就不在一个量级上,恭喜你,已经可以进行大数据处理了,不要说人没有大数据处理能力,这如果是文字的话,是半个图书馆。
这里是什么问题呢?人在进化当中,实际人的大脑70%是处理图象的,跟人的生存有关系,你首先看到东西,跟说话没关系,你首先要看到,人的右脑在做这部分。左脑是数据和处理,教育主要是教育左脑的问题,我很反对人去学画,画基本不用学,但是数理逻辑要学,通过逻辑可以把7、8个数联系起来。
因此,就在人与机之间有一个关系,人的图象处理能力很强,但是在信息爆炸的年代,数字信息的处理能力跟过去相比没有长进,非常弱。但是计算机呢?大家知道计算机本来就是算数的,因此它的数字处理能力很强,但是在以前这两者之间交流是不顺畅的。
所以,第一个话题就得出一个结论,对于人来说,作为处理的最基本的需求,作为数字信息或者文字信息,这类信息需要最简短的信息,全世界的大事放在奥巴马的桌子上,三页纸搞定,你不能把多少文件和视频放在他那里,太多信息等于没信息。第二就是以图象来提供,因为人处理图象的能力非常强,基本就是这两条,你让机器适应人,而不是人适应机器,这就是基本需求,是刚需。
这就是我佩服Stuart Card在1997年提出的理论,刚好是比尔盖茨发表《信息高速公路》那本书的时候,我在吃饭的时候问他是什么看法?他说得很不客气,说基本是胡说八道。在这种情况下,形成了一个所谓的生态系统,因为疯狂增长,遵守丛林法,这个理论是基于70年代动物觅食的理论,比如狮子要吃鹿,都是花费最少的能量,找到最适合他吃的鹿,不是最壮或者最漂亮的那个,这是觅食理论。把这个理论应用到信息上,基本上接近于兔子只吃窝边草。
Stuart Card当时提出来,为了解决人的信息处理能力,有三个渠道:第一是结晶化,现在说就是大数据,现在已经过去20年了,所以他很厉害。第二是个性化,只吃窝边草,是减少信息的过程,比如今日头条。第三就是视觉化,就是图象,因为那是人的能力特别强的。
二、人工智能的突破:瓶颈
人工智能每20年活跃一次,在这以前人工智能有一个很大的弱点,是仓储式,你放东西少一个地方,数据越大、越复杂,就死机了,只能等着计算能力增加,所以那是有限的,隔段时间就遇到瓶颈。
人工智能的突破:神经网络,这是一帮教授,相当一部分教授是加拿大的,研究出来神经网络,以前也有,但是以前的问题也是越算越大,现在神经网络的特点,相当于人学语言,你学了第一种语言外语很难,但是你学了10种外语,再学11种的时候,就容易了,并不是语言越多越难,反而变得容易了,这是一个非常革命性的变化,这个东西和数据的量正好成反比,以前数据的量越大越慢,这是一个很颠覆性的东西,大家不在这个领域是不知道的。
因为有了这个以后,我们找到机器成长是怎么成长的,人工智能在国内大部分叫机器智能、机器学习,可以像人一样进化,你要看过科幻电影,机器人一定是完美的,并且是成人,因为当时的情况设计他什么样就是什么样,自我学习功能不强,我们现在不需要,你不用从成人阶段开始设计,可以从孩子时期开始设计,让他自己长。比如现在大家都在吹自动驾驶,有一个小伙子说我这个自动驾驶什么也没有,就定一些规则,你就开吧,他一年以后就学会一样,从你家开到工作场地,其他的他不知道,这是利用机器自身的学习自己净化,而不是事先设定好的。因此,这是一个很革命性的变化,这是人工智能这一块。
在人工智能突破里面,从应用的角度,真正接近应用并且能够产生大面积的影响,是在图像这一块,很多新词搞得你不知道是什么,比如自动驾驶,最重要的是视觉,你把视觉做好了,放在谁的车上都可以,这是没关系的。
比如说机器人,机器人是眼手之间的配合,非常重要,其实他并不是那么至关重要的一件事,比如无人机,无人机追求的是躲障碍和追踪人。
三、现代媒体的变革:媒体时代
由于媒体本身从消费端也是有所转化的,这几个总统有什么共性?他们都是当时媒体的赢家,罗斯福当时是坐轮椅的,但是他是收音机之王。这位当时的对手是尼克松,当时的媒体是电视,颜值上一下子就把对方干倒了。这位是互联网的赢家。特朗普我们都知道了,他是第一个用社交媒体进行宣传的,社交媒体的运行出神入化,很多东西跟我们烧钱、挣眼球的做法很接近。前面大部分一年半的时间都在抓眼球、搞话题,其实后来做了一个反顾,CNN是反对他的,做了一个评估,说我们基本都上当了,我们用90%的时间在谈论他,但是他就像微信一样,最后要收官了,最后两个星期一句废话没有,全谈他的施政。因此他刚开始的竞选活动就当做一个媒体活动来做。
现在是泛媒体时代,许多东西跟媒体不相关,实际有很本质的相关。下面这个例子,比如手机,最早像摩托罗拉,大哥大、通讯工具。然后诺基亚过来了,是人换手机最频的时候,定义为时尚。但是最终苹果出来以后,它定义的是媒体,产品的基本定位是非常重要的,比如说这个房子,许多人认为它和媒体没有关系,但是这个公司一年半的时候快倒闭了,没人找他做,后来他发现大家租房子看的是照片,因此他在一年半的时候快倒闭了,雇了20个摄影师,拍摄影师免费到你家照相,因此就成功了。
因此我不是搞服装的,但是我稍微引申一下,服装最早是保暖的工具,现在是时尚,时髦、同时也有自己的个性。但是我觉得许多人穿衣服一定程度上是一个媒体,因为你是要传达的,尽管你说我自己看着好看,但是实际是一个媒体。这方面许多东西似乎和媒体没有关系,实际关系很大,比如苹果应该是第一把产品发布会当做一个媒体来做的,最早的时候,操纵媒体的天才是希特勒的宣传部长,他把美女放在坦克拍了一张照片。因此很多东西是有媒体因素的,但是大家并不是这种一步到位,比如说我们在网购,实际大家买的是衣服吗?买的实际是照片,然后才是衣服。买完衣服以后,像我们许多人到健身房,你就照一张照片回来了,然后用媒体发布出去。
有一位全世界收入第四的女演员,时代周刊报的,这里面就体现一个东西叫媒体价值。媒体价值是什么意思呢?媒体主要是传播,我们现在的产品用马克思的理论就是使用价值和交换价值,事实上这两个价值是不够的,一定会有一个媒体价值,这位实际是媒体价值超出了她的直接价值。但是我们不能单凭这件事情,说这是一个演出什么的,因为你要是做商务或者股票,你炒作,涨了就是涨了,后面没有什么道德约束,这是不需要的。
现在包括你看微信朋友圈,四年前我们公司差不多40%左右,现在是60%左右,这个数非常有意思,非常接近人脑图象和文字力之间的比例,你们也看了我今天的演示,也是这样,一张大图加一个标题当,你要算一下比例,图差不多占70—80%,文字占10—20%,我相信最终会达到匹配。
现代媒体的变革:图 短平快。互联网媒体,这是按照时间顺序出来的独角兽,这里面有两个特点,第一是信息变得越来越短,第一个邮件很长,现在推特什么也没干,短就完了。发微信还是发什么数字都太短,可以直接才能照片。第二个特点,图象的比例越来越大,这个是纯图象,这但是这些都是独角兽公司,最牛的是后面这个公司,给了25亿美元没卖,现在上市了,40几亿。
我们图加也是在这个领域的,这个题目是巧合了,图 短平快,就是这个意思。
计算机视觉 视觉应用。在人工智能这块,真正的突破点是视觉这一点,而视觉在媒体里面有两方面的变化,一个是技术方面最大突破是视觉。另一方面媒体里面,已经逐渐转成了视觉应用,这两者现在刚好是碰撞的时候,因此会有很多的机会在里面。
应用案例:花颜色周期,这个是结合人工智能和互联网,这是通过互媒体的照片,我们可以搜到女孩穿的各种各样的衣服,然后按照月份进行统计,这个东西实际是有周期的,到一定的时候是有周期的,可能对营销,比如什么时候什么颜色的到你店里可能是有所帮助的,这种东西以前没有人工智能是做不出来的。
淡雅颜色周期,这个也是有周期的。
霓彩颜色周期,这算是一个比较有意思的案例了。
我们公司实际上现在假如想做的话,说街上流行红裙子,你怎么知道?我们是可以知道的,我们输入社交媒体的照片,把这件事情就完成了。
这是我们新近做的一个应用,利用视觉智能收养流浪狗,国外有很多流浪狗收养所,但是很多人家里面或者他的狗去世了,他要找一个一样的狗,或者有的就是喜欢邻居的狗,他拍一张照片就可以把这个狗找出来。
这里面有一个小食品的东西,注意一下。这是很先进的技术,我们这个APP可以把相机打开,对着活的狗,他就告诉你狗是什么品种的,这个可以用在衣服上,是一样的。
所以,我们不做人脸识别,我们做狗脸识别,这是很有意思的。
从大的角度来讲,人工智能是改变了人和机器以及环境之间的某种关系,比如以前人这方面图象能力强,数字能力不强,机器是数字能力强,图象不行。现在如果通过人工智能把人这部分补下去,第一次人和机器之间有某种平衡关系,我们叫智能互动,这也是一个趋势。具体这个领域往哪里走,大家有很多的讨论,应当是一个挺大的改变。
下面我讲一下我们的技术改变,第一在人工智能这一块,特别是视觉这一块,最大的一个东西叫深度学习,主要的领军在加拿大的一帮教授,Google花了60万美金买了一个,听说百度花了一千万从Google买了一个,我们做的比较早,和政府申请项目,在这些大佬当中也有一个和我们合作,我们在源头上跟他们是一样的。第二我们很专注,我们有各种各样的用户,但是我们只专注一张照片,然后我们研究照片之间的关系,这是社交的图谱,于是我们试图建立以图片连接世界。第一步你要知道图里是什么,有什么意义,这是我们不能专注干的一件事情。
当然,你技术不一定是最好的。大家如果有兴趣,我们这里因为产权等各方面的商业秘密,在公开场合不能讲一些东西,我们还有一些比较好玩的,如果大家感兴趣,我们后面再继续交流。
谢谢大家!