图加科技首席技术顾问:人工智能究竟会带来什么

加速会  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
图加科技首席技术顾问:人工智能究竟会带来什么
本文内容来自中国首届“时尚 科技营销创新年会”,作者王延青,图加科技的董事兼首席技术顾问。

正文:

我今天讲的角度有点大,我主要是从我的体会、以及科研、创业过程中发生的一些事情和思路。现在 人工智能 是比较热的,大家讲座、论坛很多,再加上微信,大家都很忙,有的时候我们一直在奔跑,忘了我们跑的方向,更重要的是有时候忘了我们为什么要跑。所以我这时候讲的东西都是我们比较有体会的,同时有一点比较从源头去讲。

我主要讲三个题目,还是很具体的, 人工智能 究竟改变了什么?一是人类的基本需求,二是 人工智能 的突破,三是现代媒体的变革。

一、人类的基本需求

左边这位我给年轻人看,他们不认识,这是乔布斯年轻的时候,中间这位是比尔盖茨。先讲一个故事,乔布斯在83年的时候,他亲自说的,我溜进了人机互动实验室看到了互动界面、互联网、面向对象的计算,他说这个界面光芒四射,把他的眼睛都照瞎了。他回去以后就成功了。

第二位是比尔盖茨,大家都说他是企业家,不是创新者,95Window非常成功,所以他写了一本书《信息高速公路》。

第三位大家都不认识,第三位叫Stuart  Card,我查了一下百度,没有中文名字翻译。前两位是佩服的人,我最后一位是我崇拜的人,Stuart  Card是当年人机互动实验室的主任,你每次用鼠标的时候都要感谢他。因此当这两个公司打架的时候,苹果告微软说他偷他的图形界面的时候,最后苹果没有赢的原因,因为他是从Stuart 那边偷的。因此这位是先知先觉的,他是斯坦福大学认知心理学的教授。

我当学生的时候,比较有幸的是他是我的老师,我曾经是他的学生。他写了一本书《人机互动心理学》,应该是人机互动领域的圣经,如果没读过这本书不算是专业人员。他有一个非常特殊的东西,他可以根据研究人的心理需求、文化需求,根据不同的发展阶段,叫以人为本的设计,所有的产品都是为人服务的,但是你要知道人需要什么,他第一建立理论,指出你的途径,15年、20年以后,你就刚好走到那个地方,这是非常厉害的,已经验证两次了。乔布斯还有比尔盖茨,他都稍微有点看不起,这是我在博士答辩的时候正式的,他说乔布斯偷了我的主意,从来没有当面感谢我。

当时叫信息高速公路,他也是看不上的,他说信息高速公路每个人都可以建,信息爆炸要解决的并不是进高速公路,你要建一条羊肠小道,怎么样把信息送到你家里去。

这里我要讲到的人类基本需求,就是进化。在我们进化的过程中,肌肉包括视力可能是下降的,但是很多人认为大脑是增加的,信息处理能力是大大增加了。但是如果说现在的人比一百年前的人更聪明,这是没有证据的,我们无法证明这件事情。比如说最简单的,这是9位数,你看一样,你是可以重复的,比如打电话、说8位数你是可以记忆的,短期记忆相当于计算机的内存,就是人处理数据信息的能力,非常有限,在心理学上叫7 2-2,聪明一点的可以记住9位数,差一点的可以记住5位数。这个电话号码让你去打,你肯定记不住的,这是多大的数呢?这就是1K。

但是给你看这张图,这是毛、这是狗,你知道这个数量有多大?2000兆,跟数字处理就不在一个量级上,恭喜你,已经可以进行大数据处理了,不要说人没有大数据处理能力,这如果是文字的话,是半个图书馆。

这里是什么问题呢?人在进化当中,实际人的大脑70%是处理图象的,跟人的生存有关系,你首先看到东西,跟说话没关系,你首先要看到,人的右脑在做这部分。左脑是数据和处理,教育主要是教育左脑的问题,我很反对人去学画,画基本不用学,但是数理逻辑要学,通过逻辑可以把7、8个数联系起来。

因此,就在人与机之间有一个关系,人的图象处理能力很强,但是在信息爆炸的年代,数字信息的处理能力跟过去相比没有长进,非常弱。但是计算机呢?大家知道计算机本来就是算数的,因此它的数字处理能力很强,但是在以前这两者之间交流是不顺畅的。

所以,第一个话题就得出一个结论,对于人来说,作为处理的最基本的需求,作为数字信息或者文字信息,这类信息需要最简短的信息,全世界的大事放在奥巴马的桌子上,三页纸搞定,你不能把多少文件和视频放在他那里,太多信息等于没信息。第二就是以图象来提供,因为人处理图象的能力非常强,基本就是这两条,你让机器适应人,而不是人适应机器,这就是基本需求,是刚需。

这就是我佩服Stuart  Card在1997年提出的理论,刚好是比尔盖茨发表《信息高速公路》那本书的时候,我在吃饭的时候问他是什么看法?他说得很不客气,说基本是胡说八道。在这种情况下,形成了一个所谓的生态系统,因为疯狂增长,遵守丛林法,这个理论是基于70年代动物觅食的理论,比如狮子要吃鹿,都是花费最少的能量,找到最适合他吃的鹿,不是最壮或者最漂亮的那个,这是觅食理论。把这个理论应用到信息上,基本上接近于兔子只吃窝边草。

Stuart  Card当时提出来,为了解决人的信息处理能力,有三个渠道:第一是结晶化,现在说就是大数据,现在已经过去20年了,所以他很厉害。第二是个性化,只吃窝边草,是减少信息的过程,比如今日头条。第三就是视觉化,就是图象,因为那是人的能力特别强的。

二、人工智能的突破:瓶颈

人工智能每20年活跃一次,在这以前人工智能有一个很大的弱点,是仓储式,你放东西少一个地方,数据越大、越复杂,就死机了,只能等着计算能力增加,所以那是有限的,隔段时间就遇到瓶颈。

人工智能的突破:神经网络,这是一帮教授,相当一部分教授是加拿大的,研究出来神经网络,以前也有,但是以前的问题也是越算越大,现在神经网络的特点,相当于人学语言,你学了第一种语言外语很难,但是你学了10种外语,再学11种的时候,就容易了,并不是语言越多越难,反而变得容易了,这是一个非常革命性的变化,这个东西和数据的量正好成反比,以前数据的量越大越慢,这是一个很颠覆性的东西,大家不在这个领域是不知道的。

因为有了这个以后,我们找到机器成长是怎么成长的,人工智能在国内大部分叫机器智能、机器学习,可以像人一样进化,你要看过科幻电影,机器人一定是完美的,并且是成人,因为当时的情况设计他什么样就是什么样,自我学习功能不强,我们现在不需要,你不用从成人阶段开始设计,可以从孩子时期开始设计,让他自己长。比如现在大家都在吹自动驾驶,有一个小伙子说我这个自动驾驶什么也没有,就定一些规则,你就开吧,他一年以后就学会一样,从你家开到工作场地,其他的他不知道,这是利用机器自身的学习自己净化,而不是事先设定好的。因此,这是一个很革命性的变化,这是人工智能这一块。

在人工智能突破里面,从应用的角度,真正接近应用并且能够产生大面积的影响,是在图像这一块,很多新词搞得你不知道是什么,比如自动驾驶,最重要的是视觉,你把视觉做好了,放在谁的车上都可以,这是没关系的。

比如说机器人,机器人是眼手之间的配合,非常重要,其实他并不是那么至关重要的一件事,比如无人机,无人机追求的是躲障碍和追踪人。

三、现代媒体的变革:媒体时代

由于媒体本身从消费端也是有所转化的,这几个总统有什么共性?他们都是当时媒体的赢家,罗斯福当时是坐轮椅的,但是他是收音机之王。这位当时的对手是尼克松,当时的媒体是电视,颜值上一下子就把对方干倒了。这位是互联网的赢家。特朗普我们都知道了,他是第一个用社交媒体进行宣传的,社交媒体的运行出神入化,很多东西跟我们烧钱、挣眼球的做法很接近。前面大部分一年半的时间都在抓眼球、搞话题,其实后来做了一个反顾,CNN是反对他的,做了一个评估,说我们基本都上当了,我们用90%的时间在谈论他,但是他就像微信一样,最后要收官了,最后两个星期一句废话没有,全谈他的施政。因此他刚开始的竞选活动就当做一个媒体活动来做。

现在是泛媒体时代,许多东西跟媒体不相关,实际有很本质的相关。下面这个例子,比如手机,最早像摩托罗拉,大哥大、通讯工具。然后诺基亚过来了,是人换手机最频的时候,定义为时尚。但是最终苹果出来以后,它定义的是媒体,产品的基本定位是非常重要的,比如说这个房子,许多人认为它和媒体没有关系,但是这个公司一年半的时候快倒闭了,没人找他做,后来他发现大家租房子看的是照片,因此他在一年半的时候快倒闭了,雇了20个摄影师,拍摄影师免费到你家照相,因此就成功了。

因此我不是搞服装的,但是我稍微引申一下,服装最早是保暖的工具,现在是时尚,时髦、同时也有自己的个性。但是我觉得许多人穿衣服一定程度上是一个媒体,因为你是要传达的,尽管你说我自己看着好看,但是实际是一个媒体。这方面许多东西似乎和媒体没有关系,实际关系很大,比如苹果应该是第一把产品发布会当做一个媒体来做的,最早的时候,操纵媒体的天才是希特勒的宣传部长,他把美女放在坦克拍了一张照片。因此很多东西是有媒体因素的,但是大家并不是这种一步到位,比如说我们在网购,实际大家买的是衣服吗?买的实际是照片,然后才是衣服。买完衣服以后,像我们许多人到健身房,你就照一张照片回来了,然后用媒体发布出去。

有一位全世界收入第四的女演员,时代周刊报的,这里面就体现一个东西叫媒体价值。媒体价值是什么意思呢?媒体主要是传播,我们现在的产品用马克思的理论就是使用价值和交换价值,事实上这两个价值是不够的,一定会有一个媒体价值,这位实际是媒体价值超出了她的直接价值。但是我们不能单凭这件事情,说这是一个演出什么的,因为你要是做商务或者股票,你炒作,涨了就是涨了,后面没有什么道德约束,这是不需要的。

现在包括你看微信朋友圈,四年前我们公司差不多40%左右,现在是60%左右,这个数非常有意思,非常接近人脑图象和文字力之间的比例,你们也看了我今天的演示,也是这样,一张大图加一个标题当,你要算一下比例,图差不多占70—80%,文字占10—20%,我相信最终会达到匹配。

现代媒体的变革:图 短平快。互联网媒体,这是按照时间顺序出来的独角兽,这里面有两个特点,第一是信息变得越来越短,第一个邮件很长,现在推特什么也没干,短就完了。发微信还是发什么数字都太短,可以直接才能照片。第二个特点,图象的比例越来越大,这个是纯图象,这但是这些都是独角兽公司,最牛的是后面这个公司,给了25亿美元没卖,现在上市了,40几亿。

我们图加也是在这个领域的,这个题目是巧合了,图 短平快,就是这个意思。

计算机视觉 视觉应用。在人工智能这块,真正的突破点是视觉这一点,而视觉在媒体里面有两方面的变化,一个是技术方面最大突破是视觉。另一方面媒体里面,已经逐渐转成了视觉应用,这两者现在刚好是碰撞的时候,因此会有很多的机会在里面。

应用案例:花颜色周期,这个是结合人工智能和互联网,这是通过互媒体的照片,我们可以搜到女孩穿的各种各样的衣服,然后按照月份进行统计,这个东西实际是有周期的,到一定的时候是有周期的,可能对营销,比如什么时候什么颜色的到你店里可能是有所帮助的,这种东西以前没有人工智能是做不出来的。

淡雅颜色周期,这个也是有周期的。

霓彩颜色周期,这算是一个比较有意思的案例了。

我们公司实际上现在假如想做的话,说街上流行红裙子,你怎么知道?我们是可以知道的,我们输入社交媒体的照片,把这件事情就完成了。

这是我们新近做的一个应用,利用视觉智能收养流浪狗,国外有很多流浪狗收养所,但是很多人家里面或者他的狗去世了,他要找一个一样的狗,或者有的就是喜欢邻居的狗,他拍一张照片就可以把这个狗找出来。

这里面有一个小食品的东西,注意一下。这是很先进的技术,我们这个APP可以把相机打开,对着活的狗,他就告诉你狗是什么品种的,这个可以用在衣服上,是一样的。

所以,我们不做人脸识别,我们做狗脸识别,这是很有意思的。

从大的角度来讲,人工智能是改变了人和机器以及环境之间的某种关系,比如以前人这方面图象能力强,数字能力不强,机器是数字能力强,图象不行。现在如果通过人工智能把人这部分补下去,第一次人和机器之间有某种平衡关系,我们叫智能互动,这也是一个趋势。具体这个领域往哪里走,大家有很多的讨论,应当是一个挺大的改变。

下面我讲一下我们的技术改变,第一在人工智能这一块,特别是视觉这一块,最大的一个东西叫深度学习,主要的领军在加拿大的一帮教授,Google花了60万美金买了一个,听说百度花了一千万从Google买了一个,我们做的比较早,和政府申请项目,在这些大佬当中也有一个和我们合作,我们在源头上跟他们是一样的。第二我们很专注,我们有各种各样的用户,但是我们只专注一张照片,然后我们研究照片之间的关系,这是社交的图谱,于是我们试图建立以图片连接世界。第一步你要知道图里是什么,有什么意义,这是我们不能专注干的一件事情。

当然,你技术不一定是最好的。大家如果有兴趣,我们这里因为产权等各方面的商业秘密,在公开场合不能讲一些东西,我们还有一些比较好玩的,如果大家感兴趣,我们后面再继续交流。

谢谢大家!

   



本文被转载1次

首发媒体 加速会 | 转发媒体

随意打赏

人工智能未来科技人工智能技术应用首席战略顾问首席技术顾问首席法律顾问首席顾问
提交建议
微信扫一扫,分享给好友吧。