IDG资本牛奎光:人工智能创业的机会和坑

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

没有武林秘籍存在,也没有传承衣钵一说。

但,他们总是不约而同在世界尚未觉察处,一掷千金,放手一搏。

这就是风投。

丙申年春,网易创业Club重磅推出“2016十问风投”系列,分别就十大热点方向,邀请国内顶级机构十位资深合伙人共同探索未来一年创投趋势:IDG、GGV、经纬中国、高榕资本、晨兴资本……童士豪、朱啸虎、高翔、邓峰、程宇……或许你会发现,原来消费升级时代已经彻底到来,共享经济 越发成为普遍存在,企业服务到处填补低效漏洞,VR使用场景尚待验证何处可行,AlphaGo之后的人工智能探索商业结合,文化娱乐产业遍地结果。原来你对事物更精彩的渴望,正有一群人在不分昼夜地打造它的模型。

风投,步步惊心,但让点石成金不再只是传奇神话;

创业,九死一生,但让摧枯拉朽改变世界成为可能。

Color the world,color your life.

网易创业Club“2016十问风投”第六期,推出IDG资本合伙人牛奎光专访,探讨人工智能领域投资逻辑。

IDG资本牛奎光:人工智能创业的机会和坑

文| 网易创业Club 王先

“2016十问风投”之IDG资本合伙人牛奎光 (来源:网易科技频道)

    精彩语录:

    1.语音识别领域,是大公司必争之地,大公司的技术积累会比创业公司好很多,创业型公司机会相对少一些;

    2.图像识别需要找到一些可以接受目前成本结构和服务方式的方向;

    3.在人工智能领域内投资和创业,需要考虑周期的问题。从创业公司角度说,必须找到一个很好的对应应用,从而使一开始推出时就有一个好的切入点;

    4.人工智能领域的创业者要求非常高:不仅要懂技术,还要懂应用,并且需要对成本、演进方式、节奏都有所把握。

    5. 机器到底能不能理解人的情感,这件事我没有答案。

    话题开始前,牛奎光讲了一个小故事。20世纪90年代末,初入清华计算机系不久的他,“象棋下得还不错”。有一天,班级里一个参加奥林匹克竞赛集训队的同学到寝室聊天,问:“关于象棋你是怎么思考的”,牛奎光随便聊了聊。一个星期后,这个同学编写出了一套象棋程序,牛奎光便下不过了这个程序。而此前,那个同学基本不会下象棋。

    也是在牛奎光入学清华的1997年,对战IBM“深蓝”的世界国际象棋冠军加里•卡斯帕罗夫以1胜2负3平成绩败北。

    相对而言,象棋招数变化相对有限,对计算机的搜索域要求相对简单。而围棋如果想把每一种可能性都计算出来,要复杂得多。

    所以直到不久前谷歌AlphaGo对弈韩国棋手李世石,并以4:1绝对优势胜出,舆论惊呼“人工智能时代来了”,媒体探讨“人工智能怎么样与商业结合”,语音识别和图像识别又到了什么阶段,公众对人工智能领域的创业者给予了更多的关注。

    听听清华大学计算机系97级的IDG合伙人牛奎光怎么说。

    牛奎光,IDG资本合伙人,专注于企业服务、安全、数据驱动的应用和人工智能方面的投资,是找钢网、纷享销客、同盾、商汤等的投资人

    (以下以牛奎光自述形式整合梳理其对人工智能方向的判断和投资逻辑。)

    人工智能和商业结合的时代正在到来

    “人机大战”使大家对人工智能有更广泛的认识,但对于创业者来讲,他还要想到人工智能怎么跟商业结合,怎样应用到一些场景中去。目前来看,大多是从接收信息和给出信息的角度进行考虑布局――这是人最常见的两个活动。

    人对外输出信息最主要靠“说”,这是他表达自己的最快方式。而接收信息最快的方式是用眼睛“看”。人工智能最初就是在这两个地方开始得到很好的应用。

    从我的角度来看,主要是两件事促进了人工智能的发展进程:一是互联网的出现使数据变得越来越多,并且积累很多在网上。二是后来的机器学习跟之前的方法相比,有很大的进步,设计算法其实是让计算机处理信息的组织从生物学上向人脑信息处理方式学习。也就是我们人脑目前可以说是计算效率最高的一种方式――吃几片馒头就可以工作了,能量消耗也很少。这就使一些简单智能的工作慢慢地可以由计算机去完成,这是这次所谓的人工智能热之后的一个背景,它的意义也是蛮大的。

    1,语音识别:大公司必争之地

    人工智能取得进展的第一个领域是语音识别。

    语音输出之后,怎么更好地被计算机所去理解,自然也就变成了人工智能过程中的第一个比较重要的事。这就是语音识别。

    而反向问题,得到一段字后,如何将它转化为语音,这是一个相对比较简单的事情,需要解决的只是读的过程中哪个字和哪个字连结得紧一点,或者稍稍带点感情。这里包含两个问题,一是如何把语音变成某个字或某个音,二是自然语言理解的问题,这个比较复杂。比如两个人如果有过很长时间打交道的经验,那么在交流时,其实有些话不用讲出来便可以互相理解,但这些话在没有语义的情况下,甚至第三方都很难理解,更不用说机器了。

    但这个事情本质上还是一维问题,就是从声音到文字,所以也相对较容易为人工智能技术解决。去年机器学习的发展使整个语音识别有了较大飞跃。

    之前整个语音识别技术还没有到特别实用的阶段,但是今天在一些垂直领域,比如有些导航地图,因为POI(Point of Interest,信息点)可能就是那么几十万个,所以容易基于某地理位置加上之前提高了准确率的模型,再来识别,准确率就会大大提高。

    包括有些购物网站,因为它的SKU(Stock Keeping Unit,库存量单位)数尽管多,但也相对有限,所以通过语音搜索的准确率也容易大大提高。

    这些都相当于在之前技术进步的基础上,加上行业应用,到目前已经达到了民用级的阶段,我相信可能在不久的将来,在这个领域可能也会有一个比较好的突破。

    在语音识别领域,很可能大公司的技术积累,会比创业公司好很多,所以可以说给创业型公司留的机会相对来讲要少一些。但还是能举出例子来,像科大讯飞就是做语音做起来的,也做得非常好,又比如云知声,一直做语音服务,做得也还可以。就看时间会给它们留多少来跟巨头竞争。

    语音的通用问题有可能还是大公司解决得比较好,创业公司相对比较难,但它可以在一些具体领域实现突破,比如在一些具体行业里,有一些行业专属库,涉及特珠的词或特珠的交流方式。但在通用型应用上基本是大公司的事情。

    现在我们输入还是需要键盘,说明这个问题还没有很好地解决。什么时候我们输入不用键盘了,直接用语音来输入,这个时候才说明到实用程度了。但是现在技术才刚刚开始,找到具体的应用点非常重要。如果能把这件事情做到足够成熟和产品化,是件巨大的事情。因为这相当于掌握了输入入口,这也是大公司必争之地。

    2,图像识别:找到接受目前成本结构和服务方式的方向

    人工智能取得进展的第二个领域是图像识别。

    图象基本上是人接收消息最快的方式,在微信里听语音可能要15秒,但是看字的话,有可能扫一眼就差不多了,因为它是二维的,你甚至可以说是有纵轴、横轴,甚至还有深度信息,其实它的信息获取效率是非常直观且非常快的。

    当时关注到图像识别,很大程度上也是因为当时香港中文大学汤晓鸥教授一篇论文,说在他们限定的测试结果集上,计算机对人脸的识别已经开始超过了人眼,这件事说明在某些特定的领域,机器识别已经开始可以跟人相媲美了。

    我们现在看到图像识别在一些To B应用上会相对多一些,比如监控,包括在一些人跟证件照的比对上。但同时我们也发现,有很多To C的应用出来。

    比如脸萌推出的Faceu,它的技术是由商汤集团提供的。也就是说机器在识别人脸之后,未必做的都是很严肃的事情,还可以做一些好玩的,比如画画眉毛涂涂腮红。这样我们看到其实现在很多娱乐领域里,人脸识别也得到了应用。又比如现在有云相册,可以按照人的归类使照片按人分享变得更容易:大家出去游玩拍照片,云相册可以自动识别人脸在后台将所有照片做好分类,只有点击一下,便可以直接按照人脸分别分享出去。

    可以看到这些更偏娱乐化或实用化的To C方向应用,也是很好的方向。未来可能还会有更多更好的跟技术相关驱动的应用出现。

    关于图像识别我目前有两个判断:一是产品上已经开始接近成熟,二是它刚刚迈到走向成熟的这个坎。换句话说,在一些算法、效率,以及降低成本方面,还有一些改进空间。而且关于深度学习,其实从出现到现在,从学术研究上也有不少值得研究和突破的地方,而且改进的空间可能还挺大。

    另外,图像识别还是需要找到一些可以接受目前成本结构和服务方式的方向。比如在监控方面的应用,尤其是人员流量大的地方,像比利时爆炸案,跟公共安全相关的地方有很强的需求。

    最后就是我们身边的智能设备,具有一些简单计算的能力,比如在拍摄时自动识别关键位置和关键的人,或着做人脸追踪,自动调整角度。这些都是很好的应用,如果能从这些角度展开,商业机遇也不小。

    现在,人工智能和商业结合的应用都这样一个一个来了。

    3,其他

    在语音识别和图像识别之外,还有一个方向我特别看好,而且我觉得很激动的事,就是什么时候人工智能能够给每个人都配一个秘书。

    从指使人的角度讲,这是人的天性。我们可能很早就听说三岁小孩子会打酱油,为什么他会打酱油?因为有人指示他去。这是每个人多多少少都有的能力。

    之前有一部电影讲的便是一个人工智能机器人做着相当于秘书的事情,后来这个男主角便爱上了虚拟的人。

    我觉得如果能给每个人都配备一个类似秘书的服务,使它能记住每个人的偏好、兴趣点,那么可能会使人的生活便利程度大大增加。而且这是和每个人都有关系的事情。

    人工智能的创业要找到好切入点

    现在是投资人工智能很好的时机吗?

    对投资或者创业者来讲,在人工智能领域内投资和创业,需要考虑周期的问题。要问,到底是所做的事情,是什么时候可以实现。

    从创业公司角度说,必须找到一个很好的对应应用,从而使一开始推出的时候就有一个好的切入点,只有这样才能形成正向循环,从而使得这个公司或是组织得以继续在人工智能角度往下发展。

    人工智能的物理表现形式不太重要,主要还是对事情的理解。在速度上,计算机的进步和机械方面的进步差别太大了。我们现在很多事情可能跟10年前、20年前机械的进步没有本质性区别,但是我们的计算能力(比如学人脑怎么思考)和处理信息方法有了巨大的进步。所以我觉得人工智能在软性方面可能进步的速度会更快一些。

    计算机从能耗和信息处理的速度上来讲,跟人比起来还是效率不够高。当这个效率足够高的时候,可能很多原来的生物学的组织形式就要发生变化了。

    具体来说,有这样几个方向的人工智能应用我还是非常看好的:

    一是通用型的,如果像咱们这样说话,它能够识别出文字来,它基本就算解决了键盘的问题,这是一类通用的应用,一种基础性的应用。

    二是情感的支持和获得。其实人对外感情的沟通,很大程度上都靠语音和图像。人工智能在对人的感情的理解上,相当于做一种陪伴,这也是一个应用的方向。

    三是正如我们刚刚谈到了一些To B或To C的应用方向,目前还是声音、图象识别为主。我觉得接下来在自动驾驶,甚至医生看病方面,也会有相当一部分重复性工作由机器来完成。

    甚至现在有激进的说法是,多少年之后,人类驾驶有可能就是违法的;也有人说,多少年以后,医生看病可能是违法的。我觉得这些说法比较激进,但是它可能也是代表了一个应用产生的方向。

    终极的事应该是机器到底能不能理解人的情感,这件事我没有答案。

    我觉得正像《奇点临近》里面讲的,人类技术是在以指数级别上升,只不过人的生命周期比较短暂,所以在过程里面,是近似线性发展。

    人工智能会取代人类吗?

    很多会问,人工智能真的将彻底取代人类工作吗?

    我觉得这挺正常,而且这事应该是可以发生。

    首先,开个玩笑说,共产主义包括劳动是人的一种权利。而我们现在的社会远远没有到达劳动是权利的阶段。如果说,当大部分的工作可以由智能机器去完成,那个时候有可能劳动真的就变成了是一种权利。

    另外,我觉得人是一直和外部环境一起进化和共生的过程,如果人可以把把一些重复性的或低级要求的工作逐渐地由机器替代的时候,其实会有更多时间去做一些更具有创造性或交流性的工作。

    我当时看《奇点临近》的时候,觉得它有一个表达形式是对的:人的“进化”更多的是机体保持一种比较有效的生命形式,或者是物理形式,如果外面有更高效的形式出现的时候,可能会跟着这个技术一起去进化。

    看重人工智能领域创业者哪些要素

    人工智能领域的创业者,跟之前我们在中国见到的很多其他商业模式的创业者情况还是不太一样。

    主要在于这个领域创业者主要还是基于对人工智能目前发展阶段基础上,去找到能够接受这个技术的成本和演进方式的应用,这样的创业者才可能会更好地把自己公司慢慢地滚动式地发展起来。

    这可以分成两个方面看:一是需要创业者对人工智能技术的发展路径有较深了解,或对这件事情有很好的感知,这样才可能更好地带领公司。团队里是否有能把握好和技术路径发展相稳合节奏的人才非常重要,它是一个典型的由技术进步带来商业模式的应用,或是一种革新的创业形式。

    这就对创业者要求非常高了:不仅要懂技术,还要懂应用,并且需要对成本、演进方式、节奏都有所把握。

    比如谷歌,作为大公司,它有资本做一个AlphaGo跟人下棋,但是哪个创业者会花这么大的成本搞个机器人就是为了赢一下这个棋呢?所以对成本必须有一个很好的判断。

    我们比较看好的人工智能创业团队,最好这几个方面能力兼备:

    1,创业者具备比较强的技术的能力,或者有一个比较好的对技术发展节奏的把握能力。

    2,找到一个好的切入点,同时还得有一个好的商务能力,把这个切入点变成在当下阶段就可以实现的应用和收入,从而使公司能快速滚动起来。

    我相对来讲比较看好的是在软件领域有突破的,就是基于这个观察:实际上硬件的进步可能并不是特别快;在软件上的进步,比硬件的进步要快得多,无论是在计算速度还是在算法上。硬件类或者跟机械沾边的进展也有很多很好的公司,也会出现,但是我觉得通过软件的进步,给到创业者的机会可能会更多一些。

    还是那句话,大公司在这件事情上可能会有优势,但是这种优势并不是无限的。

    这和我们当时在看PC互联网时代时跟现在的一个重大区别:PC互联网时代,搜索的数据多是公开数据,所以像百度、谷歌这种公司从数据的可获得性来讲,具有压倒性的优势,这种事其实在移动互联网的时候,得到了某种程度的改善。

    技术驱动可能是IDG与其他VC机构有明显差别的地方,我们对于技术驱动型的事情特别特别的敏感。比如我们很早便开始关注云计算并且进行系统性投资,包括在安全方面、人工智能,都是技术驱动型的事。包括有专门的专家网络来帮我们做一些相关的尽职调查,所以还是比较了解这个行业里哪些公司相对来讲技术上是比较实的。

    当然我觉得看公司的时候,还是应该综合起来看,对人和团队也还是有一定的要求。

    如果说企业服务市场的成熟度是40%的话,人工智能的创业领域的程度度仅仅为20%,一切刚刚开始。

    学生时代时,我问过导师这样一句话:老师,什么样就算研究生毕业了?

    他说:第一,同行说的话你听得懂;第二,不同方向上你大概知道它的难点在什么地方。能做到这两点,基本上就可以毕业了。

    我认为我还是一个合格的毕业生。

    快问快答:

    Q:谈到人工智能,首先会想到哪三个关键词。

    A:闻声,识面,理解感情。

    Q:喜欢什么样的创业者。

    A:首先有很好的初心,出发点是为了解决一个非常现实的问题;其次是解决的这个问题市场空间足够大,换句话说,想解决的这个事是个大事;第三,非常接地气,今天所做的事是非常具体的,而且能够戳到市场的痛点;第四就是能聚人。

    Q:喜欢的一本书?

    A:《从0到1》。

    Q:经常面对的问题是什么?

    A:我觉得有一个挑战,人在坚持自己想法的时候,有可能会受到周围环境的困扰,很可能你的想法是对的,但是你在过程中其实是不知道的。所以我觉得坚持自己的想法这件事情,有时候会受到各种各样的压力和挑战。

    Q:渴望拥有的才华是什么?

    A:幽默。

    注:【独家视频合作:即刻视频】

    本文被转载1次

    首发媒体 网易科技 | 转发媒体

    随意打赏

    提交建议
    微信扫一扫,分享给好友吧。