商汤科技联合创始人杨帆:人工智能公司从技术到商业化落地的5个关键环节
我个人经历很简单,清华毕业后去了微软。我从小的梦想就是成为一个科学家,其实不管以前的年代还是如今人工智能时代,科学家做出来的算法都很“理想”。
我不知道有多少人承担把科学家的算法变成产品的,就是你不产出算法,但要直接跟算法打交道。你打过交道就会知道,因为科学家们做事情时,往往会把问题理想化,会把问题抽象化。但是,要知道在真实世界中面临的问题,往往很难被抽象化,它的影响因素和干扰因素非常多,所以我一直负责将科学家的“理想”变成现实。
2014年,商汤科技创立。我以前更多想的是做产品,但今天想的是把AI变成一个产业,想用AI帮助公司,甚至帮助行业。所以在产品之外,还有很多要考虑的问题,一些是商业问题,还有一些其他方面的问题,最终决定技术是不是能给我们带来价值。
价值,是影响一个AI技术商业化方向的核心
有个数据来源于普华永道,预测到2030年,人工智能将为世界经济贡献15.7万亿美元,这相当于目前印度加中国的生产总值总和,而中国公司在其中将起到非常重要和关键的作用。
在今天的中国,我们整个AI技术的落地和应用发展非常快,大家都有共识:第一,我们数据产生能力特别强;第二,产业对新技术拥抱意识特别强。两者结合造就了我们在应用落地上跑得特别快,这是一个好的大方向。
在我们所认知的未来5-10年,比如对于一个城市如何优化它的运营管理,会由细的环节组成,包括遥感、安防、楼宇、商业等领域,都会纳入到城市管理中。商汤所涉及的行业也比较多,从互联网到手机、安防、汽车、娱乐等非常多,商汤科技已与超过700家国内外知名企业建立合作。
商汤科技是技术原创能力非常强的团队,这让我们一直引以为傲,今年,商汤和联合实验室在CVPR 2018上发了44篇论文,中国企业的论文总数量为100篇左右,上半年,商汤科技也接连完成了C轮和C+轮融资。
接下来问题就来了,这么多行业,技术能不能给这些行业带来价值?带来价值后我们能不能也收获价值?我们收获的价值是不是足够多?时间是不是够长?这些其实都会影响我们选择一个AI技术去商业化的方向。
5G技术走向成熟会激发更多视频类应用
AI有很多方面,包括计算机视觉、自然语言处理、人机交互等等。为什么视觉领域诞生了这么多大大小小的新公司?语音处理领域,可能就只是科大迅飞,而没有新的创业公司取得比较好的位置?从事自然语言理解或者机器学习分析的,可能也不多,原因是什么?
在这里,我分享一点我的认知,回过头来看一下AI或整个信息产业,什么是计算机学科?它是对信息采集、分析、存储、反馈的学科,互联网发展史基本围绕着这里面某一个环节的技术进步所带来的产业升级,催生一些新的公司,给我们创造价值。
前几年直播很火,现在应用类视频也很火。大家有没有想过为什么这两年才火?智能手机是一个原因,让我们的信息采集和制造能力比以往无比强大,今天的手机摄像头清晰度非常高,可以快速产出大量视频,任何人都可以低成本生产。另外,4G通讯网络,也可以另大家以非常低廉的成本,去传播信息。如此,这个行业获得了催生和成熟。
此外,还有一个维度,就是信息的载体形态。很早之前,计算机只能处理一些数字、文本、语音,后来可以流畅地处理图像、视频,我们今天所处的环境是一个多模态融合,各种信息融合在一起,同时技术进步伴随着不同信息载体形态的发展。在我看来,载体形态的发展挑战更大,视频相比语音、文本来说,是信噪比很大的信息形态。
举个例子,比如看一部2小时的高清电影,视频形态容量是10几个G,这还是压缩过的。但是把这个电影写成一部小说存在硬盘上,可能也就几十K。但是,不管是读小说还是看电影,你所获得的最关键90%信息是一样的。为什么?视频形态包含有大量冗余信息,这些信息可能没有很高价值,但当你需要时它又包含着更多细节,如果想对整个事物、整个事情有一个更深入和细致的了解,会发现这里有大量微小的信息,同时它的噪音也非常大,对于计算机而言它的提炼难度更高。所以,这就是为什么语音类技术、图像视频类技术比文本搜索技术更晚。
2014、2015年的时候,文本有科技巨头做了,这种情况下,创业公司基本不会有机会。但视频不一样,2014年之前可能没有什么公司真正拥有海量的视频,可能会有一些互联网上的视频,但如果把天然信息量考虑进来的话,相比今天的视频制造和搜集能力来看仍然是九牛一毛,而随着5G技术即将走向成熟,这会激发更多的视频类应用。
所以,从技术做商业化落地到底要注意哪些关键点?我有一些心得。
真实有效的规模化刚需
我们做任何一件事,哪怕拥有一个特别牛的技术,一定最终是从需求出发的,一定是要说我到底给用户创造了什么价值。
我们这几年见过很多伪需求,什么叫伪需求?举个例子,前些年一个做白色家电的生产商,他们觉得商汤的人脸识别技术非常棒,说:想把家里空调变成人脸识别的空调,20多岁年轻人走到这儿的时候调成16度,当老人进来的时候调到26度,温度自适应,多人性化。
我回复了他的需求,提出了两个问题:假如人进来时没有拍到脸,拍到背影怎么办?假如年轻人和老人同时进来,自适应空调要设多少度?这个在我看来就是典型的伪需求,用一个遥控器就能很简单解决。所以,用户可能很多时候没有想得很清楚,但是,我们在想要做一个商业的时候,要清楚是不是能真正解决用户真实的痛点和需求。
有很多需求是真的,但在经济上不划算。举个例子,为公厕推出人脸识别厕纸机,人脸在这儿一刷,厕纸就出这么多,鼓励大家节约用纸,不要把厕纸拿走。这个需求是不是真的呢?是真的,因为目的是节约用纸,但这个需求不刚性,只能作为公益。
大家可以算一算,本身一个塑料壳的厕纸机要多少钱,现在进行改造,装人脸识别,还要弄一个小屏幕,这个会增加多少钱?例子有点极端,但是我们遇到过很多这样的问题,做任何商业一定是双赢的,双方一定都有投入,都有回报,这个模式才能持续,才能变大。
当然,对于刚性这个问题有时候很难判断,因为商业逻辑往往很复杂。我见过一个跟厕纸机类似的需求,就是超市存包。现在超市存包是按一下出一个小条形码纸条,条形码会有一个不便,就是一个小纸条经常揉了、丢了会取不出来,确实不是很方便,于是有人提出来,是不是可以把超市存包改成人脸识别的?
这个问题,我首先想到的就是成本问题。因为这个创新能为超市带来多大便利,超市愿不愿意承担成本,我没想通,但后来沟通之后,发现这个事情背后藏的逻辑很深。
这不光是装一个摄像头,为让刷脸存包更便利,这里一定会放一个屏幕,给顾客操作反馈,不知道大家听到“屏幕”二字敏不敏感?反正圈里的人听到屏幕眼睛都是发亮的,因为有屏幕就可以打广告,而且广告可以定向去打。
要知道存包位在商场和超市里,顾客去用一定是要准备发生消费行为的,这个时机打广告非常有价值。其次,摄像头可以分辨出顾客是男是女,大概年龄,所以广告是定向的。当然,目前不一定打得非常精细,但是随着商超背后会员体系越来越完整,刷脸的那一刻就会知道你是谁,知道你是超市的一个会员,知道你过去的消费记录,届时广告是不是会更精准?
把需求放到这个逻辑来看,就算几百块钱,甚至几千块钱成本也是非常低的。所以,我认为这是非常刚性的。
到底什么需求是刚性,什么需求不刚性?需要我们在实际工作生活中跟需求方仔细地去思考,是不是能够挖掘更大的价值点。
需求的技术红线
从2013年到现在,整个人脸识别,在不同场景下,对准确率的要求其实千差万别。从商汤自身定位来看,每一年我们能把人脸识别误识率下降一百倍,但在安防领域,还是有很多场景需要我们继续提高。
这里有一个很关键的问题,就是当你有这样一个技术,把它用在不同场景时的技术需求是不一样的。这个时候需要一个好的判断力,在未来半年或者一年刚好能去解决这个场景中的关键问题。如果来的太早,就要花很长时间研发,迟迟拿不到市场回报,企业就会被耗死;如果来的太晚,就会发现市场上有很多家都能做这个业务的企业,届时PK的不是技术而是别的能力,这就不适合技术企业切入这个市场。
当决定进入一个市场,第一,要看到这里有刚需性的场景。第二,需要大致判断这个场景,以我的技术水平要花多长时间解决掉,现在是不是刚刚好解决?我解决了,同类型市场其他人是不是也能解决?这个是决定下一步是不是要做这个事情的先决点。第三,真正做一个行业时,以一个技术点出发,只能解决需求的一小部分,当想让这个需求进一步发展完善,它一定有更多技术点需要去解决。
融合创新能力
这是商汤为直播APP厂商提供的一套AR解决方案,我们的技术会紧密跟随用户需求一起往前走。前一阵我们还发了一个产品Demo,商汤的“瘦身”技术,可以瘦腰,瘦腿。我当时发了朋友圈,以前同事给我留言说,互联网以前脸不可信,现在连身材都不可信了。没办法,顺应时代的发展,顺应用户的真实需求。
今天,做一个产品,就算其中90%靠人脸识别解决,并不是说把人脸识别做好就够了,可能剩下70%的工作量是解决剩下的10%,这才决定了产品最终的差异化。
所以,产品能给客户提供价值,实际上在这个过程中需要重新定义这个问题,除了找到核心技术竞争力之外,到底离客户的需求真正被满足,差距在哪里,以什么样的方式去解决这样的差距,这往往是需要投入很大的,进行持续性投入的一个关键点。
有效的数据闭环
怎么样保证数据的获取,特别在新的领域,是鸡和蛋的问题。
闭环需要有一个起步可以转起来,只要比别人先转有上三个月时间,很多竞争对手就会被搁在门外了,因为闭环的加速优势会起到很大作用。任何一点取得突破就可以,比如技术比别人好,把其他场景的技术迁移过来,就得到了一个起步技术,就可以开始跑;或者有资源和数据;或者说与下游行业用户形成了很深的合作。
在这个环节中怎样找到合适的切入点切入正反馈,就需要一个案例一个案例去看了,所以存在合适的业务模式选择问题。大家知道,我们现在对数据隐私性,数据的所有权,有一系列值得我们长期持续探讨的问题。不同行业、业务模式怎么去选,怎么样对数据产权有有效的界定,成为业务发展的助力,而不是阻碍。
核心价值要素转移
最后一点,我认为这是最关键的。
首先任何一个新技术解决一个场景一定有时间窗口,技术一定会扩散,你的技术会进步,别人也会进步。但是这个行业的需求,至少这个场景的需求不会随着时间的流逝而提升。所以技术壁垒一定是有时间窗口的。
对于一个技术企业最重要是在有限的时间窗口到底能够做什么。一个前提,当你切入一个新市场,有无比强大的技术能力,保证比别人做出的东西强,这个其实是非常非常难的。如果想认真地在一个行业进行产品迭代、业务提升,很重要的一个问题,就是你的技术领先对你最重要的是什么?是技术的打磨,还是收入的回馈和获取?还是说需要去思考行业要素,到底怎么进行有效的分配转移?
举个例子,我们曾跟一个大型连锁超市合作一个项目,用人工智能技术去解决超市防损的问题。超市有一个掌握了偷东西黑名单的库,我们就基于这个库做了一个人脸布控系统,在超市入口处安装上摄像头,顾客都会被识别一下,如果是黑名单就会报警通知保安人员。
我们当时觉得这个合作特别好,人脸识别,还能做小算力,一整套方案很成熟。我们整个方案不停打磨,把算法也搞得很好,场景也做得很好,产品也不贵,一整套方案拿出去,大概推了几十家店。后来另一家厂商入场,它就一件事,超市以前都有摄像头,它用纯视频的NVR(Network Video Recorder),如果这个超市没装,今天就卖你这个设备,而且这个设备附带一个人脸识别。
这件事情最关键的一点是什么?它也要做技术研发,它也会有成本投入,我也有成本投入。按说我们的技术水平比这家厂商好,但这场仗输了,两个核心原因:第一,对手具备强大的供应链,它从上游供应链拿到的报价比你低30%甚至40%。第二,它有全国服务支撑体系,有大量的合作伙伴,所有店都可以去人安装部署。而我们找一个全国代理商做这样的服务和售后,磕磕碰碰非常难。
反过头来看,这个行业的核心要素是什么?对于商汤,对于零售,核心要素是一整套解决方案的硬件成本,在这种场景下,在能力基本达标的情况下客户对硬件成本是极度敏感的。因此,我们更关注的是细分场景,在那些场景可以形成差异化优势。
今天举了几个简单的例子,从有一个好的技术到真正完成有效的商业落地,这里有几个值得大家注意的关键点,在每个环节可能都要想一想。做一个产品,做一个行业,在这几点上是不是所有道理都想得通,但想通这些事情往后就会好做很多。
AD: 8月30日,猎云网2018年度“智慧+新服务”企业服务峰会落地上海!携手众多行业先锋领袖,共同探讨企业服务行业新风向。