专访云从科技周曦:人脸识别一定要做全产业链,深度学习还有黑匣子
“全国总共有100多家体量较大的银行,我们已经拿下20多家,是国内做AI+金融项目最多的公司,综合来讲我们已经是AI+金融领域的第一品牌;今年还要争取做到 AI+安防 领域的第一品牌” 云从科技 CEO 周曦 在接受亿欧采访时透露。
周曦是中国图像识别、视频识别领域的领军人物。他本科、硕士均就读于中科大,早年研究语音识别;2006年师从计算机视觉之父Tomas S.Huang教授,研究图像识别和视频识别;2007年到2011年之间,周曦夺得6项图像识别和视频识别世界大赛冠军。2015年4月创立了云从科技。
云从科技被誉为“ 人工智能 产业化国家队”,目前在上海、成都、重庆有三个研发中心,在美国URUC和硅谷有两个实验室,并与中科院、上海交大学合作推进学术成果转化。今年2月,国家发改委颁布了2017“互联网+”重大工程拟支持项目名单,其中人工智能平台仅有四家公司入围,分别是百度,腾讯,科大讯飞和云从科技。团队方面,云从科技拥有近400人规模,其中研发200多人,销售服务100多人,目前主攻安防和银行两个领域,在全国十几个城市有销售服务中心。
做好一个案例只需要三个月时间,但将产品落地可能要三年
此前拿下6个世界冠军,周曦对自己的技术是比较自信的,但是从技术到产品落地的过程中却遇到不少的坑。
2011年,周曦带领团队为西安世界园艺博览会做一个旅客引导系统。他们去现场后却发现还需准备一大堆东西:
首先需要有采集设备,其次得找地方装摄像头,装了摄像头之后得有电,有了电之后还需要有网络才能把视频、图片传到服务器;此外还得有个管理系统,帮它把所有的信息分析整理好,然后再把信息发送到个人手上。
“所有这些听起来很简单,实际上我们做工程时都不具备”周曦说,“所以我当时就发现,我们做好一个案例可能只要三个月时间,但是真正要做好一个产品、一个系统要三年的时间,这个是我最早的体会。”
在银行业务上,云从也并不顺利。
众所周知,这一次人工智能大潮缘于深度学习的突破,而深度学习技术本质上是概率的提升,它可以不断接近100%,但是不可能达到100%。也就是说它总有比对出错的时候,但客户觉得你应该是不出错,应该是百分之百,要确保万无一失,跟客户解释这一个事情很难,人类对机器犯错的底线比人类自己犯错要低很多。
“从技术上来说,云从科技相对以往技术有数量级的提升,但是技术再好用户都不会买单,用户需要的是你帮他解决问题。因此我们每进一个行业都很细致地帮助客户来打造行业技术方案,在银行领域我们有46种不同的解决方案”周曦说。
人工智能的三个阶段 : 可理解 、 可改变 、 情感投射
“如果我不创业了,我会继续研究深度学习,这里面还有很多的黑匣子”周曦说。
深度学习是非常庞大的一个神经网络,这个网络很好,技术能做出非常好的结果来,但它不知道如何得出这个结果。
举个例子。银行评估客户贷款额度时,以前的方法是先采集各种信息,比如对方的房子、车子、生活记录等信息;而人工智能是通过一个非常复杂的网络,最后算出一个结果比如是2000万,但是它只知道这个结论,不知道为什么是2000万,为什么不是1500万,1000万……还有这个结果到底可不可信呢?银行会很担心这些。 总之,机器只是给予一个结果,但并不知道为什么得出这个结果,这背后就是黑匣子。
其实,人工智能有三个层次:可理解、可改变、情感投射。
第一层是可理解。
例如我们跟小孩解释什么是苹果,只要跟他说红色、圆形等一些简单信息就可以解释清楚;而机器是把所有的像素求梯度、积分,做很多步骤算出来概率大于某一个数值得出结果是苹果。但是如果给苹果挖一个孔,机器算出来可能就不是苹果了。
“其实人类理解和机器理解不在同一个世界里面,大家不能交互”周曦说。
AlphaGo赢了李世石,但不能回答李世石为什么走这步棋。机器没办法解释这个事情,这个是一个非常复杂、通过几十亿个浮点网络算出来的数值。那么,如何解决人机交互问题呢?周曦认为,人类和机器必须建立共同的语言体系,这个还需要去深入探究。
第二个层面是可改变。
如果只是可交互还不够,人机之间还要能为对方改变。比如机器能了解人的生活习惯,能提供针对个人的特定服务。同时机器也可以教人类,人机之间是良师益友。
第三个层面是情感投射。
中国有句古话“衣不如新,人不如故”,意思是有了情感,就不需要新的东西了。如果机器有了情感,你对它的依赖性会呈现指数级增强。例如,百度搜索的粘性很强,但如果出现一个粘性比它强的产品,百度可能立马就会倒塌了,这是很可怕的事情。
人工智能目前阶段适合做 专业级市场
周曦认为,专业级市场要求三点:性能好、服务好、对价格不是很敏感; 消费级市场 也有三个特点:性能好、使用方便、性价比高。 那么,什么时候应该做消费级市场,什么时候应该做专业级市场呢?
“人工智能目前阶段适合做专业级市场,因为它还不是一个完全通用化的产品。性能好可以做到,但它一定要靠服务。而且针对不同行业和场景,人工智能的产品差异很大,一定要做定制,最好要有服务人员,能够实时地给它一些响应,这个情况下,很明显成本会比较高。很容易分析,金融、安防符合这个情况”周曦说。
消费级市场要求很方便,比如买一个iPhone手机,要能够上手即用,更不要说还要做定制,派人来培训。 还有消费级产品的性价比要高,而人工智能没有完全通用化,很难把价格降低到很低的程度。
为什么 人脸识别 一定要把产业链做全做重?
360创始人兼CEO周鸿祎说过,互联网时代创业,创业公司一定要选择一个点突破。这个点不是巨头正好要去做的,但是这个点又是能够让你发展起来,不要一上来就想到先做全产业链。
“这个说法很对,但是对于人脸识别领域是不对的,因为每个行业每个市场格局都不一样的。周鸿祎讲的是互联网创业,它几乎没有门槛,大家主要拼的是速度,如果做大风口最后很可能会给大公司‘陪葬’。但是人脸识别的情况和这不一样,人工智能是有门槛的,短期之内只要自己保持足够快的进步速度,别人很难对你形成威胁,这种情况下就是要去占风口”周曦说。
其次,人工智能目前还没 标准化 ,缺乏统一的标准,做不到让所有的行业内都用你的标准,所以占据一个点是没有意义的。如果只做一个点,不能给用户最好的产品和体验。反推回来,如果要打造最好的产品,一定要做重度,从0到1都要自己做,这样才能给用户最好的体验。
“我从小就对 机器人 特别感兴趣,期待有一天机器人能够为我们做各种事情。要说最快乐的一件事情,就是当我走到任何一个地方,比如说我去机场,我回头一看那个里面是云从的设备,然后看到每个人都很开心地在用,我就觉得特别开心”周曦说。
本文作者许伟军,亿欧专栏作者;微信:xuweijun24(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。