马化腾:来自“绝艺”的最大收获是了解了AI的规律
凤凰科技讯(作者/朱旭冬)4月2日消息,2017年IT领袖峰会今日在深圳开幕,腾讯CEO马化腾、百度CEO李彦宏、神州数码董事局主席郭为和微软执行副总裁沈向洋进行了一场关于人工智能的讨论,数字中国联合会主席吴鹰主持。
吴鹰首先提到了腾讯的绝艺,腾讯的这个人工智能机器人夺得了最具传统和权威的“UEC杯”计算机围棋大赛冠军。
马化腾表示,在人工智能领域,“Robin(李彦宏)走的更前,腾讯落后不少。”他介绍说,腾讯去年在设立了专门研究人工智能的实验室。另外,腾讯在微软总部西雅图也设立了一个研究院。
来自绝艺的最大收获是规律
很多人对人工智能的了解都来自,AlphaGo 和李世石的围棋对战。马化腾表示,腾讯受这件事的启发,也组了一个团队。“我们内部有三个团队,刚好绝艺团队突破了瓶颈。”他说。
绝艺AI的成长和AlphaGo 最大的不同说,绝艺有国家的围棋大师陪练的。但腾讯的工程师完全不懂的围棋,黑子先下白子先下都不知道。
不过马化腾并没有把所有功劳归给腾讯,他表示绝艺是在前人的肩膀上,因为学习了很多人工智能领域的论文。”但绝艺也做了有意义的事情。“
马化腾说,做绝艺最大的启示是,发现了人工智能在其他领域应用的规律。在围棋以外的领域,如果计算机能有一个后台用模拟器去研究,自然会琢磨出一套规律和经验,这会远超我们的想象。
人工智能现在还不能解决所有问题,连做一个通用的人工智能都很难。马化腾认为现阶段人工智能还是通过某些垂直领域,给人工智能去学习和训练。
人工智能的数据使用需谨慎
腾讯有大量的数据,比如每天微信有上百亿元条消息,其中可能有高达10亿张的有人脸的照片,这些都可以用来分析,提供给机器学习。其实腾讯在后台数据分析、广告匹配等都用到了人工智能,只是这些都是后台,外界不一定能感受到。
腾讯有大量的数据,但是如果把数据分享出来给其他人做人工智能的研究,并不是“拿出来”那么简单。“这个问题我们内部有激烈的讨论。”马化腾说。
在腾讯内部,业务部门可以获取很多数据,但是研究部门和业务部门存在一些冲突。业务部门也希望自己能利用这些数据做一些研究,并不想完全依赖研究部门。
马化腾表示很多数据是要在特定场景下实际运转的时候才能出来,但同时也会有很多没有标签的垃圾数据。“我们现在用人的方法来清洗数据,再让人工智能学习。”另外还存在隐私问题,数据拿出来用的时候需要“脱敏”,然后才能提供给不同部门甚至提供给外部。
对于人工智能消耗的能量(比如电量),马化腾解释称,训练数据需要消耗很大的能量,但实际用的时候,不需要很大的能量,比如训练完之后绝艺的单机版水平也非常高。”但是稍微改一点点规则,就要从头开始训练。这是一个非常消耗资源的事情。“他说。