专访上海第一财经首席数据科学家汤开智:人工智能的核心在于让计算机拥有学习的能力
人工智能的核心在于让计算机拥有学习的能力
——数据观专访上海第一财经首席数据科学家汤开智
人工智能的核心理念就是计算机可以从人类的经验和活动中学到抽象的规则,这些规则可以是人直接赋予的,也可以是算法从数据中学习到的。大数据给人工智能技术注入了海量的学习机会,很多人工智能的算法像深度学习,将从海量的数据中学到人类难以想象的知识。
■ 人物名片
汤开智,上海第一财经首席数据科学家。运筹学和人工智能博士,10多年数据挖掘和人工智能工作经验,领导多个跨学科大型项目,对大数据,人工智能在各领域的应用有丰富的项目经验。目前工作的重点是研发阿里巴巴大数据价值发现的数据产品和利用人工智能技术帮助大数据环境下的内容生产和原创。
第一财经的写稿机器人——DT稿王的推出,标志着新一代的智能写稿机器人开始“任职”。近日,数据观记者就“人工智能”相关话题专访了上海第一财经首席数据科学家汤开智。在他看来,人工智能的核心理念就是计算机可以从人类的经验和活动中学到抽象的规则。
第一财经的人工智能方向
记者:目前第一财经在人工智能方面做了哪些事?
汤开智:第一财经在人工智能方面主要体现在四个方面。
1、建立媒体实验室;
2、研究人工智能先进技术和财经新闻智能化应用需求;
3、制定第一财经人工智能发展规划(党委会上汇报的1.0、2.0、3.0版);
4、按期完成了1.0版的开发和应用推广。
记者:在智能方面,阿里巴巴与第一财经联合推出的一款帮助财经记者快速及时写稿的智能写稿系统“DT稿王”,它的目标是什么?
汤开智:DT稿王的主要目标就是辅助写作,它有两个展现形式。第一,我们希望能够通过数据和 人工智能 算法的技术,帮助作者,特别是财经记者,在批量并发的信息中挖掘最有价值的信息,第一时间进行更有阅读性的稿件报导;第二,研发一个写手们喜欢用的写作工具,无时无刻帮助写手,提高写作效率。
记者:DT稿王在新闻领域能做些什么?它是如何完成写稿的呢,请举个例子。
汤开智:它能够在新闻领域帮助编辑瞬时、高效、准确的发布第一手信息。在DT稿王设计者的理想中,人和机器在很大范围内是可以交流的,所以只要作者从逻辑上描述清楚写作需求,机器就能自动完成所需稿件。DT稿王通过不断迭代成长,目前的智能写稿系统为DT稿王1.0,能写出三大逻辑类别稿件。
第一类稿件是基于数字进行事实陈述并进行简单逻辑分析的文章。对二级市场的监控、体育赛事的简讯是此类稿件生成的典型应用场景。
第二类稿件是根据每类稿件的信息要点对信息源进行针对性的信息提取,把非结构化的文本转为结构化及半结构化的数据。得到半结构化的数据之后再根据不同的规则把信息要点组合写成单点内容。
第三类稿件是单点内容的关联生成,此类稿件能弥补单点内容信息量单一的缺点,并为受众尤其是投资者,及时关联专家对基本数据的解读及评论,生成更有深度、更立体、更综合的稿件。
智能新闻时代的发展趋势
记者:新闻写作领域面临的困难有哪些?通过智能写稿,您认为这个大行业接下来会发生什么样的变化?
汤开智:随着互联网和 大数据 的高速发展,技术的发展由IT(Information Technology)时代进入DT(Data Technology)时代。一个新闻领域的作者和编辑每天被数据的海洋包围,只靠人力来筛选信息再编辑,已经不能满足当前的互联网自媒体环境。因此,如何实时监控多样化的信息源;如何在批量并发的信息中挖掘最有价值的信息第一时间进行稿件报导,已经成为DT时代内容生产的巨大挑战。
目前各行各业都在拥抱人工智能领域带来的技术力量,新闻写稿行业也会发生同样的变化。早几年,在美国市场上已经出现这样的技术来帮助新闻记者;中国市场上目前也有不少公司在研发和使用这样的技术,包括腾讯,今日头条,阿里巴巴等。因为智能技术不仅能最大限度的节省人力成本,同时让人和机器的工作经验以数据的方式积累起来,媒体界的老板们肯定会很喜欢,去不断推进。因而新闻业的从业人员在这个过程中会受到压力和冲击,这将是他们转型和学习的机会。那些拥抱智能化的记者编辑将会更有时间和精力去提升自己稿件的质量,也能去做更有创作力的事情。这个行业将来会出现一些内容产品经理,也可以成为写作机器人导师的职业。
记者:人工智能将成为在计算机技术发展史上,不乏有人对人工智能的极限产生怀疑,认为机器无论怎样都无法拥有如人的思维一般复杂且综合的能力,您是如何看待的?
汤开智:从技术的层面,目前的人工智能技术是弱人工智能技术,也就是在某些特定的领域可以做得还不错,要想在人类所涉及到的所有的领域都成为专家,目前还是一种想象。主要原因不但是技术算法的挑战,更深层的原因是信息和数据的孤岛问题。人类和宇宙的数据不是在所有领域都均匀分布的,很多地方,很多领域是没有数据的,没有数据,机器永远没有办法学习。从更深的层面讲,人不但是身体和思维能力的组合,人更是一个有灵的活物,目前科学技术还没有办法达到这一要求。但不可否认,人工智能技术能够代替人完成简单重复而庞大的工作,让人从这些工作中解放出来,有更多的时间去做复杂且综合的工作。
记者:智能新闻时代未来发展趋势应该是什么样子的?迎接智能时代,传统媒体、新媒体和记者应该做哪些准备?
汤开智:我认为能让机器干的事情就让机器干,因为它不用休息,如果能够用逻辑说得清楚的事情,机器干得比人还好。人应该做更有创造性的事情,更能体现自己个性的事情。媒体记者编辑应该多了解这个领域的发展,积极使用这个领域的工具来提升自己的工作能力,最大限度的利用智能化和大数据的技术力量;同时媒体记者编辑应该更注重自己的个性和创造力,人应该是机器的主人。
从功能到智能,人工智能将成为未来发展的热点
记者:人工智能技术、数据处理、用户画像、定位等等,所有这些结合起来,可以在各个行业发挥出非常独特作用。从这里来看,您认为中国的大数据环境和行业发展到什么样的阶段了呢?
汤开智:大数据技术和人工智能技术结合在一起,给很多行业解决很多问题,特别是互联网行业。数据技术的使用能让商家迅速、准确的明白消费者的需要,更能让消费者更快获取到自己感兴趣的信息。在这点上,中国的大数据互联网公司和硅谷的公司的差距越来越小。但大数据的环境和美国比较起来,主要是在对数据资产的重视和数据的透明度上,中国的民间和政府还有很大的距离。
记者:人工智能将怎样改变我们的生活?大数据与人工智能的发展之路是什么?
汤开智:很多大公司认为人工智能是未来新的经济增长点,所以在做很大的投入。因此在这个商业高度发达的社会,人工智能一定会对我们生活的方方面面产生改变。工业机器人已经被使用很多年了,生活机器人如扫地机等也在进入很多家庭,无人驾驶汽车,问答机器人,问诊机器人,炒股机器人,写稿机器人等等,都在不同程度研发,试用。所以人工智能技术必定会给人类的生活带来更多的便利。
大数据和人工智能将在相互促进中发展。大数据给人工智能技术注入了海量的学习机会,很多人工智能的算法像深度学习,将从海量的数据中学到人类难以想象的知识。
记者:您对人类、机器人以及人工智能将来的互动持何种愿景?
汤开智:人工智能的核心理念就是计算机可以从人类的经验和活动中学到抽象的规则,这些规则可以是人直接赋予的,也可以是算法从数据中学习到的。首先我期待有更多的质量更高的数据可以供机器人学习,因为目前高质量的数据还是很难获得的;其次我希望人的创造力和思维能够更好的和机器规则进行对接,设计出跨领域的机器人;再次我希望人类不要在这个过程中退化,变得越来越懒惰。
数据观记者 ▏ 宿思
注:本文系数据观原创稿件,转载请注明来源及原文链接!扫描下方二维码关注数据观,获取更多大数据相关资讯。
责任编辑:陈近梅