电子科大周涛:如何用物理学方法论来解决计算机领域问题?
雷锋网AI科技评论按
:2017 年 11 月 25-26 日,由 中国计算机学会(CCF) 和 KDD China 联合主办的中国计算机学会 第85期 学科前沿讲习班(CCF Advanced Disciplines Lectures,ADL)在北京中国科学院计算所成功举办。
电子科大周涛教授在讲习班上做了一场主题为“计算社会经济学”的报告。报告中,他向学员们介绍了如何利用海量数据分析、人工智能技术感知社会经济态势,预测社会经济发展趋势,提前发现重大风险,量化选择最优经济策略等内容。
电子科大周涛教授
周涛教授是电子科技大学教授,主要从事统计物理与复杂性方面的研究,发表SCI论文200余篇,引用18000余次。 2009 年获教育部自然科学一等奖, 2011 年获第十二届中国青年科技奖, 2014 年起历年入选 Elesvier 最具国际影响力中国科学家名单(物理天文类),2015年和屠呦呦等七人当选CCTV年度科技创新人物,2017年获全国创新争先奖。
如果用一句话形容周涛教授给记者留下的印象,那就是“物理领域专家中最懂计算机,计算机领域专家中又最懂物理。”
不过,在随后记者的访谈中,周涛教授却并不认同别人对自己的“计算机专家”的称法。
近些年,周涛教授在公开场合讲大数据的机会比较多,再加上曾经编译过一本被大众所熟知的畅销书《大数据时代》,进而有了“计算机专家”的称谓。事实上,周涛教授表示,他是纯粹的物理学背景出身,主要从事统计物理与复杂性方面的研究。
当记者问及是否有向计算机科学领域转型的想法时,周涛教授明确表示“从未想过转型,以前没有过,现在不会,未来也不打算转型”。
他解释道,自己虽然是在做数据挖掘研究,但用的是物理学方法论。计算机和物理之间没有高低贵贱之分,只是方法和理念有所不同。
“我和我的团队目前所作的工作就是通过海量事实数据,用精确的分析去感知宏观的经济社会是怎样发展的,然后来预测可能的风险。”周涛教授告诉AI科技评论。
此外他还向AI科技评论表示,大数据和人工智能会给社会带来很大的变化,对社会最大的冲击,其实并不是来自于计算机科学本身,很大程度上是来自于它对社会学、管理学、心理学等学科的影响,把这些原来只是半定量或者定性分析的学科变成了一个定量化的学科。
以下是雷锋网AI科技评论专访内容:
AI科技评论:您是瑞士弗里堡大学物理系博士,研究方向为网络科学、信息物理、人类动力学、群集动力学,这是否是您从物理学向计算机科学转型的节点?您是怎么从大数据研究过渡到计算社会经济学研究上的?
周涛教授:我没有想过向计算机科学转型,只是有些合作而已。我的绝多数论文,都是在物理领域的期刊发表的。可以这么说,以前没有,现在不会,未来也不会有向计算机科学转型的想法。
我大概是从2007年开始从事数据挖掘,我对数据挖掘的理解是怎么样从数据中找到深刻的洞见。早期我是做网络数据挖掘,但是我们用的方法是统计物理的方法,比如各种扩散动力学,所以说面对的问题是和计算机领域的学者面对的同样的问题,但是用的方法论不太一样,发表的期刊也不一样。我以前不是做这个方向,是07年在瑞士的时候开始做的。直到了2016年的时候,我才开始考虑做一些计算社会经济学方面的问题的研究。
AI科技评论:计算社会经济学是一个新的交叉学科,这是您提出来的吗?
周涛教授:说是谁提出来这个没有意义。任意组合两个学科都可以形成一个新的交叉学科。准确的说,目前国内外有一部分人在探索这种新的方法去处理传统社会经济学问题,可以说我们是早期探索这个问题的一个小组,我最近也会有一篇大的Review来探索这个问题。新方向将来会不会形成期刊,是否有它的学会,有它的研究方法论,它是否能真正解决传统社会经济学解决不了的大问题,或者说是验证和推翻了传统社会经济学的经典理论,或者是有些还没有被验证和推翻的东西?如果答案是肯定的,这个时候它的力量才能体现出来。但现在还处于早期,还没有形成成熟的学科。
AI科技评论:大数据涉及众多领域,您是否有一套统一的大数据方法论去适用这些领域?
周涛教授:首先是有了数据不等于有了解决方案和洞见,我们总是想要用数据挖掘,或者机器学习,或者其他方法,来获得你真正想要的目标。这里面,其实可以把工作分为两类,一类是从“货架”上取下来。举个例子,基于卷积神经网络的深度学习或者用梯度下降的决策树做随机森林,这是大家都做好的,有一个标准模版,这个就是“货架”。上面有玲琅满目的“干货”,有的是简单的数据挖掘方案,比如多维的广义线性回归,有的是比较新的,比如卷积神经网络的深度学习,这个货架上面摆了成百上千的东西。所谓的普世方法,我们一般遇到一个问题,首先看这个问题是否能分类为我们熟悉的问题,要从“货架”上取一些工具来试,这个大概能探测到一些有效的方法。但实际上,不同的问题的解决方案,差异性是很大的,这就需要行业理解,行业理解和货架是无关的。比如,刀具的寿命预测,生产线的优化,面板集成电路缺陷发现,酒的加工等,这些我们团队都做过。这里面就要用到很多不一样的行业知识,比如做刀,需要很多动力学知识,预测什么时候断刀。最终,是需要行业知识加上“货架”取下来的东西结合一起做,才能形成解决方案。但是可以从某种意义上理解为有一种普世方法,因为我们团队很大,我们准备了一个货架,上面有很多“干货”。任何东西来了,我们到货架取下来方法就可以了,我们至少可以保证在短期内给一个六七十分的解决方案,但要做到90分,就要深耕行业知识。
AI科技评论:物理学背景对您现在的研究有什么特别贡献?
周涛教授:贡献非常大,从物理或数学角度出发,在计算机领域或工程领域,它是competing for numbers(数字论输赢),比如我希望战胜你,你的精度是0.9217,我的是0.9249,我就比你厉害。计算机领域的学者对虚的东西不太看重,比如说同样一个模型,我可能参数很少,方程的每个项目都可解释,我能解的出来,能写出解析表达式,方式很优美。而计算机领域的人训练几千上万个参数也写不出表达式,不简洁,也不优美。研究物理和研究计算机本质上没有谁对谁错,但物理领域的人会对简洁,优美,甚者优雅追求更强,我们不搞复杂的训练模型,但这样反过来会牺牲一部分实用性和精确性。不仅会牺牲一点精确度,有时,我们做的很优美,但可能只能处理几千个节点网络,而计算机领域的人的方法可能可以处理几十亿节点网络,这样我就差的很多。我牺牲的是精确性和效率,追求的是优美和简洁,所以在方法论和思路上多多少少还是不一样。
AI科技评论:物理学研究背景跟您现在讲的人工智能将在社会学、经济学、教育学产生巨大变化有何内在联系?
周涛教授:人工智能和大数据在一起,总体的推动力都是一样的。原来的学科都是定性的或是半定性的学科,第一个,都缺乏数据,比如说教育学,以前做调查,原先二三百人都是比较大的,但是现在用Facebook,用Twitter,动辄几亿人的研究对象,用手机就可以了解你的行为。数据的高度丰富,以前是没有的。
第二个是方法的变化。以前这些研究的领域都集中在统计上,分析关联有多强,哪些是因果,什么情况下,人能从中得到一些洞见等等,究其原因是因为你的数据维度很小,比如说,我看因果,特别是因果的挖掘,通过人工智能,特别是通过机器学习,计算机能建立一些方法,能够在一个几十万上千万上亿的高维特征空间中,进行因果的挖掘,进行预测。这就是人工智能,机器学习带来的作用。所以从这个角度来讲,就是生产资料和生产工具的解放。
AI科技评论:您讲的这个主题偏宏观一点,感觉可能对投资人,政府的管理人员参考比较大,对于普通人的参考意义在哪里?
周涛教授:可以关注自己所在的城市,可以看一下自己的城市的竞争力,适应度,排名怎么样。这个非常有意思。从大的方面讲,整个社会经济学面对的大问题,矛盾集中的问题更多是在非洲那边,对我们普通人参考意义不大。但如果从小的方面讲,比如我们这个年龄,有爷爷奶奶,我们可能不了解他们真正的感受是什么,最新有些研究,就是通过手机的通话和移动,判断你是否孤独,是否很好融入城市生活。这样就可以来看有一个人是否心理健康。
雷锋网
。