大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展?
雷锋网AI科技评论按:传统意义上来说,我们会认为社会科学大多只能是定性/半定量分析的科学,例如社会学、心理学、文学、历史学。但当进入21世纪,伴随着大数据、云计算和人工智能的出现,这些领域在定量分析方面出现了蓬勃的发展。例如文学方面,举个例子,有人爬取《冰与火之歌》原著中人物数据,构建人物之间的社交关系网络,定量分析为什么这部著作堪称经典。再例如通过爬取微博数据来定量地分析宗教群体之间的关系网络。同样的大数据也可以用来定量地分析诸如经济发展规律、历史演化等等。可以说大数据、云计算和人工智能的发展让传统的这些社会科学焕发出了新的生机,社会科学已然在发生着巨变。
《冰与火之歌》社交网络图:点的大小代表角色的点度,即出现频次;颜色代表walktrap聚类的结果;线的粗细代表联系的紧密程度,颜色与聚类方式一致。聚类问题将在本文第三部分具体讲述。图片来源:dt财经
伴随着这种巨变的发生, 哈工大的刘挺教授 在2012年发起了首次全国社会媒体处理大会(SMP),希望通过这种形式给各个领域的专家提供一个思维碰撞的平台,以计算为背景,交叉应用到各个领域, 以加速传统学科深刻的变化。
经过数年的发展,今年9月14日-17日SMP专委会在北京成功举办了第六届全国社会媒体处理大会(SMP 2017)。在四天的议程(两天讲习班、两天主会)中,分别有来自各个领域的专家(例如金融、情感、传播学、教育、企业等)就大数据、人工智能等在该领域的革命性研究做出了精彩报告。大会现场几乎场场爆满,几乎每个报告都能给听众带来很多富有启发的观念。
在大会结束后,雷锋网就SMP大会的情况分别采访了 大会的发起人 刘挺教授 、 专委会秘 书长唐杰副教授 和 本届大会程 序委员会主席 沈华伟副研究员 ,了解到了SMP大会的一些详细情况。
刘挺教授,SMP大会发起人,SMP专委会主任,哈尔滨工业大学教授,社会计算与信息检索研究中心主任
唐杰副教授,SMP专委会副主任、秘书长,清华大学副教授
沈华伟副研究员,SMP专委会副主任、SMP2017大会程序委员会主席、中科院计算所副研究员
雷锋网:刘教授,SMP大会是由您在2012年发起的,当时您是基于什么样的想法去做这件事情的?经历这么多年,您觉得您对SMP大会的定义有发生变化吗?
刘挺: SMP大会全称“社会媒体处理大会“,2012年策划这个大会的初衷是希望能够加强多学科融合(尤其是计算机科学、社会学、传播学、管理学、语言学等多学科交叉),针对产业发展和用户需求,加强学术交流、拓展创新思路,推动我国社会媒体处理理论研究与技术应用的持续发展。SMP大会经过这几年的发展,规模和影响力在逐渐扩大,但核心理念没有变化。
SMP能够发展到今天,受到大家的热情关注,主要是顺应和满足了社会媒体处理相关领域各方人士交流与合作的强烈需求。回想起来,2012年末,微博得到了很大的发展,海量的微博内容成为各相关领域学者共同感兴趣的大数据,经过一两年的工作积累,很多学者、学生和企业界人士都迫切需要一个交流的平台,我顺应了这个需求,在微博上发了一个帖子,倡议组织一个完全兴趣驱动的学术、技术交流会,很快有400多人响应,会议就开起来了。这样的初心一直保持到今天。
雷锋网:SMP会议目前已经经历了六届,在这六年当中SMP经历了怎么样的变化?
唐杰: 2012年SMP大会在自愿报名参加的原则下举行,结果一下子通过微博聚集了400多人;2013延续了2012年的组织架构,相对前一年则更加侧重工业界的演示,大会非常成功,吸引了近500人参加。经过两年的准备,我们筹备成立了中国中文信息学会社会媒体处理专委会(SMP)。
2014年,SMP大会开始按照标准大会的方式进行组织,大会增加了论文投稿环节,但会议仍然采取免费注册的方式,大会非常成功,吸引了700-800人参加。
2015年,我们开始策划在外地举办大会,第一次离开北京,大家还是忐忑不安的。SMP来到了广州,由华南理工大学承办,大会继续秉承免费注册的原则,这次在京外的尝试延续了之前在北京的成功。
2016年专委会决定将大会举办地定在江西南昌,由江西师范大学承办,第一次尝试收费注册,还增加了用户画像技术评测(吸引200多支队伍参赛),最终有400多人注册参会,值得一提的是,大会最后一天各个论坛以及最后的闭幕式都有很多人坚持参加,大会内容的吸引力可见一斑。
今年大会再次回到北京,由中国科学院计算技术研究所承办,今年新增了讲习班、中文人机对话技术评测,还将论坛数由4个增加到了8个,大会吸引了600多人注册,创下SMP大会收费注册人数之最。
兴趣驱动是SMP的基石,清新、轻松、务实、守时是SMP的风格,SMP上的报告没有空泛的内容,更没有广告式的语言,参加SMP可以获得实实在在的收获,这是SMP不断发展壮大的重要原因。
雷锋网:本届大会参会人数有多少?参会人员成员比例大概多少?
沈华伟: 本届大会有600多人注册参加,实际参会人数约800人。参会人员以学术群体为主。约占70%(其中学生40%),企业和媒体参会人员约占25%。
雷锋网:本届活动赞助商有哪些?赞助经费大概有多少?接受赞助有哪些衡量标准?
沈华伟: 本届大会得到了企业的大力赞助。赞助分为四个级别:钻石赞助商、金牌赞助商、银牌赞助商和铜牌赞助商。本次会议的钻石赞助商是腾讯;金牌赞助商包括拓尔思、科大讯飞、三角兽、国双、微博;银牌赞助商是百度和今日头条;铜牌赞助商是知微数据和考拉新媒。本次会议的赞助经费也是SMP大会历届之最。
只要是在社会媒体处理领域开展工作的企业,相信自己可以通过赞助SMP获得收益,比如:提升企业品牌价值,扩大影响力,找到学术界合作伙伴,发现优秀人才等,就欢迎赞助SMP。
雷锋网 (公众号:雷锋网) :刘教授,根据您在开幕式上的介绍,大会已经或准备筹划的专业组有十多个。这些专业组是基于什么样的考虑成立的?和SMP大会属于什么样的关系?
刘挺: 目前专委会成立或筹划的专业组共有十多个,目前正式成立的专业组包括:情感分析专业组 (SMP-SENT)、计算传播学专业组 (SMP-CCC)、计算社会学专业组 (SMP-SOC)、数据挖掘专业组 (SMP-KDD)、表示学习专业组 (SMP-RL),此外今年有两个新的论坛分别由筹划中的智能教育专业组 (SMP-EDU)和智能金融专业组 (SMP-FINTECH)发起组织的。成立专业组,是希望专委会委员聚在一起组织小型论坛,研讨各个子领域的最新进展,同时专业组还会不定期地举办专业组活动,例如今年6月上旬在山西举办的情感分析专业组论坛和6月下旬在杭州举办的数据挖掘专业组论坛。从隶属关系来看,SMP大会和专业组都属于社会媒体处理专委会领导下的活动和分支组织。
雷锋网:看昨天微信朋友圈里大家给特邀嘉宾王伟老师过生日,特别有人情味;浏览过去几届大会的内容,也发现有很多老师历年来都参与到大会的组织和报告的第一线。相比国内别的计算机领域的大会,SMP是如何构建这个大家庭的?
唐杰: 社会媒体处理专委会是中国中文信息学会下属的专业委员会,从成立至今不到五年,专委会很年轻,但也同时充满活力,吸引了大量从事一线工作的学者。大会的第一天正好是美国加州大学洛杉矶分校(UCLA)王伟教授的生日,专委会给王教授买了生日蛋糕,并集体为王教授庆祝了生日。这体现了专委会以兴趣为基础、以友谊为纽带的风格。
雷锋网:SMP大会目前还有哪些不足?以后(例如下届)会有什么样的规划和改变?
刘挺: 专委会还比较年轻,在很多规则和制度方面还不够明确和完善,目前专委会正在积极努力一步步完善补充。SMP大会的多数代表来自计算机领域,我们未来会努力吸引更多来自社会科学领域的学者、学生参会。新的专业组正在酝酿,比如计算文化学、计算历史学等,计算技术进入到传统的人文学科中,会带来全新的视角,得到一些新颖有趣的研究结果。
雷锋网:目前大会无论是邀请来作报告的老师,还是参会的人员都是中国人(华人)。大会是否有计划走向国际化?
唐杰: 大会定位还是一个国内会议,暂时还没有走向国际化的计划,但大会积极开展和国际学者的交流与合作—计划每年的大会特邀讲者中都有来自国外的顶级学者参加,例如今年的特邀讲者就包括来自美国的王伟教授和来自港澳台的祝建华教授。此外,我们还邀请了腾讯AI Lab的张潼博士、和微软亚洲研究院副院长刘铁岩博士等,从特邀讲者和演讲内容来看,SMP大会是非常国际化的。
另外据雷锋网了解,第七届全国社会媒体处理大会(SMP 2018)将会于七、八月份间在凉爽的哈尔滨举办,想要了解社会科学在大数据、人工智能在影响下的巨变,一定不容错过。
。