大数据时代计算社会科学的起源、嬗变与创新范式
摘要: 大数据时代的到来,既向传统的学科分野及其方法论范式提出挑战,又为新学科发展及范式突破准备了基础条件。作为前沿交叉学科,“计算社会科学”指称了社会科学在大数据时代所呈现出的新发展、新路径和新范式。计算社会科学既是大数据时代科技进步、数据爆炸和方法创新的产物,又是社会科学长久以来的计算传统知识积累的成果,致力于应用数据思维、数据资源和数据分析学以研究人类社会行为和社会运行规律等。近年来计算社会科学的发展使新学科成为现实,这种学科创新体现为围绕着数据驱动和算法驱动采取不同融合方式的一系列“问题解决性、应用导向”多元化进路,推动着社会科学范式转换。
关键词: 大数据,计算社会科学,范式转换,方法论
伴随着社会科学迈入“大数据”时代,人类社会活动从未像现在这样被充分地数字化和网络化表达。个人和群体的行为通过数据得以记录,而通过分析数据、反复演示和实验能发现社会规律。大数据时代的到来,既向传统的学科分野及其方法论范式提出了挑战,又为新学科发展及其方法论突破准备了条件。“计算社会科学”概括了社会科学在大数据时代所呈现出的新发展、新路径和新范式。它是大数据时代的产物,是为了更好地理解大数据时代人类社会经济生活,且受到大数据驱动实现了海量数据资源和多元化大数据方法与社会科学特定领域结合的成果。计算社会科学以“计算”为核心,通过将研究对象充分数字化、网络化延伸了人类器官的感知功能,拓宽了思维视野,有利于多学科协同发展和知识创新,已经显现出独特魅力。计算社会科学涉及社会科学长久以来的计算传统,包括社会科学各个学科领域量化和统计分析、模拟方法和实验方法等方法论积累。本文将系统阐述计算社会科学的起源史,并探讨学科发展从“分化”走向“整合”的多学科进路等特征,探讨计算社会科学所推动的范式转换,以及关键性方法论创新。
一、计算社会科学的起源与发展
尽管计算社会科学这一时新名词容易夸大其与传统社会科学的联系。然而,计算社会科学正是在对传统社会科学之继承和发展的过程中逐步形成的,亦立基于社会科学各学科长久以来的计算传统及其知识沉淀,包括质性分析和量化分析等方法论的知识积累。回顾计算社会科学的起源史有助于我们深刻把握计算社会科学的主要特征。
(一)计算社会科学的“史前史”:社会研究与计算技术的学科发展
倘以Lazer等人发表《计算社会科学》一文划界,那么,从18世纪末到21世纪初这一漫长时段的社会科学发展历程差可看作是计算社会科学的“史前史”阶段。从计算社会科学的发展脉络来看,这一“史前史”阶段的意义在于,它从基础理论、专业知识、技术方法上为计算社会科学的诞生奠定了坚实的基石。更确切地讲,社会科学自脱离“社会哲学”而成为日益壮大的学科门类统称以来,其追寻自然科学的模式以探求社会规律的学术努力始终未曾中断。社会科学早期大师涂尔干就开始广泛使用统计学思维和大量数据分析已探究自杀之社会规律。尤其值得注意的是,17世纪中叶政治算术(Political Arithmetick)学派在英国创生,威廉·配第明确提出要用“数字、重量和尺度的词汇”来描述英国的社会经济状况,这也标志着现代统计学的诞生。同期在德国形成了所谓的“国势学派”,这个学派所使用的statistik一词,后来英译为statistics即成为“统计学”的冠名。统计学的发展史,无疑突显了统计学之于治国理政、社会分析等社会科学应用的时代贡献。美国著名学者斯蒂格勒认为,统计学史的首要论题是概念性问题,涉及经济学、政治学和社会学等学科对于社会统计数据的解读。而劳进一步指出,统计学从最初收集、汇编数据而为行政管理服务,最终发展成为有一整套原理和研究方法的独立学科,而那些具有深刻洞识的理论往往是从一些非常简单实际的问题中发展起来并赢得共识的,进而影响了其他学科。总之,统计学发展史的考察充分说明社会科学研究具有深远的计算传统。
(二)计算社会科学的“前身”:关于定量社会科学的阐述
计算社会科学固然是计算机和信息技术的发展进入大数据时代的产物,但就学科发展脉络而言,计算社会科学无疑与定量社会科学(Quantitative Social Sciences)有着深厚的渊源。按照哈佛大学定量社会科学研究所主任、著名方法论学者加里·金(Gary King)的解释,定量社会科学不仅是指长期以来社会科学发展历程中相对于质化研究而言的量化研究方法,而且是经历了近十年的突破发展而引发当代社会科学转型的一股浪潮。他认为“我们的确正在起航。不过,在庞大的新数据来源的支持下,量化的前进步伐将会踏遍学术、商业和政府领域。没有一个领域不被触及。”
定量社会科学从经济学起源,在半个世纪之内逐步扩展到社会科学各领域,极大地推动了社会科学方法论及理论知识的发展。经济学无疑是在定量社会科学道路上起步最早而且走得最远的学科。早在1926年,挪威经济学家弗里希(R. Frisch)便仿照“生物计量学”一词提出了“计量经济学”(Econometrics);1930年国际计量经济学学会成立,并在三年后创办了《计量经济学》杂志。计量经济学突破了经济学以往大多只能进行定性研究的局限,以数学方法和数理统计学为方法论基础,对于经济问题展开定量分析。保罗·萨缪尔森的《经济分析基础》更加全面地对数学方法在经济学的应用做出了系统性的说明,从而使经济学从以往的自然语言表达和图解式分析解脱出来而转变为用现代数理经济分析方法进行分析和表达,由此创立的“数理经济学”成为经济学中的显学。伴随着经济学研究方法的成熟以及研究范围的扩展,包括政治学、社会学、教育学、新闻传播学等学科在内的社会科学主流学科均受到了深刻而持续的影响。
心理学在定量社会科学的发展史上占据了独特的地位。心理学行为主义学派创始人约翰·华生撰写了《行为主义者心目中的心理学》、《行为主义》等系列著作,广泛宣传他的行为主义观点。这些著作不仅系统论述了行为主义心理学,而且扩展论说了行为主义社会科学的理论基础。在他看来,社会科学研究的对象不是意识而是行为,因而社会科学应当关注行为与环境之间的关系,社会科学的研究方法必须抛弃传统的内省法,而代之以自然科学常用的实验法和观察法。在行为主义心理学的影响下,整个社会科学发生了1950年代的“行为主义革命”。在这一波次的学科转型中,政治学、社会学和教育学首当其冲,接续发生了方法论意义上的创新。在政治学领域,“行为主义革命”既反对传统政治哲学研究中抽象思辨和演绎的方法,也反对旧制度主义的静态描述,主张将政治科学研究的对象锁定到实际存在的、可观察到的政治行为;为此,又强调政治数据的收集和整理,并要求在进行价值中立的同时,在现象和数据允许的范围内使用统计学、形式模型、计算机模拟等开展研究,从而达到对政治行为的解释、预测和控制。
基于社会科学研究范式的上述转型,巴比于1975年出版了《社会研究方法》一书,集成了当时已经达成相当共识的社会科学方法论知识,对于定量社会科学做出系统化的论说。时隔近20年之后,加里·金、罗伯特·基欧汉和悉尼·维巴合著的《社会科学中的研究设计》试图超越量化研究与质性研究的长期对立与冲突,通过对社会科学实证推论层次上的论述而建构出适用于整个社会科学的研究架构。至此,定量社会科学的发展达到了成熟形态,并且伴随着计算机技术和信息技术的发展而进入了新的发展阶段。正是在回顾这一时期的定量社会科学发展历程时,加里·金认为,定量社会科学至今影响的范围广泛,重塑了世界500强公司的经营策略;建立新兴产业;大幅度提高人类的表现能力;改变医药、人际网络、政治宣传、公共卫生、立法、治安、经济、运动、公共政策、商业与项目评估等。定量社会科学走向主流地位和逻辑统合的发展趋势为计算社会科学立奠定了坚实的方法论和技术基础。
(三)计算社会科学的创生:关于新兴学科本体论的探讨
20世纪后半叶以来,社会科学发展的趋势正是研究者自发地使用海量数据开展以纯理论或应用为目的研究。早在1972年,兰德公司就建立了“兰德恐怖主义年鉴”数据库,为美国政府提供政策咨询。在预测系统方面,基于QJMA方法的TNDM模型也在20世纪70年代诞生并扩展应用。这些都属于计算社会科学的早期探索。2009年,Lazer等人第一次正式提出了计算社会科学的概念,概括了计算社会科学的出现及其发展,强调了网络科学研究在其中所扮演的角色和数字化媒体所提供的机遇。从那时以来,有关计算社会科学的研究得到了学术界广泛关注,并且产生了大量的研究成果。
早在Lazer之前,关于科学发展进入全新阶段的讨论即已初显端倪。著名学者、1998年图灵奖得主、关系数据库的鼻祖Jim Gray早在2006年即发表了题为。《第四范式:数据密集型科学发现》的公开演讲。Gary认为,人类社会的科学发展先后经历了四种“范式”:早起科学以记录和描述自然现象为主,可称为“实验科学”即第一范式,其典型案例如钻木取火;文艺复兴以来,科学家们开始利用模型归纳总结过去记录的现象,发展出“理论科学”即第二范式,其典型案例如牛顿三定律、相对论等;过去数十年间,计算机的出现,催生了“计算科学”即第三范式,可以对复杂现象进行模拟仿真,推演出越来越多复杂的现象,其典型案例如模拟核试验;而大数据时代科学的发展趋势是,随着数据量的高速增长,计算机将不仅仅能做模拟仿真,还能对海量数据进行分析总结,进而得到发现规律,称为所谓的“数据密集型科学”即第四范式。Gary关于第四范式的论说给世人留下了极其深刻的启发,事实表明大数据、人工智能等技术革新无一不印证了Gary的预言。
由英国eScience计划前首席科学家Tony Hey等人编著的《第四种范式》一书于2009年正式出版。在Gary首倡的“第四种范式”框架下,此书进一步论述了数据驱动型科学研究的发展动态,系统介绍了地球与环境科学、生命与健康科学、数字信息基础设施和数字化学术信息交流等方面基于海量数据的科研活动、过程、方法和基础设施,生动揭示了在海量数据和无处不在网络上发展起来的与实验科学、理论推演、计算机仿真这三种科研范式相辅相成的科学研究第四范式——数据密集型科学;强调在未来的科学研究和技术应用方面,要更多地利用数据,要在科研领域发展并推广数据采集、数据存储、数据传输、云计算、数据可视化、科研信息搜索等方面的技术;要促进数据和科研成果的分享和更加广泛的使用,因此,要促进研究者之间的新型合作,这将是一种大规模的、跨学科的、高频率的合作。
二、计算社会科学的嬗变:从分化到整合
2009年Lazer等人发表《计算社会科学》,标志着计算社会科学的诞生。计算社会科学是以大数据及其相关技术的应用为背景的。在这里,“大数据”可以从两个层面加以定义。狭义的“大数据”是指体量异常庞大、结构复杂,以至于传统数据处理方法难以应对的数据集。人们通常用“5V”或“6C”来加以概括。而广义的“大数据”则不仅指海量数据,还包括获取、传输、存储、挖掘、分析和应用海量数据的一系列方法、技术和模式,后者通常被称为“大数据分析学”(Big DataAnalytics)。
2012年,由来自意大利国家科研委员会的R. Conte领衔,来自欧美国家的14位学者又在《欧洲物理学刊.专号》(第1期)发表了《计算社会科学宣言》。这篇《宣言》从时代机遇、技术发展、方法创新、当下挑战和预期影响等五个方面全景式地说明了计算社会科学发展现状及其未来的前景。《宣言》强调,当下时代社会科学将经历一个巨大的范式转变。与实验方法相结合的计算方法,将使社会科学更接近于建立理论、经验事实和研究之间的良好连接。同时,计算社会科学的影响还将更加广泛,其提供的新方法会适用于任何以大数据为资料的研究,因此,计算社会科学可以通过大数据分析模拟研究改善管理,增进政策决策与评估的科学性,从而推动经济的增长。还将在有关社会项目中发挥主导作用,因为计算社会科学可以对全球范围内的社会进程进行建模和模拟,进而充分理解与今日世界相关联的、极其复杂的远距离间的相互关系,并用于支持政策制定者的决策,使他们可以有效识别社会发展的最佳路径。最后,计算社会科学的开放性还将极大地提高公民在这一决策过程中的参与程度。这些发展将会开启一个更安全、更可持续和更公平的全球社会。概言之,从Gary的《第四范式》,经由Lazer等人的《计算社会科学》,再到Conte等人《计算社会科学宣言》,这些研究成果对计算社会科学给出了高屋建瓴般的论说。
与这些全景式的论证相媲美的是,有关社会科学分支学科的“计算化”进路的探索早在上世纪即可开启,并未计算社会科学的构建奠定了领域基础。在对于计算机技术有着特殊敏感性的经济学领域,早在1996年就出版了《计算经济学手册》,对应用计算机技术开展经济学研究进行了集中评价。2006年和2014年,《计算经济学手册》又先后推出了第二卷和第三卷,持续跟踪计算经济学的前沿发展动态。而1988年创刊的《经济管理中的计算机科学》在2000年后正式改名为《计算经济学》,涉及从宏观经济学、微观经济学、决策理论、预测理论等方面的发展状况。在政治学领域,尽管尚未有“计算政治学”的统一用语,但政治学量化研究在竞选、议会政治、政治传播等领域较早引入机器学习、非结构化数据挖掘和大规模社会实验等研究方法。例如,奥地利人工智能研究所所长Trappl领衔于2005年出版了《为和平编码:国际争端解决与干预的计算机辅助方法》,从统计建模技术介绍了计算社会科学方法在基于案例之上的辅助决策、冲突预测、打击犯罪、危机预警等方面的应用。在社会学领域,长期从事社会模拟的Michael W. Macy于2002年发表《从要素到行动者:计算社会学与行为者模型化》,首次提出“计算社会学”概念。计算社会学是广泛应用计算机技术研究、认知和理解社会现象的社会学分支,包括计算机模拟、人工智能、复杂统计方法、社会网络分析技术等在内的多种手段和工具,通过对多样化社会互动的基础建模方式而提出并检验了关于复杂社会进程的多种理论发现。
此外,计算社会科学还广泛应用于更多的跨学科研究,包括“计算新闻学”、“计算语言学”、“计算犯罪学”、“计量分类学”以及“计算创新”等范畴,均有极其重要的研究进展。同样,在人文学科领域,包括“计算史学”、“计算法学”等分支学科,长期的研究积累加之以现代计算技术的辅助,也产出了大量令人瞩目的研究成果。2016年,R. Michael Alvarez编著的《计算社会科学:发现与预测》全面回顾和概括了计算社会科学的发展状况,发现计算社会科学拥有丰富的工具箱,并广泛应用于社交媒体、抗争运动、议会表决、新型政党组建、政府治理以及社会营销学等领域。
三、计算社会科学的多学科进路:数据驱动与算法驱动
在当前的大数据背景下,计算社会科学更多地是以“大数据+”的形式出现,因而相应产生了大数据社会学、大数据政治学等学科领域。但在具体的分支学科领域,“计算化”的发展和成熟程度存在着明显的差异,这既与分支学科的历史积累有关,又与学科知识的实际应用偏好有关。然而,值得注意的是,作为计算社会科学的分支,它们的知识发展同样受到“双重驱动”的关键影响。一是“数据驱动”,即学科在何种程度上利用了本领域产生的数据;二是“算法驱动”,即学科在何种程度上发展了适合自身需要的算法和模型。就此而论,具体的学科领域之于相关社会生活领域的宽狭大小、相关社会生活领域的“数字化生存”程度高低以及数据生成能力的大小和数据密集程度的高低,作为外部主体的体量会严重限定具体学科受到“数据驱动”的压力大小。而具体的学科领域在其前期发展所积累的量化知识总量、计算能力的高低乃至于与其他计算学科的共享融合水平,作为主体的内生变量会严重影响其“算法驱动”的强度。
大数据经济学则既受益于数据驱动又归功于算法驱动,其主要分支包括大数据宏观经济研究、大数据金融学、大数据经济心理学等。刘涛雄等认为,大数据时代极大地拓宽了信息来源、提高了获取信息的时效性,而新数据的非结构化特征对宏观经济分析的技术和方法提出了新要求。大数据语境下,数据噪声会影响数据质量,因而宏观经济数据挖掘变得十分重要,这就要改进数据挖掘技术,加强对非结构化和半结构化数据的挖掘。实时、快速、海量的数据为更加准确的宏观经济预测提供了可能。此外,机器学习与宏观经济分析方法的结合可以有效解决“维数灾难”,提高宏观经济分析的准确性。大数据影响着政府经济政策制定和评估的变革,进而提升政策的时效性和服务效率。刘志洋、汤珂认为,大数据时代信息产生和传递的速度空前加快,如互联网上的大量信息是实时的,移动互联网和物联网使每个人随时随地都可能制造数据,这导致经济模型可以充分利用数据的实时性,提高分析或预测的时效性,为经济预警和政策制定提供最快速的资料和依据。简言之,大数据带来经济分析的方法论变革,随着信息量的极大拓展和处理信息能力的提高,经济分析可能从样本统计时代走向总体普查时代。此外,复杂经济系统中,充分利用多元要素之间的相关关系对于经济预测、政策制定与评估的作用,为经济分析提供了新机遇。
大数据政治学主要应用大数据分析学和海量数据资源探究新信息时代的政治现象。孟天广等认为,大数据不仅将政治场域从物理空间扩展到虚拟空间,为政府、公民、企业等行为主体的创造新的互动空间和模式,重塑各主体间的关系模式。大数据在政治领域的影响力主要通过两种机制来体现:一方面,大数据作为一种创新制度推动着更开放、更高效和更智能的治理制度的建设,为政治行为和政策过程创造了新型平台;另一方面,大数据所生产并传播的丰富信息突破了传统上政治信息传播和发挥影响的时间和空间限制,信息日益成为政治表达、政治互动、政策决策与制度运行的关键要素,进而推动着治理制度及其现实运作的变化。此外,大数据政治学对数据分析学的依赖取决于政治学研究的方法传统,与政治学量化传统不同,大数据为政治学研究提供了诸如文本、图片、视频等定性研究素材,而数据分析学作为嫁接定性研究和定量研究的桥梁,为定性资料的定量分析、定量分析的定性阐释提供了可行性。大数据方法一定程度上可以穿透政治现象的复杂性和特殊性,为中国政治的研究者带来深刻而丰富的洞见,并为其理论提供更强大的说服力。
计算社会学是一门数据驱动的、以数据密集化为特征的交叉学科,其研究和应用的范围十分广泛。其发展大致受到四种相互区别的议题的共同作用:一是传统议题与新兴议题。计算社会学一方面着眼于利用新数据新技术来应对人类世界出现的新问题新挑战;另一方面又致力于以全新方式和全新视角重构和解读社会学研究的经典概念,包括阶层/阶级、社会流动、社会观念等。二是主体性与群体性。计算社会学的灵活性和适应性有助于从点到面地对人与群体的互动展开研究,既着眼于个人行为属性分析的基础性地位,又强调社会关系、社会网络及群体特征分析的宏观架构。三是外部条件性与内部动力性。计算社会学一方面强调社会生活中信息规律和制度演变等外部条件的探讨,如由信息内容分布的解析到话题发现和言论传播;另一方面又关注此类外部条件与人类个体心灵之间相互作用、相互影响的关系。四是独立性与交互性:计算社会学一方面通过对范式和话语体系的重构来为以往社会学研究中的模糊概念“划界”,另一方面由强调不同概念及不同概念所代表的社会现实之间的交互性,着重探讨个体的倾向性、可信度和影响力等属性对外界条件的响应模式、传导机理和交互适应性,以及关系网络演变。
相较于传统心理学,大数据心理学具有新的研究对象和研究范式。心理学长期关注心理过程和行为,传统心理学采用大量的行为实验来探究心理现象。彭凯平等认为,大数据时代数据就是行为,即大数据记录的信息实际上就是普遍化的人类行为,而且被数据记录的行为具有自愿化特征,是自然发生的,反映人自觉自愿的行为。与传统数据相比,大数据的产生并非有意采集或生产,大多是自觉自愿的真实社会实践记录。这与传统实验研究采取现金激励或课程激励等方式招募被试存在重要区别,然而却更接近社会现实。在研究范式方面,心理学强调研究的可重复性、可比较性和标准化,而大数据的行为数据为可复制、可比较地开展研究提供了数据和算法条件。此外,与大数据相关的新兴技术的快速发展与应用(如物联网、云计算、可穿戴设备、人工智能、增强/虚拟现实等)催生了新的管理和商业模式、新兴产业,为社会经济生活注入了新活力,极大地丰富和拓展了大数据在管理科学、法学、传播学、人文学科等领域的创新应用,为学术界、产业界以及政府部门的知识需求和交流带来新模式。
四、结语:大数据时代社会科学研究的范式转换
社会科学的范式发展经历了宏大理论时期、行为主义时期、后行为主义时期和计算社会科学时期。早期的社会科学以宏大理论的提出和对社会现象的结构化-反思化分析为主,其典型代表即是帕森斯的社会结构理论。宏大理论提供丰富视角的同时也因其“理论垄断”性质而引发了学界的不满,以假设-检验为主要研究模式的行为主义范式日渐发展起来。行为主义的壮大得益于知识需求、量化方法和本体论三个因素。在知识需求方面,20世纪上半叶意识形态的分化、阶级和种族冲突、经济政治制度的变革、国际格局的深刻调整,引发了社会对社会知识的高度关注,譬如美国为适应冷战需要而对相关研究注入了强大推动力,而同期量化方法和社会科学本体论的发展为社会现象或行为的科学化研究提供了方法论支撑。后行为主义是在行为主义与以后现代主义为代表的新理论的论争的过程中产生的。它一方面承认行为主义的固有缺陷,另一方面又反对后现代主义等理论视角反科学主义、反客观主义和反叙事主义的态度。后行为主义在学科范式上对行为主义的改良并非是革命性的。
从科学哲学的角度看,计算科学的发展历程向我们呈现了一个科学范式发生转化的生动例证。近年来学界讨论计算社会科学革命声音不断增加。库恩认为任何科学的发展都要经过一个相同的历程:前科学—常规科学—危机—革命—新的常规科学—新的危机—新的革命,这个过程循环往复不断进行,推动科学不断进步。在常规科学阶段,为科学家共同体所公认并用以指导其研究工作的统摄性理论框架或科学研究视角形成,科学共同体中的科学家运用相同的范式去解决该领域中的科学难题。当常规科学发展到一定时候,科学家会遇到既有范式无法解决的反常问题,使得人们开始对范式失去信心,于是“危机”出现。在这种情况下,为了解决反常问题,有人会提出新的范式。如果新的范式被科学家共同体广泛接受,科学革命便发生。因此,所谓科学革命,就是一种新的科学范式取代原有范式的过程。一般而言,一种新的范式不可能立即取代原有的范式,总要经过或长或短时间的争论乃至斗争。
计算社会科学是建立在社会科学量化分析的本体论和多元化技术积累上基础的。计算社会科学尽管更为强调数据、模型、算法等“计算”维度,但它确实可被视为行为主义与以后现代主义为代表的新理论的某种妥协和融合。首先,计算社会科学承认个体或群体层面的人类行为具有某些用行为主义的研究范式难以觉察并加以研究的因素,但其处理方法,则是将此类因素分为潜变量和显变量,尽管有些因素确实是难以直接测量和观察的,但它们可被视为影响行为的潜变量,并因为可以用其作为其外在表征的显变量来呈现和测量。其次,计算社会科学承认人类行为的复杂性,认为抽象模型和变量不足以反映社会现象,但在处理方法则是将大量变量纳入分析中,变量的丰富性及变量间的复杂关系无疑超出了任何人类研究者进行纯粹定性研究的研究能力。从这个意义上讲,尽管人们将计算科学与“数据驱动”“计算”等概念联系在一起,但是计算社会科学的学科范式确实是以上各种范式相互竞争、相互启发、相互融合的结果。李强认为,物质生产形态的变化、科学技术条件的进步及至知识创新范式的转换是社会科学范式转换的重要成因。因为上述三者既影响人类社会的组织和生活方式,更影响解释或理解人类社会的基本假设和研究范式。计算社会科学即是社会科学定性-定量传统、相关-因果传统、社会科学与自然科学竞争与融合的产物,而技术进步、学科间融合、新数据分析技术的应用、新的商业和组织环境正在加速推动这种范式转换。现有研究逐步表明,计算社会科学会引发社会科学的一场革命,即社会科学的计算路径有潜力为社会科学共同体接受,从而补充既有范式或成为一种在社会科学研究中有竞争力的研究范式。
社会科学的发展史已经证明,一门新兴学科的兴起是多种条件共同作用的结果。具体到计算社会科学而言,实际就是社会科学领域知识、现实经济社会发展需要、数据收集及分析技术、网络与计算基础设施、算法模型等方面发展共同促成的产物。计算社会科学的发展史已经显示,不同要素之间不仅具有外在联系,而且也具有内在联系,往往一种要素并不会“等待”其它要素的改变以形成新学科,而是会主动促成其它要素的改变。计算社会科学使用海量数据为基础,服务于日益兴盛的社会经济需求,而与海量数据分析相应的并行计算、多元算法和硬件条件几乎是在很短的时间内完成整合的。近两年来,计算社会科学的发展逐步使新学科的形成成为现实,这种学科创新将体现为围绕着数据驱动和算法驱动采取不同融合方式而形成的一系列“问题解决性、应用导向”研究领域。
当然,大数据时代,熟谙计算技术的社会科学家能够以前所未有的工具和手段借助自然科学的“实验—理论—验证”的范式研究社会现象,这是社会科学当代发展的必然。然而,个体行动者的个殊差异、相互交往和网络关系的异常复杂且日益加剧,数据获取和处理的困难,以及研究对象的数据隐私及其伦理接点,加以于计算思维在社会科学研究中的应用还处在初始起步阶段,观念的滞后、理论的零散、方向的模糊、多学科背景的综合人才极度缺乏、原有学科框架的知识制约,也会成为计算社会科学发展的障碍。因此,计算社会科学的发展仍需要有更多同道同志者的共同努力。
作者: 张小劲(清华大学社会科学学院政治学系教授,主要研究政治学理论与方法、中国政府与政治)
孟天广(清华大学社会科学学院政治学系副教授,主要研究中国政府与政治、政治学研究方法)
责任编辑:陈近梅