从美国总统大选看大数据时代的数据新闻报道199it中文互联网数据 | 中文互联网数据研究资讯中心
数据新闻是在大数据时代兴起的一种跨学科、跨领域的新闻生产方式,它需要新的思维方式与多种能力的支撑。本文结合2012年美国总统大选报道,着重分析了英美各大主流媒体开展数据新闻报道的流程与特点。还探讨了社会化媒体对于数据新闻的推动作用,以及数据新闻的兴起与发展给新闻业者所带来的挑战。
在当前技术高速发展的信息化时代,信息(数据)规模的爆炸性增长是显著特征之一。从近年发展情况看,“大数据”主要被人们用来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。“大数据”具有规模大、价值高、交叉复用、全息可见等特征。当前对于“大数据”的关注与运用主要集中在IT业、市场营销、公共健康等领域,但事实上大数据的影响也波及到传媒业,数据新闻(Data Journalism)就是在大数据时代兴起的一种新的新闻生产方式。
数据新闻的报道流程
有关数据新闻的报道流程,不同的媒体与从业者进行了不同的概括、归纳。2010年8月,著名记者、数据驱动型新闻(data-driven journalism)项目负责人米尔科?洛伦兹提出了进行此类新闻报道的四个步骤,即挖掘数据—过滤数据—数据可视化—新闻报道制作完成。与此类似的是《卫报》的数据新闻编辑、数据博客Datablog负责人西蒙?罗格斯在《数据新闻分解步骤:在你见到的数据背后我们都做了什么》一文中的介绍。但他所展现的是一个多线程、全方位的报道流程:一方面处理数据,另一方面不断检验、质询数据的信度与价值,最后通过多种手段与渠道发布完成的报道。而伯明翰城市大学教授保罗?布拉德肖在《数据新闻的倒金字塔结构》中提出了如图所示的“双金字塔模型”(见图一),更全面地揭示了整个报道过程中,数据在质量以及传播上的变化。布拉德肖以倒金字塔来表示数据处理的过程,包括数据汇编、数据整理、了解数据和数据整合等四个部分。数据处理的最终目的是为了完成数据的可视化并实现有效传播。而数据新闻的传播则以“正金字塔结构”进行,包括了可视化、叙事化、社会化、人性化、个人订制化和使用等六个步骤。
事实上,不管是上述哪一种归纳,获取数据、处理数据、呈现数据都是数据新闻报道中不可或缺的三个阶段。本文结合英美主流媒体“2012年美国总统大选”的数据新闻报道来对这三个阶段进行解读。
1.多渠道获取海量数据。
数据新闻通常有两种方式:先有问题,然后根据问题寻找相关数据;或是从海量数据中发现、提出问题。无论采用哪种方式,海量数据都是数据新闻报道的基础。从业界实践来看,它主要包括从政府、企业、机构等公开的数据库中获取的二手数据和由媒体自行调查或抓取的一手数据。前者成本低廉且可靠程度高,是目前最主要的数据来源。以《卫报》“2012年美国总统大选专辑”数据新闻报道为例,在整个专辑的55篇报道中,不仅有与总统选举直接相关的选票数据、各州宣布选举结果的时间、竞选资金募集情况等内容,还涵盖了各种经济数据(如财政预算、债务、美国在对外战争中的花费)、美国人口基本统计特征数据以及各种社会数据等诸多相关背景资料。除了从政府公开的数据库中获得的二手数据之外,《卫报》还积极利用官方网站进行用户调查以获得一手数据。比如针对刚刚出炉的大选结果向全球用户征询意见,其后根据收到的用户态度反馈数据,专门制作了《奥巴马再次当选美国总统:全球民众的态度》动态数据地图。
2.全面谨慎地处理数据。
获取海量数据仅仅意味着数据新闻的开端。和其他信源一样,记者不应盲从,而需要对数据保留怀疑的态度。2011年度普利策调查性报道奖得主佩奇?约翰强调:所有的数据必须有来源,并经过交叉验证。面对海量数据,记者首先应评价数据的质量与意义,需要认真考察诸如:数据来源是否可靠,时效性如何,出于何种目的、采用什么方法收集而来,包含了怎样的主题,应选择哪些数据等一系列问题。其次,对数据进行处理,包括去除不必要的、干扰性的数据,清理其中的各种误差,并将来源纷杂、格式各异的数据转换为统一格式。最终确定需要计算和呈现的数据。值得注意的是,在报道中并非使用的数据越多,故事就能讲得越好,有时候凭借一个简单的数据就能完成一篇好新闻。在完成对数据的运算后,还需要检验其结果的合理性,如果有异于常理的话则需要重新运算。
3.多元创新地呈现数据。
能够对数据进行更准确的分析、更深层的解读和更明晰的呈现是数据新闻的独特优势。数据新闻通常运用可视化技术,以信息图表的形式发布。与文字报道相比,信息图表能够化繁为简,并兼具形象化与趣味性,尤其适用于表达数据与地理、时间信息。它可以提示新闻要点、解析事件进程、揭示各类关系、展现分布状态等等。信息图表更符合视觉传播时代用户的习惯与偏好。从目前发展趋势看,除了一般的静态信息图表之外,交互式信息图表(Interactive Infographic)和动态信息图表(Motion Graphic)在数据新闻中的应用也日渐增多。如《华尔街日报》制作的《2012年美国总统大选投票结果》报道就是在美国地图上以红蓝两色分别代表了民主党与共和党,其力量对比一目了然。而且当用户将鼠标移到某一州所在的位置时,地图上就会立刻出现该州的投票数据,非常直观清晰。和静态图表相比,交互式图表能够通过一个简洁界面向用户传递大量信息。这种呈现形式更具个性化和参与性,可以由用户自行点选所关心的内容进行了解,而不只是简单地推送信息。除了在信息图表中运用文字、图形、图表、动画之外,有的媒体还创新性地引入了视频,从而有效拓宽了数据新闻的呈现形式。如美国国家公共广播网(NPR)对全美各州的总统大选资金使用情况进行了梳理、统计,将这些带有地理位置信息的数据加以整合,并以视频的形式进行了直观生动的展?示。
数据新闻的推手与挑战
社会化媒体的兴盛给新闻生产与消费模式带来了巨大冲击。在社会化媒体与专业媒体融合的大趋势下,借助互联网,数据新闻搭上了社会化的快车。社会化媒体对数据新闻的助力主要表现在两个方面:首先,社会化媒体是数据的重要来源之一。社会化媒体可谓是数据的“富矿”,记者可以从其上抓取数据,也可以通过它展开调查获取一手数据。其次,专业媒体完成的报道可以经由社会化媒体分享、传播并进一步扩大其影响。《卫报》“2012美国总统大选专辑”中有多篇报道就是通过抓取、分析Twitter上的信息制作而成。如《奥巴马在推特上赢得了大选》就是通过分析在Twitter上抓取的关键词:奥巴马、罗姆尼、瑞恩、拜登等,来预测大选的结果。在大选结果公布之后,《卫报》还运用大选当天Twitter用户主动发布的个人投票结果来统计用户对于奥巴马再次当选的态度,并根据所获取的一手数据进行了视频报道。该视频于大选结束的次日上传到Youtube,仅仅3天点击量就已经超过2000人次。同时,《卫报》也将社会化媒体视为传播其新闻报道的重要渠道之一,该专辑中的每一篇报道都设置有按钮,以方便用户在浏览时将其一键式分享到Facebook、Twitter、Google+和LinkedIn开发的In share等多个平台。事实上,通过对于社交化的强调,可以让更多的用户参与到数据新闻的制作与传播中来,而个性化与社会化相结合的战略也正是此类新闻未来的发展方向。
数据新闻报道是一个综合、系统的过程,它需要新的思维方式与多种能力的支撑。其中,处理数据和设计、制作、发布信息图表的能力对于新闻业者的挑战尤为明显,而对于这些能力的培养也应该成为新闻教育未来的方向和重点之一。