《数据新闻大趋势》:数据新闻将成为主流?《卫报》“数据博客”栏目前主编的经验和回答
数据新闻(datajournalism),又称数据驱动新闻(data driven journalism)。它指的是对数据进行分析与过滤,从而创作出新闻报道的方式。数据新闻正逐渐成为一种主流的新闻报道方式,它引领着一场信息透明化的全新运动。近年来国际知名媒体《纽约时报》《卫报》《经济学人》、英国广播公司等纷纷推出了自己的数据新闻作品。
在诸多较早投身数据新闻实践的媒体中,英国的《卫报》成绩斐然。2006年6月13日,《卫报》宣布了“网络优先”的报道策略,要求所有的稿件先在网络上发布,然后才在纸质版本上登出。2009年《卫报》开创了 “数据博客” ,可谓数据新闻发展的一个里程碑。
这个《卫报》网站上的独特栏目从2009年1月14日上线至2013年5月,共制作各类数据新闻2500多则。涵盖政治、经济、体育、战争、灾难、环境、文化、时尚、科技、健康等不同领域,采取的形式有图表、地图以及各种互动效果图,数据类型既有量化数据也有质性数据,还有两者兼顾的混合数据。
读点今天推荐的《数据新闻大趋势》一书,其作者 西蒙·罗杰斯 正是“数据博客”和 “数据仓库” 的前任主编、《卫报》新闻编辑, 他曾发动读者用“众包”的方式分析了45万条英国国会议员开支记录,以及阿富汗和伊拉克维基解密战争日志等。现任谷歌趋势数据主编分析师(Trend Data Editor)。
在以下的独家样章中,西蒙·罗杰斯回答了为何如今开放数据新闻如此重要,并给出了做开放数据新闻的十条经验:
为什么需要开放数据新闻
据无处不在:对于政府来说,它发布的量级越来越大,已经达到了几十亿BT;对视觉艺术家来说,它是一种定义世界的新方式;对企业而言,它意味着创造价值的新商机。
免费工具的出现,打破了数据分析、数据可视化和数据展示的技术壁垒,使之不再是少数人的专利。因此,想要当一名数据新闻记者不是什么难事,门槛从来没有像现在这样低。真的,每个人都能做到。
与此同时,新闻传媒行业内部也正发生着变革。多年前,想要成为一家主流新闻机构的记者,摆在面前的路只有一条,必须要经过数年的专业学习和一线实习。若想一举成名天下知,那还得埋头苦干、坐多年的冷板凳。
而现在,一切都变了。新闻记者那些与世隔绝、足不出户也能写就一篇好报道的日子,已经一去不复返。
这是开放新闻的时代,记者借助网络的力量可以做出更优质、更有影响力的好报道。对开放新闻来说,它的读者和评论者是开放的,它的原始作者也是开放的,就连决定和影响新闻最终呈现的客观事实也是开放的。
可这些和数据新闻是什么关系呢?开放新闻和数据新闻从根本上说都是开放的,它们就像是一个饼图中的两个部分,可能大小不一,但都有着共同的属性。数据新闻的开放,不仅需要有更多人参与到制作过程中来,它还需要和受众打成一片,只有这样才能引领一波新的潮流。
数据新闻的题中之意不(仅仅)是开启民智、向世人炫耀你的聪明才智,它的作用绝不仅限于此。
数据新闻的重要意义体现在,公共数据是它的来源与核心。 2009年,data.gov网站上线,且不论它做的好与坏,其理念还是值得肯定的:所有的政府数据必须公开,并且以可使用的格式提供下载。从那时起,开放数据概念传遍全球。小到市级政府,大到州政府和地区当局,他们都开始了数据发布工作,内容从犯罪统计详情到公共厕所位置信息,无所不包。
但是,开放数据门户网站的出现,并不意味着你就自然而然地有了一个自由天堂。现在巴林和沙特阿拉伯也都有了各自的开放数据门户网站,但你能说它们自由吗?大卫·伊夫斯 (David Eaves)曾在《石板》(Slate)①杂志上发表过一篇具有先见之明的文章,文中写道:“很多人都在为自己争取获得和使用政府公开信息的权力,这既容易从中尝到甜头、旗开得胜,也容易处处碰壁、偃旗息鼓。似乎这些数据就是手中的枪支炮弹,让我们更加坚信技术乌托邦者所说的‘开放数据将从根本上改变政治,使议题的讨论去政治化,使执政中的不作为逐渐消失’。但这些,都是秕言谬说。”
将数据公诸于众、对数据孜孜以求,通过测试来检验数据的精确性,还可以把它和其他数据集混合处理,来发现新闻背后的新闻。这就是数据新闻的魅力所在。
不同于新闻当事人的言辞和采访对象的论说,一直以来,记者都视数据为最可靠的消息来源。再加上数据的来之不易,就更会对它们笃信不疑。不过,数据也极易出错。前BBC记者迈克尔·布拉斯兰德(Michael Blastland)在报道2008年爆发的诺如病毒疫情时,就发现了这个问题。
当时有消息说,上一年共有300万人感染了此病毒。但迈克尔仔细查看置信区间(一种显示数字是否可靠的指标)后发现,选取不同的区间,其结果也会有天壤之别:感染人数可以少至28万,也可以多达3 400万。虽然谁也不知道真实数据是多少,但这条不准确的新闻早已传播出去了。
还有一些年代比较久远的记者,他们也采用数据进行报道,其中不得不提的就是美国记者菲利普·梅耶(Philip Meyer),他在1967年做的底特律骚乱事件调查报道,给了我们很多启发(“解读伦敦骚乱”数据新闻策划正源于此)。当年,他使用的是问卷调查数据和计算机,于是也催生出了一种新的报道方式——计算机辅助报道。
如今,这种报道形式已不再是少数人的专利。世界上关心数据的人也越来越多,比如我们的受众。《卫报》“数据博客”每个月的点击量有上百万,可以说,这些受众绝大多都是对数据感兴趣的人,他们不再局限于编程开发者、设计师,或是新闻记者。他们想知道一篇报道可信与否,想看看记者是不是在说实话,有的时候还想从中找出点儿什么来,于是,他们需要数据。
术业有专攻,每位读者都有自己最擅长的领域,和他们携手合作就会产生意想不到的结果。例如,读者就帮我们改进了数据可视化地图,让它的颜色搭配更加科学美观。
然而,现在仍有大量的数据没有发布,我们正好就充当了数据开放进程的加速器。在以往的新闻报道和交互式新闻作品中,数据只是会被顺便提及,看不到它的庐山真面目。这种新闻一出来好像就是在说:“看,我们的报道做得多棒,全方位、多角度,面面俱到、无所不包。感谢收看,再见!”
在做一些全国性重大事件和国际事件的数据新闻时,很多媒体青睐华而不实地展示信息,但原始数据往往秘而不宣,不允许受众下载以供验明真伪。
一个最典型的例子就是大选报道。如果想要获得及时的、详尽的选举数据,那必须得通过付费渠道才行。即使是这样,也不能实现即刻下载。再有就是奥运会时的赛事结果数据,它可能会在运动员获得金牌时,在电视屏幕上一闪而过,但你能指望通过这样的方式获取原始数据吗?更别谈进行分析和数据可视化了。
虽然新闻机构都热衷于数据开放运动,可一旦涉及商业利益,他们也会和那些极力“关闭”数据者串通一气,把数据锁进保险箱,直到它不再值钱的那一刻。尽管他们每天都在呼吁政府打开数据宝库的大门,可是,如果连新闻机构自己都不愿开放,这还有什么用?
开放数据视受众为重要组成部分,同样,受众也是开放数据新闻中不可或缺的角色。通过发布数据,让它唾手可得、易于使用、人人共享,新闻业也会因此而瞬间如虎添翼、锦上添花。开放数据新闻应该如何做?
以下是我们总结出的十条经验:
1、将新闻背后的数据公诸于众
最好的新闻报道是什么样的?它往往出来得恰逢其时,能为我们揭示一个未曾了解的世界。那最好的数据新闻呢?它更需要与时间赛跑,更讲求数据的时效性。只有这样,才能吸引足够多的受众,并激发他们的兴趣为报道出一份力。
2、想受众之所想
在信息冗杂的时代,怎样才能找到所需要的数据,成为摆在众人面前的难题。即使找到了数据,它们有没有过时、可不可靠,这又是新的疑问。如今,数据新闻记者帮助受众筛选关键数据,并加以处理和研究,这已逐渐成为他们工作的重心。想受众之所想,综合运用这些技术手段,在“供应商”(数据来源)和“消费者”(受众)之间架起桥梁。数据新闻记者测试数据、检查数据、解读数据,并赋予数据生命。
3、寻找贴近性
从某种程度上讲,所有的数据都带有个体特征。例如在一些优秀的数据交互和可视化作品中,使用者可以找到与他所生活地区息息相关的数据。随着采集的精度越来越高,处理的维度越来越细,数据会因贴近受众而变得更加精彩。
4、没想象的那么难
如果你有一双从数据中发现故事的慧眼,那么你就能做数据新闻。层出不穷的免费工具,也让数据可视化和数据分析工作变得更加简单。
5、让数据变得开放
什么是开放数据?在发布时,它采用电脑能认的格式;在发布后,每个人都能使用。 但这里说的格式不包括PDF文件(它在数据处理上简直一无是处)。 要让数据变得开放,在一开始记录数据时,就应采用CSV、Excel等易于处理的格式。
6、“做你最擅长的,同时也链接他人的佳作”
美国记者杰夫·贾维斯(Jeff Jarvis)如是说。道理其实很简单:就一则新闻而言,你不可能做到极致完美,总有人会在某些方面比你强,为什么不加上他们作品的链接呢?
7、破除数据的枷锁
仅仅数据整合是不够的,我们还需要每件事的原始数据、实时数据,不管是公共交通信息还是选举结果。
8、找专家来帮忙
所谓“尺有所短,寸有所长”,精通每一个领域是不可能的。那为什么不试着找行家们来帮忙呢?
9、“化繁为简”
随着可供分析的数据体量越来越大,我们的工作就是把它们变得更小、更简单、更易于理解。
10、引人入胜
总而言之,还是精彩的故事最吸引人。