冯宏声:新闻出版大数据的应用前景无限
导读: 12月10日,以“大数据·转型·创新”为主题的2016金鸡湖出版智库产业创新峰会举行。在“出版+互联网”的大背景下,传统出版面临着一系列具有挑战性的课题,出版产业加速融合发展,实施大数据在出版行业的广泛应用,已成为行业发展的当务之急。国家新闻出版广电总局数字出版司副司长冯宏声在主题演讲中表示,只有实现“技术+”和“内容+”的完美结合才能形成完整的互联网,作为信息内容产业的重要组成,实现“内容+”是新闻出版业的未来发展方向;他展示了总局新闻出版科技工作在资源编码化、生产数字化、运营数据化、服务知识化四个方向的布局;他首次向业内全面介绍了“新闻出版大数据应用工程”的总体部署,并表示,新闻出版业产生的行业数据、生产的知识数据,将服务于多种对象。
本文根据演讲内容记录摘编:
新闻出版业的数字化转型升级进程
国家新闻出版广电总局在推进数字化转型升级工作时,一方面关注技术研发,自2011年开始启动一系列新闻出版重大科技工程,借助财政投入加快共性关键技术研发,解决行业共性需求;另一方面关注技术应用,自2013年开始,在中宣部指导下,总局和财政部合作,推动新闻出版企业应用关键技术与标准,配置装备,搭建平台,开展服务模式创新,加快数字化生产能力、管理能力、运营能力、服务能力的建设。
几年来,在财政部门的支持下,在众多敢于先行先试的企业的配合下,总局全面推动行业数字化转型升级,以标准为引领、以技术为支撑,以开展数字化装备配置为基础,开展ISLI/MPR标准应用试点示范、CNONIX标准应用试点示范、知识服务模式试点建设等几项试点示范工作,从行业层面到企业层面解决各种发展障碍与瓶颈问题,从技术改造到资源积累、从资源管理到数据治理、从产品多样到服务多元,新闻出版业的数字化转型升级已经取得一定成效。
下一步,我们希望可以基于此前的相关工作,汇集科技引领与支撑的各条工作线成果,推动数据沉淀,拓展数据应用,全面启动新闻出版业 大数据 体系建设,以全力支持新闻出版业供给侧结构性改革。以此,支持新闻出版业真正成为信息内容产业重要组成,全面融入国民经济建设,成为名副其实的支柱性产业。
传统出版和数字出版的关系
数字出版和传统出版并不是对立关系,数字出版是出版的一个发展阶段,是“传统出版”实现数字化转型升级、成为“未来出版”的过程。在这个过程中,需要对传统出版的产品形态、服务模式去改造,要对出版业的生态环境进行改造。出版人要正确认识“互联网+”,它应该是“技术+”和“内容+”,只有“技术+”和“内容+”相结合才能形成一个完整的互联网,而新闻出版业,就应该是互联网业。我们应该是互联网,互联网应该是我们。
不管是互联网还是出版,其实一直在做消减信息不对称的事情,并为个体的生活活动和外部产业的生产活动提供从信息到知识的服务。但是,互联网对信息不对称的消减动作,更多是在消减信息传递环节,难以对信源的真实性及价值进行判断,仍然离不开有主观性的人的干预。因此,互联网时代的信息传递过程中,更需要专业的服务机构处理信源,针对信息内容做出采集、加工、核对、筛选、封装、包装、传播的各种规范化与标准化动作,提供信息内容服务。
怎么认识大数据
大数据并不是单纯的指数据规模大,应该更强调在某一个领域,对相关数据的覆盖范围,覆盖面够全、获取速率够快、可挖掘的价值够高才能被称为大数据。
新闻出版与大数据的关系:新闻出版业在产生数据、更在生产数据;新闻出版业在应用数据、更在供应数据;新闻出版业需要关注数据安全,更是国家大数据安全的重要保障部门。
新闻出版业生产活动的直接成果就是数据,我们“生产”的是内容资源数据,内容的高级形态叫知识,我们生产的最有价值的数据是知识资源数据;新闻出版业自身的生产与运营活动过程中会自然“产生”很多数据,资源元数据、产品元数据、市场数据(机构数据、流通数据、交易数据)、消费数据等。
根据以上的梳理,新闻出版大数据可以归纳为行业数据、知识数据,可以面向行业自身、外部产业、政府、社会公众四类用户提供服务,在新闻出版大数据的各种应用中挖掘数据价值,实现新闻出版大数据体系建设的目标。
新闻出版大数据应用工程建设的第一步,包括新闻出版元数据体系、出版发行数据体系、知识服务体系建设。未来,将有出版物样本数据、电子政务数据等其他各类相关数据纳入建设范围,并产生更多应用。
运营数据化的未来布局
为贯彻落实十三五时期新闻出版科技规划中提出的“运营数据化”,在新闻出版大数据体系建设的初步设计框架中,“出版发行数据体系建设”成为其中的重要组成部分。
这一部分工作的总体布局是:在总局指导下,成立一个行业级的出版发行数据中心,为出版单位、实体发行单位(书店)、图书馆、终端零售企业、电商企业和物流企业等各个相关方面提供数据服务,实现数据汇聚与分发;在这个数据交换体系的外围,会有大量由行业机构做出资质认证的数据加工企业、数据分析服务企业、数据运营服务 企业 ,负责支撑体系的运行;同时,会吸收大量技术企业参与进来,提供技术支持;最终,这一体系将通过市场化方式,与消费者和外部产业从数据采集与应用的角度发生关系。
数据火车:出版发行大数据的应用场景
总局数字出版司提出“数据火车”的概念,以形象化地描述出版发行数据体系建设的应用场景。
我们可以想象有这样一列数据火车,它在行业内不停奔跑,每个数据主体机构都会有自己的站台、自己的一节车厢。数据火车在每个站台会上传一些数据,也会卸载一些数据。每个数据主体机构可以把不同时间节点的数据装进去,也可以根据事先确定好的市场规则拿到其他数据主体配发的钥匙,有条件地打开其他数据主体的数据车厢,拿到自己想要的数据。
数据火车的每节车厢,都有一部分是完全开放的,是政府部门委托的行业数据管理服务机构采集的最全面的基础数据,借助相应的政策,实现一种事实上的强制性提交。不开放的部分,是要借助市场化方式进行交易的部分。
数据分析报告是数据机构以市场化方式采购数据,依据模型和工具进行分析,得出相应成果,再返给出版发行企业,用于选题分析、库存管理等等。整个运输系统的车厢、数据库是统一标准的,轨道等传输技术将由符合相应标准的技术支持企业提供。这列火车会不停地在不同的数据生命周期之间跑,同一个站台,数据火车会去若干次,从选题到书号申请、发行征订、到货、销售、库存、退货、排行榜、获奖、书评、用户评论等等一系列跟数据发生关系的环节,在出版物全生命周期的数据链条上的各个环节,数据火车都会到大家面前。
新闻出版大数据的应用
未来,新闻出版大数据中心所沉淀的数据,包括元数据、出版发行数据、专业领域知识资源数据,以及未来的其他各种类数据,可以为四类用户提供服务。
为行业用户提供服务:针对资源标识、资源管理、选题策划、定价定量、订单管理、库存物流等一系列生产运营过程的具体需求,提供数据服务,支持行业用户生产运营决策,以资源可控为基础,提高产能、降低成本、提升产能与效能。
为政府用户提供服务:针对政府开展治理管理、提供公共服务过程中的决策支持需求,提供行业数据、知识资源数据,支持各级政府、各具体领域的分管政府部门的政策研制、实践管理,提供智力支持、开展智库服务,提高政府决策水平。
为公共用户提供服务:针对研究机构开展研究活动的学术需求,针对社会公众生活文化的消费需求,提供数据服务,支持学术研究活动;为社会公众的学习、娱乐、社交提供服务。
为外部产业用户提供服务:面向国民经济各产业领域的企业提供新闻出版大数据应用服务,针对其生产运营活动中深入了解出版行业市场情况的需求,针对其生产运营活动中对知识咨询、知识解决方案的需求,针对其从业人员技能培训与终生教育的需求,针对其实践经验累积与推广的需求,提供基于新闻出版行业数据以及知识资源数据的应用服务,支持其降低成本、提高产能与效能。
重视大数据人才队伍建设
新闻出版企业对大数据建设要有清醒认识,并不是说数据万能、算法万能、模型万能、技术万能,在现有技术条件下,大数据的建设与应用,仍然要依靠人的判断与执行,特别是具体到实施层面,更是要凭借人的经验去矫正、验证。
要加快培养懂技术、懂出版、懂市场的综合性大数据人才。有条件的企业可以开始谋划,设立“企业数据官”的岗位。初级数据官,更多是借助工具采集汇聚整理数据;高级数据官,则应当可以在掌握工具的同时,对行业有深入理解,有足够经验,提出各种分析需求,构建相关分析模型,指导各级数据员开展分析,出具报告,并参与企业战略决策。
责任编辑:王培