当前位置>首页>课堂>课程>正文

财新传媒CTO黄志敏:可视化与数据新闻

来源:传媒与新媒体 时间:2015-01-27 17:15:06 作者:黄志敏

  作者:黄志敏(财新传媒CTO,数据可视化实验室负责人)

   2014年6月,财新的数据新闻可视化实验室数据新闻《青岛中石化管道爆炸》获得亚洲出版业协会(SOPA)的卓越新闻奖,这是中国新闻史上第一次有程序员获得新闻奖。之后2014年11月,《周永康的人与财》获得腾讯传媒大奖首度设立的“年度数据新闻”奖,成为了唯一一支获得过数据新闻奖项的可视化团队。什么是可视化?什么是数据新闻?最近很火的H5营销指的又是什么?许多人似懂非懂,以下做个简介。

  可视化

  可视化(Visualization),是将数据展现为直观的图形,以帮助理解和记忆。可视化历史久远,广泛应用于地图、统计等领域。可视化在现代科学中有三个主要分支:科学可视化、信息可视化和可视化分析。

  科学可视化(Scientific Visualization),主要用于处理科学数据,如地理信息、医疗数据等,以自然科学领域为主。我们日常接触到的地图、气象图、CT等都属于典型的科学可视化。

  信息可视化(Information Visualization),主要用于处理抽象的、非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据。传统的信息可视化起源于统计图形学,又与信息图形、视觉设计等现代技术相关。EXCEL中的饼图、柱形图、折线图之类是我们每天都可能接触到的信息可视化作品。

  可视化分析(Visual Analytics),以可视交互界面为基础进行分析推理,综合图形学、数据挖掘和人机交互等技术。可视分析学是综合性学科,与多个领域相关:在可视化领域,有信息可视化、科学可视化与计算机图形学;与数据分析相关的领域包括信息获取、数据处理和数据挖掘;而在交互方面,则有人机交互、认知科学和感知等学科融合。简单理解,看K线图分析股价涨跌背后的规律应该是最常见的可视化分析。

  可视化在近年的高速发展得益于计算机和互联网技术的进步。过去千百年来,绘图的执行者从人变成计算机,工具从徒手发展到尺具再转化为计算机,传播范围从本地变成远程,媒介从纸张发展到计算机再到手机。但归根结底,在人工智能成熟之前,搜集什么数据,用什么样的图形呈现,说明什么问题,这事还得由人来决定。

  数据新闻

  可视化被应用在各种领域,数据新闻(Data Journalism)是可视化在新闻领域的应用。数据新闻的主要表现方式包括静态信息图和互动图表。

  静态信息图伴随着报刊杂志的发展而发展,有百年以上的历史,它由编辑和设计师合作完成,展示在纸面或屏幕上。信息图的制作以前靠手绘,现在靠设计软件。信息图往往突破版面的框架,内容比文字丰富和生动,在这个读图时代比以前更受欢迎。

  互动图表完全依赖互联网,因此它到这几年才随着互联网的普及而盛行。互动图表由编辑、设计师和程序员合作,通过编程在网页上实现数据的可视化,再借助互联网,通过电脑或手机传播。用户通过操作电脑或手机,可以增加或筛选展示的内容,或进行可视化分析。

  静态信息图和互动图表最大的区别,在于后者需要程序员介入。设计师不能再天马行空地设计图案,必须考虑程序员的编程能力和程序的的限制。

  为什么数据新闻近年引起如此多的关注?

  首先,互联网的普及和编程语言的发展为互动图表的发展奠定了技术基础。

  其次,国际知名媒体开始重视数据新闻。2009年3月,英国《卫报》成为全球第一个成立数据新闻部的报纸;2012年12月,《纽约时报》推出《雪崩》,获得2013年普利策奖。这些都引起国内新闻业界的极大关注。

  再有,可视化分析和信息可视是大数据分析的重要手段,随着大数据成为热点,可视化也屡屡被提及。

  数据可视化在新闻报道中有三种利用方式:辅助理解、用图表讲故事和数据挖掘。

  辅助理解类似于插图或配图,是将可视化作为文字报道的辅助手段,这也是常见的方式。

  用图表讲故事是不借助文字报道,独立用图表展示一个完整的故事,或引导用户接受一个接论。在这个过程中,创作一组图表跟写一篇文章类似,要考虑数据的取舍,讲述的先后次序等。可视化跟写作、拍照、录音、摄像和剪辑一样,都是报道的手段。后几种都有经验总结和课程,可视化叙事的模式和手段还在摸索之中。

  以《青岛中石化管理爆炸》为例,它的核心是将爆炸现场拍摄的照片按拍摄位置还原到谷歌地图上,使用户获得身临其境的感受。在新闻的开始,先依次用几个画面,将地图逐步缩小,让用户逐步了解山东、青岛及发生爆炸的黄岛区的具体位置,配合文字描述,将事件时间、地点、起因等背景做完整的交待。

  数据挖掘与可视化分析关系密切,通过将数据图形化,展示原本被忽略甚至无法发现的特征。

  以《三公消费龙虎榜》为例,我们将2010年以来官方公布的90多个中央级单位的三公消费数据录入数据库,加以图形化和排序,使用户了解什么是三公消费、每个部门的支出和组成如何、人均支出如何等等。它是一个数据库,但将枯燥的数据展现得生动活泼。它不讲故事也不给结论,每个用户可以发现不同的内容。

  数据新闻团队的组建

  数据新闻团队由三种人组成:编辑、设计师和程序员。财新可视化实验室是一个虚拟部门,10名成员分布编辑部门、设计部门和技术部门。实验室并行多个项目,每个项目按需要抽调人手组成项目组,有时还会临时与记者合作。

  数据新闻要求新闻生产流程做出变化。传统的生产流程中,采编人员、设计师和程序员是上下游的关系。采编人员生产出稿件,然后由设计师配图和排版,再通过程序员发布出去。但数据新闻的生产流程不同,设计人员根据采编人员提供的素材设计图形,同时与程序员沟通,如果开发成本太高或周期太长的话要修改设计方案。在方案充计的过程中,程序员很可能反过来要求记者补充数据。待方案确定,设计、开发、文案同步进行。所以三方是合作和互动的关系。

  最理想的数据新闻人选既懂新闻、又懂设计、又懂编程。但实际上,由于文理分科、高校课程设置等原因,国内找不到三项全能的复合型人材,因此只能通过团队合作来实现。庆幸的是,现在个别高校已意识到这些问题,尝试开设数据新闻实验班,对学生做综合培养。这是一个好势头。

  数据可视化与HTML5

  2014年下半年以来,H5营销这个说法被反复提起。那H5营销跟可视化又是什么关系呢?

  H5是HTML5的简称,也就是HTML协议的第五个版本。HTML是用来呈面网页的语言,过去十多年浏览器里呈现的版本都是HTML4,HTML5有多个方案,各个浏览器对HTML5特性支持的程度不同,使得同一段HTML5代码在不同浏览器上呈现效果差异很大。目前电脑上浏览器分布极其复杂,有微软的IE、谷歌的Chrome、苹果的Safari等,均有多个版本,国内还有多家公司将IE核心包装成“自主知识产权”的浏览器,导至国外已经淘汰的、不支持HTML5的IE6在国内占据极大市场份额,这个市场严重分割的现状极大提高了程序员在计算机上开发HTML5作品的困难,也影响了产品经理设计HTML5作品的积极性,影响过去几年HTML5的推广和普及。

  今年HTML5火起来主要是三个原因:

  首先是手机上的浏览器相对统一,解决网页兼容性难度大大降低。

  其次是微信流行,用HTML5发布的作品可以轻易地通过朋友圈分享,对传播有很大的帮助。

  三是HTML5标准终于在几个月前统一,学习成本和开发成本降低。

  HTML5就是一个基础开发工具,不要神秘化。这门技术掌握起来不难,所以未来开发成本会越来越低,引起的关注度也会越来越低。象半年前随便做个HTML5游戏就可以在朋友圈刷屏的情况越来越难重现了。

  财新开发互动图表作品,主要工具就是HTML5、CSS3和JavaScript。用HTML5绘制图形和动画,用CSS3实现排版,用JavaScript处理交互和动画。所以要制作互动图表必须掌握HTML5,但懂HTML5未必懂可视化。HTML5是一门技术,门槛会迅速降低,而可视化是一个发展中的学科,博大精深,有无数的可能性。HTML5、CSS3和JavaScript应该成为新闻工作者的必须掌握的工具,而可视化应该成为新闻工作者必备的知识。

  (关于可视化的定义和分支,参考了陈为、沈则潜、陶煜波等编著的《数据可视化》,特此说明和感谢)

  摘自:财新数据可视化实验室

分享到:
贵州
  • 贵州大数据产业政策
  • 贵州大数据产业动态
  • 贵州大数据企业
更多