首页 自媒自媒体 THU数据派正文

信息流浪潮构建可视化数字世界

 我阅读了许多新闻,但通常我都觉得难以领会它们,尤其是最近这些日子:这次和上次相比到底有什么不一样?我错过了什么信息?我学到了什么?那其他的事情进展怎么样了 ?

 我同时也对地图感兴趣。

 所以我构造了这张地图:

信息流浪潮构建可视化数字世界

 所有的新闻都在信息池周围流动

 (动图请见:http://kaleidoscope.news/)

 或者你可以定格并放大:

信息流浪潮构建可视化数字世界

 又或者你喜欢颜色更深的:

信息流浪潮构建可视化数字世界

 Kaleidoscope是以实时抽象制图来表示时事的一个实验网站。图中各元素或是新闻条目,或是当前流行的哈希标签。它们的空间远近、视觉设计和整体布局由文本的语意相近程度所决定。

 我想探究的问题是:

 我所读到的信息看起来是什么样子?

 更准确地说:我是如何发展对我们日益扩张的虚拟空间的理解能力的?我的媒体消息以及其他虚拟资源消耗情况看起来如何?这对我有什么影响?今天的信息和昨天相比又有哪些不同?除此以外,如果我放大地图,地域将怎么分布?那些我们正在建立和人工智能描绘的信息的形状的宏观结构是怎么样的?

信息流浪潮构建可视化数字世界

 抽象的个人空间:Kaleidoscope对我过去30年的浏览历史所进行的抽象

 “最新研究表明使用电子设备来阅读,例如平板和笔记本电脑,可能使人更倾向关注具体细节而非更抽象地理解信息”——这意味着在平板和笔记本电脑上阅读一些内容,你会仅仅关注实物的客观性而不是进行更复杂的联想。(http://psychcentral.com/news/2016/05/09/reading-on-digital-media-may-inhibit-abstract-thought)

 从这个研究得出结论可能为时过早,但如果这个结论是正确的——甚至只是一小部分正确——我认为我们有必要更好地理解和思考抽象的数字化空间。

 数字化空间的制图学

 建筑学、制图学和地理学(a la Jacques Bertin的《图像符号学》{http://dwz.cn/6hCrtR})的可视化语言给我们提供了丰富的工具来绘制物理空间。

信息流浪潮构建可视化数字世界

 图形符号学:图表,网络,地图(Jacques Bertin 1967)

 我们可以将这些经过尝试的且正确的制图规则运用到更抽象的虚拟空间里吗?一个完全由信息组成的空间,例如在线媒体的进化格局,reddit上的争论或者我的网络浏览习惯?

 实现起来有一点困难。例如,球形等积的抽象表示手法已不再适用,因为网络中的信息不具备有效用的物理维度——换句话说,我们得先探索出一套针对物理维度的启发式方法。

 为了把未加工的媒体数据流合成为一种视觉抽象形式,我们需要发展新的制图原语,可以在没有人类持续输入的情况下自动运行。这是一种由机器操控的纯机械的电子制图方式,可以解决制图准确性的基本问题:

 地图如何能够更好地呈现内容?

 必须提供什么背景?

 我们怎么适应或接受人类视觉系统里的偏见去更好地表达 “真相”?

 引入Kaleidoscope

 Kaleidoscope是一个制图和发掘信息空间的自动化程序。它有三个组成部分:

 具有某种潜在驱动规则(例如,新闻周期、时事性、或者通过观察浏览习惯而获得特定人的兴趣和倾向)的未经加工信息流;

 充分运用自然语言处理技术和其他机器学习方法,用以寻找数据里的模式;

 制图和视觉表达上颇为新颖的方法使得人们易于理解这些模式。

 当前,kaleidoscope.news使用基于神经网络的内容嵌入(word embedding)来将最主要的文本型和结构化数据特征映射到一个共享的低维度矢量空间。

 空间近距离结构随着时间和新内容的增加而进化,旧有内容被淘汰,这是一种徘徊在新生和死亡的迂回进化路线。从而,新的话题随着时间出现、变成主流再消亡,整个循环是在渐长的时间范围内清晰可见。

信息流浪潮构建可视化数字世界

 超过96小时的新闻的流动和退潮

 (动图请见:https://pan.baidu.com/s/1czYE9g)

 工具、启发和人情债

 我可以写好几篇关于怎么建立这个系统的博文,但简单来说,我非常感谢 tensorflow(https://www.tensorflow.org/)、fasttext

 (https://github.com/facebookresearch/fastText)、 mapnik(http://mapnik.org/)、mapbox-gl-js(https://github.com/mapbox/mapbox-gl-js)、tippecanoe(https://github.com/mapbox/tippecanoe)、tilelive(https://github.com/mapbox/tilelive)、postgis(http://www.postgis.net/)和Google 云平台的开发者们。如果任何一个团队中的任何一个人正在看这篇文章,我将非常高兴和你共饮啤酒。

信息流浪潮构建可视化数字世界

 从设计角度来讲,Kaleidoscope 主要基于Stamen Design(http://stamen.com/)的优秀制图师Jacques Bertin 的《图像符号学》和出生于埃塞俄比亚的艺术家 Julie Mehretu(的工作)(http://whitecube.com/artists/julie_mehretu/),她的 “没有位置的故事地图”(译者注:这是Julie Mehretu 对自己的作品的评价)描绘了“一个想象而非真实的现实世界”。

 同样震撼而且有启发的是inconvergent.net (http://inconvergent.net/gallery/)的纯粹衍生艺术品和 Deer Data 项目(http://www.dear-data.com/theproject)的深度视觉信息挖掘。

信息流浪潮构建可视化数字世界

 从Inconvergent上采集的艺术作品

 过去和现在

 在过去,国际贸易逐步发展,随之而来的是对收集和信息抽象化绘图的需求。

信息流浪潮构建可视化数字世界

 Anaximander 在公元前520左右绘制的第一张现代世界地图

 在相似情况下,当我们变得越来越依赖复杂和相互连接的实时电子媒体世界,我们现在前所未有地需要更多的认知能力去承担这些任务:理解世界以及绘制我们正迈向更好的空间地图。

 我不敢说kaleidoscope可以解决这个问题——更不敢说它能在很大程度上推进这项技艺的发展——但是kaleidoscope确实提供了一个视角,从视觉上直观地观察大众媒体(a particular visually intuitive view of the mass media landscape)。

信息流浪潮构建可视化数字世界

 Julie Mehretu, Entropia(总览)2004

 “如果我们从一个更高的角度来俯瞰我们自身,令人恐慌的发现我们对我们这个物种、我们的目的和我们的结局所知竟如此之少。”

 “If we view ourselves from a great height, it is frightening to realize how little we know about our species, our purpose and our end.” 

 ——W.G. Sebald,The Rings of Saturn

 原文链接:

 https:[email protected][email protected]lity-f98a61fef701

 作者:Joseph Simon Reisinger

 编译:郑于飞

 术语校对:梁傅淇

 全文校对:闵黎

责任编辑:陈近梅

分享:
延伸阅读
    大数据概念_大数据分析_大数据应用_大数据百科专题
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    “智慧中国杯”全国大数据创新应用大赛
    企业
    更多