首页 专栏沈立勤正文

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  导读:3月3日,以《大数据在城市治理当中的应用和痛点》为主题的数据观思享会第三期沙龙在京成功举办。数据观思享会是在贵阳数博会组委会指导下的一个品牌沙龙。海量信息技术有限公司总裁沈立勤女士在活动中给大家分享了主题为《城市应急事件监测预警系统》演讲。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)
 
海量信息技术有限公司总裁沈立勤

  沈立勤:各位朋友大家下午好,今天我们主题是关于城市治理的刚需和痛点。因为我们是一个公司,理论还是蛮重要,这是系统的根本,但是作为企业,能不能在实际过程中应用并且给客户带来价值,这是我们最关心的。

  我们都知道,大数据在这几年是非常热的,但不管是大数据云计算还是其他的,在政府这方面的项目真正落地可实施可运营的,据我们观察其实真的不是特别多。今天我拿一个实际案例跟大家分享,这是我们去年做的一个,确实跟今天的题目非常吻合。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  今天我给大家带来的是城市应急事件的监测预警系统。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  这是一个概述,我先不讲,最后回过头来再看。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  我们真正的应用的单位是北京突发事件应急委员会办公室。这个机构大家有人清楚吗?这是直接向主管副市长汇报,整个城市应急指挥系统。我认为是指挥部也是参谋部。它管什么呢?城市里所有重大事件,跟意识形态无关,意识形态是谁管?网信部和中宣部。剩下的地震、交通事故、重大的恐怖事件、火灾灾难都由应急办来管。

  我们看下面这个图就特别清楚。以属地为单元,体系应急系统,这是应急办在这儿,分属各个部门,雾霾,空气污染红色预警发布都是应急指挥部负责。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  一方面按照灾害的级别,够一定级别的时候由市里来统一协调,因为它是要多方协调,火灾、消防、医疗、交通等等,一定级别以下专项应急指挥部来负责。它是方方面面的,特别多,这个体系是非常健全的,在全国上上下下都有这个体系,穿透区域和行业。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  应急部门找到我们,那么,它的现状和问题是哪些?

  第一、流程太长。如果有什么事情,原来是靠基层应急办电话通知。记得北京下大雨,有个桥下面淹死一个人,这就是因为上报审批流程太长,救援没过去,这个人就牺牲了。

  第二、现场信息不够直观。只靠电话要素不够全,比如一场火灾,它的面积多大?高层还是胡同?要动员所有的救援是行不通的。如果这个信息和要素不够全面,要么就是浪费了,要么是到那之后,你发现不够,急救车到那,病人运不过来,经常造成各个部门的摩擦。因为是重大应急事件也会引起社会很多的公共关系方面的危机。

  另外,在应急过程中需要有一个系统严密跟踪社会各方面的反应,来决定下一步应该怎样应对这种公共关系。比如国务院应急办用互联网信息来进行预报,导致什么呢?有的时候上级单位都知道了,但它还是不知道,非常被动。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  还有一个大背景,国家网信部发文,把网络信息安全纳入到应急。虚拟和真实的物理空间要打通,我认为未来虚拟比真实更重要,所以虚拟这块的东西就变得特别重要,这一块的应急在网络上引起的恐慌或者是重大的纷争也会成为他们管理的一部分。

  国务院还有一个发文,是《关于切实加强突发事件信息报告工作的通知》,通过互联网的监测获取这方面的经验和做法,突发事件对政府来说是越来越重要了。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  下面就带来了一个问题,需要搭建一个专业的基于网络信息的应急事件监测预警系统。关于这个预警系统,其实他们两年前就开始选型,最大的一个挑战信息要及时准确,而且他们的原话是"不丢事、不落事"。这个过程非常难,他们找了20多家舆情厂商,但是肯定无法满足他们的需求,仅仅靠10台20台机器去运作,效果没办法保证,第二,大部分舆情是落后,这是人命关天,经济损失的事,如何处理,一筹莫展。在去年大概年初的时候,他们找到我们进行合作。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  接下来我想跟大家介绍,我们为北京应急办做的这套解决方案,现在已经实施一年后,取得的成果经验。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  这是我们帮助北京应急办做的互联网应急信监测预警解决方案的建构。

  新闻论坛、微博,尤其是微博、微信包括社交媒体这一些地方采集信息,建立专业的应急知识库,把所有跟应急相关的四大类、68小类的知识都放在这儿,就跟雷达一样的东西在网上不停扫描发现,这边引擎,分析引擎,建模挖掘分析,把真正应急办需要预警的事件报送给他,这是应急的情报库。应急情报库报给他们,他们可以全面监测预警通报和事件跟踪,完了之后建立应急案例库,帮助他们分析,最近应急事件是如何产生,我们如何处理?未来预案怎么办?变成闭环的系统。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  我们怎么解决快全准的难题,是使用了海量大数据情报平台,用了我们的核心理念和核心的技术。首先先说我们是怎么解决采集问题。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  采集,看似简单,其实复杂。为什么?第一,大家都知道,微信微博包括视频、社交网络的采集是非常复杂。本身这一类网站其实对搜索引擎不是特别友好,因为它的网站自治性非常强,靠这种信息引流变现,这是它的商业模式,那么它就会对来访的信息屏蔽,你要有手段采集。第二,经常改版,光靠一套软件系统是不行的,这里有智能采集和智能搜取,我们智能发现网站改版,还有信源自动发现技术,监测数据发现这种异常,同时我们也用基于视觉网络结构自动识别技术进行结构化的搜取。我们每天有5千台服务器在网上采集,我们在海外在硅谷在香港都有自己的服务器进行采集,大家也非常关注国外对北京重大事件报道,每天处理的数据超过一亿条。我们做了很多年,积累了上千亿条的数据,我们信息源覆盖超过425万,新闻媒体、社交媒体、政府、视频、电商网站等等基本上我们能看到都去覆盖。同时我们有超过一百万的知识库,涉及20万个行业,这是我们采集能力。也就说我们不是用一套软件而是一个集群服务来满足。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  第二项核心技术,就是我们独特分析工具,叫判定图。判定图有点像思维导图。人类靠知识和智商一起来认知世界或者改变世界,计算机也类似,AI、人工智能需要知识,知识形成网络,如果数据不跟知识挂接,这个数据是根本没有用的。我们这一套判定图,这是我们专利产品,它的好处,一个业务人员即使不会编码,他也能够按照图形的指引来把他的业务理念放进去,快速形成对一个事物的判断。我们说描述需求的一个方式,同时是知识节点的入口,能建立精准数据判定模型。下面有例子。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  比如说这个实例,这就是我们一张判定图。当我们去看北京,绝对不能拿北京这两个字匹配,朝阳区,今天我们说中关村大街,一定是北京,所以我们在这里就有一个知识,中关村大街它属于什么?海淀区,海淀区属于北京,这是我们知识结构,这是北京地区,这是从区域往下走包括有什么?有商圈、街道。马甸东可能是西城区等等,这就是所谓的知识判定图。

  这里大家能看到,比如说这种绿色的,绿色的就是在系统反复应用,这种知识不管是应急办还是其它政府机构或者说是金融、企业类的客户,只要用到这些都可以复用,绿色就是可以反复复用。蓝色在这个主题下,数据进来之后,打了光圈就会表明蓝色,这就非常直观。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  再有我们这套大数据的情报系统里头有一个非常重要的内容就是知识库,这是公有知识库加私有知识库,同时我们自己还有非常重要的一个专利产品,知识自动发现引擎。在互联网上大数据自动发现新的知识,尤其是社交媒体经常会有一些新的说法,那么这个怎么能被发现?一定要靠计算机去实现,否则人是没法做得到。

海量总裁沈立勤:城市应急事件监测预警系统(附PPT)

  我们这个应急的专业体系是怎么建立起来的?我们依据它的总体行业的标准、总体预案和各门类预案制定了四大类、68小类。四大类是什么?基于地理的信息系统、行政预警、执行靠各个区域来执行,还有重要地标、重点商圈,朝阳的商圈上百个。基于时间的,什么时间?特殊时期,现在两会包括节假日等等,它都会有不同的处理。基于事件的程度,紧急程度、人员伤亡、经济损失、社会预警等这些,这里头就是68个小类,事故,有交通事故,公共安全有流感前一段的,比如说SARS;社会安全,有恐怖事件也有其它的这些。自然灾害就更多了。

海量总裁沈立勤:城市应急事件监测预警系统

  这就是我们指示体系,时间和空间通用。时空的知识是通用,跨行业可以跨行业使用。这边是专业应急知识,68类。四大类68小类还有个性化,有一些非常个性化的。

海量总裁沈立勤:城市应急事件监测预警系统

  我们做汽车的时候,加入到汽车的知识,如果我们做大众消费品的时候,这就是大众消费品的知识,如果说是金融的风控方面的应用,我们就会加入风控的知识,所以我们所有知识分为三层,这是通用,这是行业,这是个性化的。刚才我说的,我们系统已经积累了100多万条知识,这些知识是谁创造出来?是我们海量的专家和用户的专家一起按照行业标准来共同构建的。

海量总裁沈立勤:城市应急事件监测预警系统

  比如说这是商圈,这是什么呢?这是朝阳商圈,有建外、大望路、三元桥、农展馆,当出现这个紧急事件,我们就说朝阳商圈大火,朝阳商圈交通事故,砍人或者追杀了。

  这个是火灾。火灾事故,我们也不能简单利用火灾匹配,着火、起火、火灾、大火,杂物引燃这都是火灾还有浓烟。有歧义词,比如火灾报警器,没有歧义词数据就是垃圾进垃圾出。整个数据分析来说,当然最后形成图表可视化非常重要,但数据处理让它非常干净有效,这块是在整个大数据处理中占80%以上的成本,如果没有良好数据基础,你上面建模建得再好也没有用。

海量总裁沈立勤:城市应急事件监测预警系统

  海量最核心的技术,这也是我们赖以生存多年——这就是中文智能语义分析,让计算机读懂中文,不是在底层是0101,真正知道它的语义是什么?它说的是什么品牌、说的什么地方、说的哪种灾害、说的是好还是不好,包括实体的识别,分词,从文本流变成词流,从词里头识别出实体和概念进行搜索、分析。

海量总裁沈立勤:城市应急事件监测预警系统

  说一个例子,这是一个真实案例,我在数据库里抽出来,2015年6月30日14点30分,丰台区大红门西路大李窑地区,北京大红门木材厂彩刚板库房起火并冒出大量浓烟,我们怎么分析?地理信息,省:北京、市北京、区县:丰台区、商圈:大红门、街道大门红西路大李窑,地点:北京大红门木材厂。

  时间信息,年:2015年;月:6月;日:30日;时间:14时过分。季节:夏天。夏季引起突发事件是哪些?丰台商圈最近发生的应急事件是哪些?就可以做各种各样的透视、分析帮我们沉淀应急知识和可能性。这是从非结构到结构。

  结构化的东西已经被数据库解决了,这一轮我们认为大数据有一个非常大的特点,就是非结构化数据,非结构化数据是什么?有文本有音频、视频等等,这些东西加入使得分析素材非常多,而且在互联网上呈高频振荡,及时性非常强,它的价值显得特别高,而且又是外部数据。

海量总裁沈立勤:城市应急事件监测预警系统

  这个系统实现的功能:

  第一、实现了突发事件的监测和预警。

  第二、出现了突发事件持续跟踪。

  第三、快速搜索。

  第四、分级授权。

海量总裁沈立勤:城市应急事件监测预警系统

  看着这套系统直接进行指挥,整个调度,使得损失和伤亡能降得最低。给应急办带来的价值,我们跟应急办的领导反复沟通,他们认为是这样:

  第一、解决发现。我们现在把最重要的一些信息通过短信直接发给他们值班人员。比如当地铁因为某种不可预知的原因导致故障而中断运行,这个时候应急办知道这个就要调集路面交通了,这时候发车频度就要高了,否则会影响大家上班。好多人都问我,互联网数据可信吗?我告诉大家,大数据的特点就是单条信度很低,多条交叉证认信度很高。所以你看这么多条过来的时候,你不得不信。当这条信息推过去之后,值班人员就会打电话给交通部门,确实证实有这个事他就会去做调度。

  第二、交叉证认。这是前几天顺义大火,他们在这里有一个事,所谓要素的失真。顺义大火,内部曝出来,涉及的面积100平米,网上出来的图片不可能100平米,这就是交叉证认。拍的地点,木樨园跑到事发现场再去拍照,第一,事件已经过去,第二,未必有好的机位,新闻机构在高空有好的机位和设施,这样再跟他确认真的是这样吗?以前就是,我觉得孤立不正,交叉证认之后,使得我们对这些事情越来越全面、真实。

  第三、辅助决策。比如在前几天,在雾霾比较严重的时候,曾经网上一直在传马上实施单双号。当时这个事应急办非常关注,看网上的声量,后来大家议论比较多,通过分析这些互联网数据信息,判断出这件事的影响力趋势,他们就出来辟谣了。

  第四、分析总结。最后是案例库和突发事件的真正原因分析,那种东西会帮助我们最后形成一种洞察和预测。这些都使得快速研判和高效调集资源,减少责任职能部门的责任冲突,灵活处理公共关系。

  应急实践关系到国计民生,比如去年帮助应急办做的红霾——雾霾可以红色预警,从来没有人报过。那次报红色预警之前,其实是出现了一个连续的雾霾天,大家都很抱怨,但是真正报红警的时候,整个应急部门是非常紧张,那次我们也是调集了人力帮他们来看整个在互联网上大家的发声。第一次报红色预警之后,因为是第一次,下班6点才报出来,当天要做很多工作,其实他们效率还是非常高,第一次报完红色预警,整个反映还是非常不错,大家觉得政府主动出来做了一些工作。第二次、第三次的时候,我们发现一些改变,他们也做了一些应对。这些都是对于整个事态的变化的一些表示。

海量总裁沈立勤:城市应急事件监测预警系统

  这套东西架构在海量大数据服务情报平台,开始构架的时候我们认为是跨领域、全领域应用,算法和程序分离,我们看到应用性非常广泛。把数据采集来之后,判定图和知识网络进行打标签,从非结构到结构,到结构之后进行建模,图形化表示出来变成行业情报,这就是我们整体的轨迹。

  所以说,一个新的行业应用起来,就需要把这个部分修改,前后都是OK的,只要把行业真正的问题找到,并且构建起行业的知识库,同时围绕着这个问题进行建模,这个就自然变成,在生产线上展开。同时还有一个理念是什么?一定是人机协同,如果让机器自己学习,那这个后果你不知道怎么样。机器对中文处理智能大概是两三岁孩子,西文大概到5、6岁。两三岁的孩子,我们都是从小到大不断上学,学各种知识,有不断穿透能力和洞察能力和解决问题的能力。我们曾经做过一些自学习系统,当错的时候你没法干预是非常可怕,在过程节点我们做了干预,认为它其实跟一个人长大一样,开始这个系统感觉比较慢,但是它的积累非常重要,当它跨越一个鸿沟之后,它就一定知道。

海量总裁沈立勤:城市应急事件监测预警系统

  我们现在情报平台的应用领域已经非常广泛了,光在政府里头,帮助国家旅游总局用的旅游智慧云,12301国家旅游总局大数据平台在常州,把互联网数据全都接出去,评5A景区和5A酒店会用到这部分数据。山海关5A景区拿掉,我们已经提前预测了,因为各项数据显示它在5A景区排在倒数第一名。

  商务云,也很简单,商务部管商务云通,他要看价格等等,以前在价格是靠什么?商超,大的集市。现在大家都在哪儿?网上购物。网上究竟现在是什么样的价格呢?他需要知道。另外一旦出现什么疫情,比如说养猪户都情绪低落的时候,可能会屠宰。比如说它的价格低,饲料比猪肉还贵的时候,就会屠宰,一屠宰造成供求关系的不匹配,直接影响猪肉、生猪基础的生产生活资料价格波动,会带来其它连带所有的波动,这都是商务部负责和管理的等等。

  再有,我们在金融方面的应用。主要在信托、P2P等等一个项目来了之后,贷款项目就帮他在互联网上找有关的信息,项目的风险包括员工对他的议论、会商、客户等等,这些都会帮助金融机构极早发现,能杜绝损失等等。

  关于企业这部分的案例就更多了,刚才跟这位朋友聊海尔,去年我们跟海尔做了好几个系统,上千万的生意。基本上全方面,从开始六个产品,希望跟自己的消费者一起来,通过网上找到这些粉丝之后互动等等。我们数字评分系统,还有包括精准的获客系统,再有O2O大数据驱动的快销品,销售模式的再造等等。

  娱乐。综艺节目,非常重要的综艺节目,如《我是歌手》,我们都监控。电视台和广告商、品牌都知道,它的收视率,开头对收视的预测,节目组找品牌厂商找贴牌价格都需要,包括后边所有的嘉宾在整个网络上被议论的情况,没有粉丝,露出率就没那么高。《爸爸去哪儿》,这个节目我们一直都支持,周六播,周二我们把数据给他们,导演就会调整,带动收视率的提高。

  电影电视剧。所有的电影,我们都知道它的口碑评论都是在互联网上体现。再有明星代言的选择,一个企业一个产品怎么样找受众更喜欢哪些明星,他究竟是优雅、时尚、颠覆还是逗逼的形象来代言你的产品,如何去匹配符合你的品牌气质,这些都是大数据可以帮助去甄别判断的。

  还有传媒领域,我们大数据新闻,通过计算机帮助新闻,热点发现、落地统计、影响力评估等等,这些都是基于我们的海量情报服务平台做的应用。

  我最后介绍一下,我们海量定位是基于大数据情报服务平台商。我们定位自己是情报服务平台商,所以我们会跟非常多的合作伙伴合作,我们是SAS的服务模式。

海量总裁沈立勤:城市应急事件监测预警系统

  这就是我的介绍,谢谢各位!

  注:本文系数据观原创稿件,转载请注明来源:数据观www.cbdio.com,百度一下“数据观”,获取更多大数据相关资讯。

责任编辑:陈近梅

分享:
数博故事
贵州

贵州大数据产业政策

贵州大数据产业动态

贵州大数据企业

更多
大数据概念_大数据分析_大数据应用_大数据百科专题
企业
更多