来源:明略数据 时间:2018-06-21 14:50:45 作者:吴明辉
之所以说行业人工智能是一条“慢”的赛道,深谙数据的吴明辉清楚认识到,即使为人工智能系统提供充足、甚至无限的数据资源,也无法排除人类对它的干预。
吴明辉2014年刚刚创建明略时,是从大数据平台方向切入。但他很快发现,Hadoop开源技术的门槛越来越低,因此迅速决定转型去做差异化的行业应用。4年来,明略数据基于数据和人工智能技术投身行业应用,形成在公安、金融、工业和物联网三个垂直行业人工智能的市场定位。
对于人工智能这样一个时代风口,尽管明略数据已跻身潮头,但在吴明辉眼里,在正确的时间做正确的事,保持战略定力,才是成功关键所在。
“战略的本质就是在意图之上,基于能力与资源的约束,对未来方向做出的大胆选择和决断”
在人工智能领域的诸多赛道中,明略数据刻意选择了深耕垂直行业的行业人工智能这一条比较“慢”的赛道,而不是那些被资本推动的初创公司拥挤的红海。
在深耕垂直行业大数据治理与挖掘领域三年后,2017年,明略数据宣布推出明智系统——行业人工智能大脑,并率先推出行业人工智能知识图谱。在行业人工智能落地应用中,如今,明略数据已经占据了先人一步“快”的优势。
明略数据在其行业人工智能大脑“明智系统”中,通过面向AI的大数据治理产品CONA将海量多源异构数据治理成行业知识,再基于知识图谱数据库蜂巢(NEST)完成行业知识图谱存储,通过行业大脑SCOPA的机器学习、符号推理等技术实现秒级运算和在线分析挖掘,从而逐步构建公安大脑、金融风控大脑、工业安全大脑。
据明略数据官网消息,明略数据已成功服务部分省级公安厅和市级公安局,中国人民银行、交通银行、光大银行等金融机构,中国中车、上海地铁等行业标杆客户。今年4月,明略数据宣布已与2017年完成C轮10亿元人民币融资,本轮投资方为华兴资本、腾讯。
著名心理学家、诺贝尔经济学奖获得者丹尼尔?卡尼曼在其专著《思考,快与慢》中谈到:“快思考存在成见,在很多特定的情况下,易犯系统性错误”“一些至关重要的任务却只有慢思考才能执行,因为这些任务需要付出努力和控制自我,由此方可抑制快思考产生的直觉和冲动”。
如今,事实证明了明略数据在技术上的前瞻判断力,及深耕行业人工智能的“慢”决策效益。吴明辉说,人工智能可分为“感知智能”和“认知智能”,感知可以看作是人的眼、耳、口等感官,而认知则更偏重人的大脑,其中有逻辑思考、想象力、语言能力、符号处理能力等,“认知智能”的建立可以帮助商业决策,用更多的数据进行更精准的分析,从产品设计到目标人群,到营销手段,到最后的售后服务等等。
而且,之所以说行业人工智能是一条“慢”的赛道,深谙数据的吴明辉清楚认识到,即使为人工智能系统提供充足、甚至无限的数据资源,也无法排除人类对它的干预。
面对人机交互系统中对人类语言或行为的细微差别和模糊性的理解,以及人工智能技术应用于一些重大领域,如风险管理、医疗诊断、司法、自动驾驶、舆情分析等时,需要引入人类的监督及验证,才能避免人工智能成为“黑盒”,要让人工智能成为可解释的人工智能,同时以最佳方式利用人类已有的知识,最优地融合人类智能和计算机的计算能力,最终让人工智能增强人的能力,提升政府企业沟通和决策效率。
吴明辉坦言,在做AI的过程中,最大问题是数据不够完善,除了结构化的数据,还是多源异构数据,这些数据没有进行结构化梳理。在面向AI的数据治理工作基础上,关于人工智能的技术路线,吴明辉认为,AI不仅仅只有机器学习这一种途径,其实还有知识图谱、深度学习等。
明略数据希望帮助企业提升知识工作者效率,知识图谱作为大数据时代的重要知识表达方式之一,为机器语言认知提供了丰富的背景知识,其意义在于让机器能像人一样可以实现逻辑推理。以明略数据公安行业知识图谱为例,该图谱将刑警、缉毒警、交警、户籍警等警种知识全部结构化,同时也将背后的数据也进行结构化,最后形成一个公安行业知识图谱。将所有数据全部融合。显而易见,各警种知识全都纳入知识图谱时,这样的公安行业知识图谱所展现的力量,远大于单个民警。除知识图谱,明略自去年还推出了企业级Siri“小明”,重新定义了企业级智能应用的交互方式。小明通过自然语言理解技术为众多智能应用提供了统一且友好的智能交互入口。通过这个入口,用户可以以自然语言的形式,从企业的不同智能服务更为便捷地获取洞察能力。
“人与人进行交互时,自然语言是最友好的媒介。如果人与机器交互也能通过自然语言,这对于人类来说显然是最友好的方式。‘小明’能利用主动学习和强化学习等技术从使用反馈中提取有效信息,不断地升级和优化模型,而‘小明’的背后是垂直行业知识图谱技术的不断积累,以及自然语言理解技术的突破。”
例如,当用户查询“去年10月坐火车来北京的中年男性”,“小明”不仅要理解出用户的查询意图是通过乘车行为来查找满足特定特征的人,同时要细粒度地解析出该意图下包含的属性:时间:“去年10月份”;方式:“火车”;地点:“北京”;年龄:“中年”;性别:“男”。这类属性描述中含有大量的概念模糊表述,这里需要结合常识进一步推理。例如,“北京”这个地点信息应该推理为北京站、北京南站、北京西站、北京北站等四大站。为了实现自动推理,明略数据的“小明”引入常识知识图谱对自然语言中的模糊表达进行深度的语义分析。
目前,公安系统明略数据重要客户。过去一年,明略数据在30多个城市服务公安领域客户,在不同的城市解决不同的警种问题,刑侦、经侦、情报、反恐、禁毒、治安等等。吴明辉强调,因为不同警种的数据资源不一样,他的目标是把不同警种数据全部理解清楚,最后治理融合到一起。
仅以面向AI的数据治理而言,是一场马拉松长跑,能够做出这一战略选择,得益于明略数据在战略定力上的长期坚持。
吴明辉不仅是明略数据的创始人、董事长,还是一位连续创业者。他于2006年创办秒针系统,秒针如今已成为中国领先的全域营销数据技术解决方案提供商。在企业级服务领域,吴明辉有着诸多心得。
“因为我一直在做企业级服务的创业和投资,它不同于ToC,我们的团队不能有短板,除了要有很强的产品能力、技术能力,同时要有市场能力、销售能力,甚至还有政府关系能力,我们团队里,基本上每位高管都是其所在领域里最强的精英。”
前不久,宣布IEEEFellow、吴信东教授加盟,吴信东作为数据挖掘领域世界级科学家加盟明略数据,构建明略数据行业人工智能大脑。
目前,明略数据员工约有450人,七成以上为技术人员。谈及针对政府客户的销售,吴明辉强调,今天企业级服务的绝大多数创始人都思路清晰。因为企业级服务跟消费级互联网产品不一样,TOC可以靠模式取胜,企业级服务不是靠模式取胜。面对政府客户,明略数据要做到,五倍、十倍地超过其他竞争对手的技术能力和服务能力。
关于未来人工智能技术究竟如何落地,吴明辉说,“我们的战略是三步走。第一步,坚定不移地帮助客户建设数据融合平台,让数据在线化,体现在数据接入、数据治理、NLP等,智能的基础要有大数据的支撑,不然应用都将是昙花一现。第二步是数据挖掘,体现在知识提取、建立模型、分析挖掘等。第三阶段,形成感知反馈闭环。当数据汇集之后,就是从信息沉淀到’知识’的过程,公安、金融、工业领域的’知识’多数在行业专家的头脑中,需要将这些专家规则变成机器能读懂的数学模型。人工智能的应用则体现在将数据与模型进行深度融合,最终通过感知反馈闭环实现人工智能落地。”
责任编辑:陈近梅