首页 自媒自媒体数据派正文

Skill Up《数据科学与商业智能的薪资与技能报告》(附下载)

Skill Up《数据科学与商业智能的薪资与技能报告》(附下载)

  【目录】

  ◎什么是Skill Up?

  ◎受访者组成

  ◎数据工作最适合哪些行业——其中哪些工作是最具价值的?

  ◎行业分布

  ◎职业发展和面向数据的工作

  ◎技术使用分析

  ◎人们究竟在用什么工具?

   Python高手们日常还使用什么工具?

  ◎技术栈

  1.数据可视化工具

  2.可编程数据管理员

  3.大数据专家

  4.数据架构师

  ◎下一步是什么?

  ◎新兴的趋势是什么?

  ◎热门话题

   你觉得在未来12个月内,Julia作为数据科学语言会取代R语言和Python吗?

   你认为在未来12个月内Apache Spark可能会取代Hadoop吗?

   数据分析和数据检索之间的边界是模糊的吗?

   你的公司在未来12个月内有实施大数据项目的计划吗?

  ◎最后...

   Excel在你心中还占有一席之地吗?

  ◎总结

  在数据科学快速发展的今天,在世界大范围的组织内数据已经变得至关重要,无疑这与过去十年热议的“大数据”经济紧密相连,与数据相关的岗位当今已经成为经济社会中最热门的技术岗位。

  Packt的Skill Up报告通过对数据科学从业者的技能调查,探讨了数据科学在哪些领域最具价值,使用的工具是什么,以及未来的趋势和挑战是什么。

  数据科学对中小企业重要性,充分表现在对于年轻人才的投资上。

  在数据科学里,金融仍然是一个利润丰厚的领域。

  作为数据科学的主流开发语言,R语言和Python并驾齐驱。

  分布式计算和机器学习继续崛起。

  物联网是数据科学发展的最热门趋势之一,必将带来新的挑战和机遇。

  永远都需要Excel!

  在展示整个社区和推广Skill Up活动之前,先来回答一些问题。

  ◎什么是Skill Up?

  Skill Up是一份调查报告,了解整个科技社区如何看待未来几年内的科技发展趋势,分享从事什么工作才能最大限度地使用你的职业和技能优势。调查报告分为4个部分: Web开发和设计、应用程序开发、安全与系统管理以及数据科学与商业智能,可谓是近年来史上最全面的调查之一了。

  ▊重要问题:

  掌握什么技能才能获得高薪?

  在各行业里什么技能/技术最具价值?

  真正值得你花时间学习的前沿技术是什么?

  为了更好地了解科技社区的想法,我们要求所有受访者填写我们的调查问卷, 当调查问卷完成后,一份有事实、有真相的调查结果就展现在我们面前了。其中最为重要的内容就是你需要掌握哪些知识和技能,帮助你作出最好的职业决定。

  让我们一起来看看调查结果的具体内容吧。

  ◎受访者组成

(国家名字翻译略)

受访者按国家分布

  本调查报告的数据来自超过3800名数据科学从业人员的问卷,这些受访者分布范围广泛,分别来自多个不同行业并拥有不同级别的经验水平。

  ▊图例翻译:

  Experience Level 经验水平

  ▊图例翻译:

  Job Sector 工作部门

  Software Products 软件产品

  Web Services/Internet 网络服务/互联网

  Consulting 咨询

  Education/Academia/Research 教育/学术/科研

  Finance/Banking 金融/银行

  Media/Advertising/Entertainment & Gaming 媒体/广告/娱乐&游戏

  Government 政府

  Health/Biotech/Science 健康/生物/科学

  Telecommunications 电信

  ◎数据工作最适合哪些行业——其中哪些工作是最具价值的?

  这里有一个共识, 在面向数据的工作里,确实存在最具价值的数据工作, 尤其是在那些依靠数据的行业 (很少有行业你可以说数据不重要)。有趋势表明,数据对哪个行业影响最大, 哪个行业的数据工作的价值就最大。

  中小企业支付给缺乏经验的菜鸟的薪酬是最好的。

  金融仍然是支付给缺乏经验的菜鸟的薪酬是最好的行业。

  在动态和快节奏的行业,例如媒体和娱乐行业,数据架构师是最重要的工作角色之一,这证明了能够构建和实施关键业务解决方案的能力是必备的。

  研究表明,对于缺乏经验的数据科学家和分析师来说,去中小企业就职,是开始他们职业生涯的较好选择,起薪也往往会比大企业高些。即使是去那些初创企业,也仅仅比大企业收入略低一些。随着组织的迅速成长, 对于任何雄心勃勃, 渴望证明自己的人来说去一家初创企业不失为一个很好的选择!

  不同经验水平在不同类型公司的年薪对比

  ◎行业分布

  我们还研究了不同行业对数据科学人才的重视程度。受访者们提供的指标很好地表明了数据科学在哪些行业是最重要的。

  大多数的受访者在咨询领域拥有超过20年的工作经验。其共性表明,外部专家受到追捧。

  那些经验较少的受访者主要集中在教育/学术领域从事研究工作。显然,图表显示不是薪酬最高的行业之一。

  经验较少却能获较高年薪的人按行业分布

  金融和银行业脱颖而出,成为支付最佳薪酬的行业。随着算法交易的兴起, 大数据在金融的方方面面都有应用,对于那些拥有数据一技之长,即使没有很丰富的经验的人来说,在金融领域也有很多获得高薪的机会。

  你想学习定量金融学吗? 那就赶快捡起这个大礼包吧!

  Mastering R for Quantitative Finance

  R语言与定量金融学

  Introduction to R for Quantitative Finance

  R语言与定量金融学介绍

  Python for Finance

  Python与金融

  Mastering Python for Finance

  精通Python与金融

  Advanced Quantitative Finance with C++

  高级定量金融学与C++

  (链接见PDF)

  媒体/广告/娱乐和游戏, 虽然不是利润丰厚的金融领域,但看上去也是能为缺少经验的人提供可观薪水的行业。从实际情况出发,一般来说, 一个缺少经验但薪水要求不高的人在这些行业是很有竞争力的。我们的数据清楚的表明,这些行业愿意投资没有技术经验和数字技能的人。

  这个迹象表明,在这些经济较困难,且需要依靠数据驱动战略来保持竞争力的行业,虽然可能缺乏资金或现金流来投资和培养数据专业人才,但是如果缺乏经验的人不要求高薪的话,若有合适的技能也有可能会填补职位的空缺。

  ◎职业发展和面向数据的工作

  我们已经了解到缺乏经验的数据从业者在工作方面如何做出最佳选择 ,那么之后未来的职业发展又会是怎样的呢?

  我们还想看到不同工作角色在不同行业的薪资差异。下面的图表显示了一些特定工作角色的最高薪水, 以及这些工作角色在哪些行业是最具价值的。

  不同行业不同工作的平均年薪

  ▊图例翻译:

  Data Architect 数据架构师

  Statistician统计师

  Business Intelligence Expert (includes Devs, analysts) 商业智能专家

  Data Scientist/Analyst 数据科学家/分析师

  Intermediate IT/Regulation/Business 中级IT/合规/业务

  Assistant Director 总监助理

  CONSULTING 咨询

  Finance/Banking 金融/银行

  Media/Advertising/Entertainment and Gaming 媒体/广告/娱乐和游戏

  媒体/广告/娱乐和游戏行业的数据架构师是最重要的工作角色之一,能够争取到比其他行业更高的薪水。

  数据架构师与数据统计师,对比两者在行业中实施数据科学与数据驱动战略的关键差异,可以推断出,在金融行业做数据统计的人的收入略高于数据架构师,但是在媒体行业数据架构师会挣得更多一些。

  媒体和娱乐行业会经常发生灵活的、组织级变化,快速响应变化对于媒体和娱乐行业至关重要,因此开发解决方案、搭建数据架构的架构师工作含金量非常高。但是在金融行业,方案架构早就有了,架构师的工作含金量就不那么高了。

  ◎技术使用分析

  有超过25%的受访者表示日常使用Python, 但也有几乎相同比例的人使用R语言。

  分布式计算和机器学习正变得越来越重要。

  增强现实技术和物联网正在改变人们看待数据的思路。

  从后两点可以读出未来5年多种来源的数据继续以指数级增长。处理这些数据的技术仍在发展, 所以不要让自己落后!

  ◎人们究竟在用什么工具?

  数据从业者日常需要用哪些工具呢,回答如下:

  Python在数据领域胜出。其多功能性,拥有易于使用、内容丰富、保罗万象的第三方库,从机器学习到web抓取无所不能,加上使用门槛较低, 使它成为理想的选择。

  Python高手们日常还使用什么工具?

  大量的受访者表示使用Python和R语言、 Python和Java、Python和C++。

  同时掌握Python和R语言,可以提高你的编程熟练度,并成为一个适应性更强的数据科学家:

  Practical Data Science Cookbook

  实用数据科学Cookbook

  R Data Analysis Cookbook

  R语言数据分析Cookbook

  Python Data Analysis

  Python数据分析

  R for Data Science

  R语言数据科学

  Python Data Science Essentials

  Python数据科学精要

  (链接见PDF)

  ◎技术栈

  为了更好地理解人们通常集中使用什么工具,我们做了一些聚类分析。我们把所有的回答导入一个图形数据库里, 并用科技界常用的聚类算法进行运算,从中我们发现一些相关的聚类技术栈:

  1.数据可视化工具

  这些人工作在设计数据科学光谱的最后端。从下面的聚类工具中看到, 与其他组相比,他们与前端web开发人员有许多共同之处。Java排在第一位——设想有多少web是由Java开发的,就一点也不奇怪了——还有其他设计工具和插件,例如CSS, HTML5和jQuery,能看出这些工具和插件在web开发中也起到了主导地位。

  这组工具的出现帮助我们强调了网络沟通中的数据洞察力,同时也突显出当你试图理解和解读数据时,设计是多么的重要。

P14

  2.可编程数据管理员

  使用这组工具的人们从事洞察数据的工作。他们主要负责快速地对数据进行采集、清洗和操做,其目的是为了能够回答任意特定问题,例如从客户行为到财务规划等。

  Python成为最重要的工具——不足为奇,因为它具有容易使用的原型和强大的灵活性。

  Pandas的出现强调了Python的主导地位——事实上, 恰好是因为pandas提高了Python的数据分析能力,从而巩固了自己的地位。

  然而这里还有趣地看到了C++ , 虽然Python提供了灵活性和易用性, 但是C++的惊人执行速度仍然是Python无可匹敌的。

  3.大数据专家

  使用这组工具的是对系统的可伸缩性和健壮性感兴趣的大数据专家。

  Hadoop在这里主宰了大数据世界——然而, Scala和 Spark也出现在这组工具里,并且地位显著。随着要求更快的处理速度(通过扩展实时分析实现)从而需求增加,很有可能期待看到更多的进步。

  还有一些有趣的web工具也出现在聚类里,比如Java和Spring。它们曾出在第一个聚类里,其作用是通过基于web的应用程序来进行有效和快速的沟通。

  4. Data Architects数据架构师

  这组工具反映了组织的需求,如何以有效、智能的方式进行数据洞察力的沟通—这也是数据架构师的主要挑战。显然, 企业级工具占据了这个聚类, 聚类还显示出企业在选择关键业务的工具时,微软和甲骨文仍被视为首要选择。

  这些工具组给了我们一个有用的启示,数据世界是如何细分的, 不同的工作角色是如何建立起一个工具的“生态系统”的。一个有趣的问题是, 这个工具“生态系统”在未来的几年内会改变吗?这些聚类会不会变得不稳定?

  ◎下一步是什么?

  我们向受访者提问在未来得6个月之内计划学习什么工具。我们想知道哪些是热门工具, 是什么人在使用这些能够赚钱的工具, 这些问题的答案可以帮助你决定在哪个领域提高技能, 或学习新的知识。

  下面一起来看按薪水加权的根据词频画出的词云吧!

  ▊提几个经过研究的关键建议:

  Spark和Hadoop表现出众, 表明集群计算在增长。

  基于Web的技术也出现在词云里,表明人们看到了网络共享数据分析的价值。

  NoSQL数据库的热度在数据世界里持续上升。

  ◎新兴的趋势是什么?

  我们询问受访者,在未来12个月内最重要的新兴的趋势是什么:

  ▊从回答中得到一些明确的信息:

  机器学习将成为大家关注的焦点之一,因为在数据领域工作的所有人,以及相当范围内的部门和行业,都将被预测洞察和统计分析这两个需求所驱动。

  增强现实技术和物联网将成为数据科学家在未来几年内主要面临的挑战。

  移动在词云中的突出显示表明了移动性分析越来越被强调,因为用户有离开办公桌越来越远的趋势。

  分布式计算(集群式和云平台)会改变我们的思考方式,甚至是对数据的思考。管理大数据项目中的资源所产生的焦虑,是基于前面情况可能出现的症状。随着物联网和移动应用日益占据主导地位, 管理更大的数据集将成为一个更大的挑战。

  如果你参与了一个大数据项目, 你就需要掌握机器学习的技术。从现在起,打开这个礼包,开始探索机器学习和预测分析之旅吧。

  Machine Learning with Spark

  Spark与机器学习

  Scala for Machine Learning

  Scala与机器学习

  Machine Learning with R

  R语言与机器学习

  Machine Learning with R Cookbook

  R Cookbook与机器学习

  Building Machine Learning Systems with Python - Second Edition

  用Python构建机器学习系统—第二版

  (链接见PDF)

  ◎Hot Topics 热门话题

  我们询问了受访者关于大数据发展和挑战的一些简单但热门的话题。

  你觉得在未来12个月内,Julia作为数据科学语言会取代R语言和Python吗?

  由薪水最高的受访者给出的答案是,Julia正处于上升阶段。原因很简单,因为它是专门为科学计算而设计的语言,拥有一些有趣的特性,比如多重分派,实用的图形库和完美的JIT编译性能。Julia值得我们拭目以待!

  想要保持领先于趋势的地位吗? 选择一本Julia的书开始学习吧!

  Getting started with Julia Programming Language

  Julia编程入门

  Mastering Julia

  精通Julia

  Getting Started with LLVM Core Libraries

  LLVM核心库入门

  Python High Performance Programming

  Python高性能编程

  R High Performance Programming

  R语言高性能编程

  (链接见PDF)

  你认为在未来12个月内Apache Spark可能会取代Hadoop吗?

  调查结果说你现在安全啦!

  然而,如果你还没有搭上Hadoop的快车,那么现在搭上还不算晚哦…

  Learning Hadoop 2

  学习Hadoop 2

  Mastering Hadoop

  精通Hadoop

  Big Data Analytics with R and Hadoop

  用R语言和Hadoop分析大数据

  Fast Data Processing with Spark - Second Edition

  快速数据处理与Spark—第二版

  Apache Mesos Essentials

  Apache Mesos精要

  (链接见PDF)

  数据分析和数据检索之间的边界是模糊的吗?

  普遍来讲 ,这是有争议的。

  64%的受访者同意边界是模糊的。

  像BigQuery这样的工具本可以表现得更出色。当然啦,还需在未来12个月内继续观察这些工具的表现。

  随着大数据变得无处不在,大数据的原则不再仅仅满足最简单有效的策略了,同时还要满足最高的效率和最快的速度。

  想成为精通数据分析和数据检索的大师吗?赶快学习这些热门书籍吧。

  Clean Data

  数据清洗

  Practical Data Analysis

  数据分析实践

  Mastering Predictive Analytics with R

  精通R语言预测分析

  Learning Data Mining with R

  使用R语言进行数据挖掘

  Learning Pandas

  学习Pandas

  (链接见PDF)

  你的公司在未来12个月内有实施大数据项目的计划吗?

  看起来,大多数受访者都工作在期待实施大数据项目的组织中,这与他们缺乏经验的情况存在巨大的反差,虽然原因并不明显, 但有许多可能的解释。

  可能是那些缺乏经验的人并不参与组织战略的制定和决策。或者可能那些缺乏经验的人刚开始工作,恰好了解到已经有大数据项目实现。

  ◎最后...

  Excel在你心中还占有一席之地吗?

  Excel是永恒的, Excel 2013太棒了…它神一样的存在所有人的内心深处!

  ◎总结:

  可能是老生常谈了,很显然科学数据和大数据不是简单的趋势 ,而是一场深刻而广泛的社会、文化和经济上的变革。

  咱们不讨论“大数据革命”或说“数据科学家”是“21世纪最性感的工作”的话题了,让我们来看看数据在不同领域应用的不同方法吧。对于中小企业来说, 应用数据让公司更加开放、积极地面对和响应性市场的变化是至关重要的。机器学习的重要性进一步凸显出来,它能快速交付一个明确而有意义的洞察力!在较大的组织中,往往会有创建大数据解决方案的动力。由于数据科学家和分析师寻找引入新的工具方法,比如Hadoop和Spark,使得分布式计算和集群式计算明显上升。

  更加有趣的是,由于物联网和增强现实等新兴的趋势出现,我们对数据的理解似乎正在改变。物联网取代大数据成为未来的流行词极有可能。数据科学家,分析师和架构师们虽然还不清楚如何解决日常问题,但是几乎可以肯定的是,遍布每一个角落的数据文化会给人们带来许多的挑战和大量激动人心的机会。

  如果你想成为一个数据科学家,你需要:

  扩大编程语言范围是必须的,这将使你更具有灵活性。当你为一系列不同的项目工作时,

  掌握机器学习。如果你想开始或进一步深入学习, 就去抓取机器学习的大礼包吧!

  如果你刚刚开启职业生涯,你也许在金融行业或者中小企业,也许工作很糟,你也许在一个成熟的大型企业获得了高薪工作,但在这里可能有个小小的差别,在一个中小企业里会得到更多的机会和责任。

  如果你在媒体行业工作,努力成为一个数据架构师吧, 学习如何开发和实施大规模数据的解决方案,可以让整个组织受益。

  掌握Hadoop和Spark大数据工具是有用的,掌握在分布式网络环境中学会使用这些工具调配紧张的资源更加有用。

  关注物联网——我们目前还不太知道物联网将把数据世界引向何方!

  翻译版要和英文原版一起看才更配哦~点此可下载英文版PDF↓

注:本稿件摘自入驻数据观自媒体——THU数据派,转载请注明来源。编辑:Fynlch(王培),数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。

责任编辑:王培

分享:
延伸阅读
    大数据概念_大数据分析_大数据应用_大数据百科专题
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    “智慧中国杯”全国大数据创新应用大赛
    企业
    更多