数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

发布时间:2019.03.07来源:亿信华辰浏览量:97次标签:数据治理

计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外……

大数据

在每种情况下,硬件和软件的进步都需要专业技能,再将它们交到通用人才的手中。在专业人员失业的同时,这些技术的民主化引发了创新、商业和创造就业的浪潮。

同样,我坚信数据科学家的工作在五到十年内就会过气。相反,经济领域各行各业的终端用户都将会使用数据科学软件,就像现在的非技术人员使用 Excel 一样。事实上,那些数据科学的工具可能只是 Excel 2029 中的一个选项卡而已。

当今的金融分析师不再需要聘请数据科学家来帮助他们,因为他们所使用的平台已经提供了他们所需的数据科学工具。这在其他领域也会变得普遍,因为对数据科学的基本了解已经成为许多工作的必需技能。与此同时,很多数据科学的工作也正在实现自动化,一些观察人士提出警告,称数据科学家可能正在让自己失去现有的工作。

数据科学不断飙升的人气

数据科学这一职业正在经历「淘金热」时期。2018 年彭博社(Bloomberg)的一篇文章将数据科学称为「全美最热门职业」,因为从 2015 年 1 月到 2018 年 1 月,招聘网站 Indeed.com 上的数据科学家需求增加了 75%。文章还提到,在一些咨询公司,数据科学博士的薪水为 30 万美元。

同时,美国数十所大学都推出了数据分析项目。加州大学伯克利分校(UC Berkeley)在 2018 年新开设了数据科学专业,该专业很快成为了学校最受欢迎的专业之一。去年十一月,该校开设了新的数据科学与信息系,并将其称为「几十年内最大的重组」。

但这些年轻人即将进入的行业将在未来10年内发生翻天覆地的变化。尽管他们的数据科学技能可以成为一项稳定的职业财富,但他们中会直接成为数据科学家的人可能少得惊人。

从机器编码到大规模编码再到数据自动化

当我在学习计算机科学时,编译器设计是必修课。我们需要了解如何将像 C 语言这样的编程语言直接转换成机器语言,也就是计算机可以直接解释的十六进制代码。用机器语言来编写商业应用程序以获得更高的性能是很常见的做法。

在过去的几十年间,连续的软件功能层被抽象为更高级的开发工具。现如今的大多数代码都是用像 Python 这样简单易学的高级语言完成的,相对而言,程序员很少需要了解如何直接和硬件对话。

数据科学也在快速地走着同样的道路。在未来的三到五年,越高级的工具对基础技术的需求会变得越低,这些基础技术包括高性能计算(CPU 的分区问题)、数据整理(准备原始数据以便进行分析)以及机器学习系统内部或初级统计方法等。所有这些过程都将在机器内部进行。

如今,包括 Trifacta、Element Analytics 和 Kylo 在内的数十家公司都在推出新的数据分析工具,它们中的大多数旨在减少繁琐的数据准备工作,帮助数据科学家迅速完成分析工作。此外还出现了可以自动选择算法和调整参数的数据科学框架(如 Auto-sklearn 和 DataRobot)。这些框架和工具与数据管理平台相结合,为未来的数据消费者建立了大型构建块。

数据科学家的前进道路

在未来几年,我认为数据科学家将至少分为五类:

通用人才:第一类是数据科学的通用人才,他们会对数据做出解释并使用数据。这些人的工作是指导终端用户,帮助用户对数据提出问题,但他们并不会自己找出答案。这更像是一个过渡性的工作,更可能在五年内出现。

行业专家:由行业专家组成的是第二类,也是人数最多的一类。他们将在制造、医药科学以及金融这样的特定垂直领域中使用数据科学技术和工具。我认为未来的大部分工作岗位都在这里。但这也不是数据科学工作。这些人不是了解制造业的数据科学家,而是了解数据科学的制造业领袖。相当于今天的以统计学为王牌的研究员。

深度专家:有专业数据科学技术的深度专家组成了第三类,也是人数最少的一类。这一类人从事的是纯数据科学工作。他们的工作是以抽象的方式研究数据科学、提升算法性能并设计出新的通用方式。他们就像如今的计算机科学家,主要工作是建立理论基础,而非解决日常问题。

分析开发人员:第四类是从数据科学家转为分析开发的人。这些人是软件开发专家,他们的工作是处理数据交互问题,以及通过数据报告帮助人们做出推论。算法设计也是他们工作的一小部分,数据平台和以一站式方式完成大量工作的鲁棒代码库会辅助他们。

数据工程师:另外,还会催生出像数据工程师这样的新工作,他们会构建将数据转换并传输到基础平台的管道,在这个管道中会对数据进行分析和可视化。尽管数据科学家通常因他们出色的算法而得到认可,但他们高达 80% 的时间都花在收集数据、清理数据和组织数据上。

结论

在十年内,数据科学将会融入特定行业的应用和广泛应用的生产力工具中,因此我们可能认为它不再是一个热门行业。正如一代又一代的数学和统计学的学生不会再将自己视为数学家或统计学家,而是在商界和学术界中扮演了各种各样的角色,新崛起的数据科学的毕业生未来也将会成为制造工程师、营销领导者以及医药科学领域的研究人员。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    近20位行业大咖和领导,来自全国451所学校的1386位教育信息化专家、院校领导及企业负责人参与了此次大会,针对服务治理、数据治理、高等……查看详情

    发布时间:2018.10.15来源:亿信华辰浏览量:61次

  • 解决方案中的简单性:迈向身份治理的步骤

    解决方案中的简单性:迈向身份治理的步骤

    面对颠覆性变革,只有在新设备和平台上线时才会加深,并且随着物联网投放更多数据,身份治理至关重要。企业现在通过自己的部署和合作伙伴关系来管……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:77次

  • 数字化时代的大数据治理应该怎么做呢?

    数字化时代的大数据治理应该怎么做呢?

    随着时代的发展,各个企业收集数据的渠道越来越多样化,也有越来越多的企业开始应用大数据来创造价值,为了合理有效的挖掘数据资源来源的价值,首……查看详情

    发布时间:2019.07.17来源:知乎浏览量:103次

  • 数据治理治什么?在哪治?怎么治?

    数据治理治什么?在哪治?怎么治?

    数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。其实在我看来,……查看详情

    发布时间:2020.06.24来源:知乎浏览量:66次

  • 金融服务数据治理:帮助价值'新货币'

    金融服务数据治理:帮助价值'新货币'

    对于在金融服务领域运营的组织,数据治理变得越来越重要。当金融服务行业董事会成员和高管在2018年初聚集在安永的金融服务领导峰会时,数据是……查看详情

    发布时间:2019.01.21来源:亿信华辰浏览量:106次

  • 如何搭建企业级主数据管理平台

    如何搭建企业级主数据管理平台

    企业应用系统的构建多是以项目为中心,缺乏自上而下的规划。这样势必会导致企业信息孤岛现象越来越严重。主数据作为企业应用系统中最重要的业务单……查看详情

    发布时间:2022.03.17来源:小亿浏览量:155次

  • 数据标准与主数据、元数据、数据质量的关系

    数据标准与主数据、元数据、数据质量的关系

    数据标准与主数据、元数据、数据质量的关系,数据治理项目的根本诉求在于提升数据质量。……查看详情

    发布时间:2020.09.24来源:知乎浏览量:162次

  • 为何数据治理如此重要?

    为何数据治理如此重要?

    如我们所见,数据正在以前所未有的速度增长,IDC曾发布报告称,到2025年,全球数据圈预计将增长至175 ZB。如何在这样一个数据大爆发……查看详情

    发布时间:2020.04.09来源:知乎浏览量:94次

  • 各行业企业数据管理遇到的挑战

    各行业企业数据管理遇到的挑战

    目前业界并没有对其概念的统一标准定义,我们可以这么认为,数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利……查看详情

    发布时间:2020.03.26来源:知乎浏览量:82次

  • 数据治理要处理好四个关系

    数据治理要处理好四个关系

    随着我国大数据战略的不断推进,各类生产生活行为都以数据的形式全景留痕,构建了一个与现实空间平行的“数据空间”,数据治理呼之欲出。要切实发……查看详情

    发布时间:2020.04.09来源:知乎浏览量:76次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议