数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

发布时间:2019.03.07来源:亿信华辰浏览量:88次标签:数据治理

计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外……

大数据

在每种情况下,硬件和软件的进步都需要专业技能,再将它们交到通用人才的手中。在专业人员失业的同时,这些技术的民主化引发了创新、商业和创造就业的浪潮。

同样,我坚信数据科学家的工作在五到十年内就会过气。相反,经济领域各行各业的终端用户都将会使用数据科学软件,就像现在的非技术人员使用 Excel 一样。事实上,那些数据科学的工具可能只是 Excel 2029 中的一个选项卡而已。

当今的金融分析师不再需要聘请数据科学家来帮助他们,因为他们所使用的平台已经提供了他们所需的数据科学工具。这在其他领域也会变得普遍,因为对数据科学的基本了解已经成为许多工作的必需技能。与此同时,很多数据科学的工作也正在实现自动化,一些观察人士提出警告,称数据科学家可能正在让自己失去现有的工作。

数据科学不断飙升的人气

数据科学这一职业正在经历「淘金热」时期。2018 年彭博社(Bloomberg)的一篇文章将数据科学称为「全美最热门职业」,因为从 2015 年 1 月到 2018 年 1 月,招聘网站 Indeed.com 上的数据科学家需求增加了 75%。文章还提到,在一些咨询公司,数据科学博士的薪水为 30 万美元。

同时,美国数十所大学都推出了数据分析项目。加州大学伯克利分校(UC Berkeley)在 2018 年新开设了数据科学专业,该专业很快成为了学校最受欢迎的专业之一。去年十一月,该校开设了新的数据科学与信息系,并将其称为「几十年内最大的重组」。

但这些年轻人即将进入的行业将在未来10年内发生翻天覆地的变化。尽管他们的数据科学技能可以成为一项稳定的职业财富,但他们中会直接成为数据科学家的人可能少得惊人。

从机器编码到大规模编码再到数据自动化

当我在学习计算机科学时,编译器设计是必修课。我们需要了解如何将像 C 语言这样的编程语言直接转换成机器语言,也就是计算机可以直接解释的十六进制代码。用机器语言来编写商业应用程序以获得更高的性能是很常见的做法。

在过去的几十年间,连续的软件功能层被抽象为更高级的开发工具。现如今的大多数代码都是用像 Python 这样简单易学的高级语言完成的,相对而言,程序员很少需要了解如何直接和硬件对话。

数据科学也在快速地走着同样的道路。在未来的三到五年,越高级的工具对基础技术的需求会变得越低,这些基础技术包括高性能计算(CPU 的分区问题)、数据整理(准备原始数据以便进行分析)以及机器学习系统内部或初级统计方法等。所有这些过程都将在机器内部进行。

如今,包括 Trifacta、Element Analytics 和 Kylo 在内的数十家公司都在推出新的数据分析工具,它们中的大多数旨在减少繁琐的数据准备工作,帮助数据科学家迅速完成分析工作。此外还出现了可以自动选择算法和调整参数的数据科学框架(如 Auto-sklearn 和 DataRobot)。这些框架和工具与数据管理平台相结合,为未来的数据消费者建立了大型构建块。

数据科学家的前进道路

在未来几年,我认为数据科学家将至少分为五类:

通用人才:第一类是数据科学的通用人才,他们会对数据做出解释并使用数据。这些人的工作是指导终端用户,帮助用户对数据提出问题,但他们并不会自己找出答案。这更像是一个过渡性的工作,更可能在五年内出现。

行业专家:由行业专家组成的是第二类,也是人数最多的一类。他们将在制造、医药科学以及金融这样的特定垂直领域中使用数据科学技术和工具。我认为未来的大部分工作岗位都在这里。但这也不是数据科学工作。这些人不是了解制造业的数据科学家,而是了解数据科学的制造业领袖。相当于今天的以统计学为王牌的研究员。

深度专家:有专业数据科学技术的深度专家组成了第三类,也是人数最少的一类。这一类人从事的是纯数据科学工作。他们的工作是以抽象的方式研究数据科学、提升算法性能并设计出新的通用方式。他们就像如今的计算机科学家,主要工作是建立理论基础,而非解决日常问题。

分析开发人员:第四类是从数据科学家转为分析开发的人。这些人是软件开发专家,他们的工作是处理数据交互问题,以及通过数据报告帮助人们做出推论。算法设计也是他们工作的一小部分,数据平台和以一站式方式完成大量工作的鲁棒代码库会辅助他们。

数据工程师:另外,还会催生出像数据工程师这样的新工作,他们会构建将数据转换并传输到基础平台的管道,在这个管道中会对数据进行分析和可视化。尽管数据科学家通常因他们出色的算法而得到认可,但他们高达 80% 的时间都花在收集数据、清理数据和组织数据上。

结论

在十年内,数据科学将会融入特定行业的应用和广泛应用的生产力工具中,因此我们可能认为它不再是一个热门行业。正如一代又一代的数学和统计学的学生不会再将自己视为数学家或统计学家,而是在商界和学术界中扮演了各种各样的角色,新崛起的数据科学的毕业生未来也将会成为制造工程师、营销领导者以及医药科学领域的研究人员。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 互联网企业数据治理决策要这么建

    互联网企业数据治理决策要这么建

    企业需要协调多个提供和使用数据的参与方之间发生的复杂关系,由于企业缺乏数据治理可能导致数据滥用/误用等破坏性后果,并导致市场失灵。传统的……查看详情

    发布时间:2019.08.19来源:CSDN浏览量:70次

  • 亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    亿信华辰亮相2018智慧校园广州论坛 共探教育数据治理

    近20位行业大咖和领导,来自全国451所学校的1386位教育信息化专家、院校领导及企业负责人参与了此次大会,针对服务治理、数据治理、高等……查看详情

    发布时间:2018.10.15来源:亿信华辰浏览量:48次

  • 数据治理是建设数据中台的核心数据价值的释放之匙

    数据治理是建设数据中台的核心数据价值的释放之匙

    随着数据价值的日益突显,越来越多的企业开始进行数字战略转型,有的通过数据平台过渡到数据中台,有的直接建设数据中台。……查看详情

    发布时间:2020.06.23来源:知乎浏览量:67次

  • 知否?知否?如何利用元数据管理数据资产

    知否?知否?如何利用元数据管理数据资产

    如今,各大企业都在关心数据该如何使用,但大数据应用的前提是有高质量的数据。而很多企业内部数据形态多样,标准不统一,大数据应用往往得从数据……查看详情

    发布时间:2020.09.18来源:知乎浏览量:93次

  • 打破数据治理:数据质量

    打破数据治理:数据质量

    任何数据驱动的计划的成功取决于该数据是否相关且值得信赖。随着越来越多的大学将数据视为负责任的战略规划和计划的关键,许多人都意识到:有些数……查看详情

    发布时间:2019.07.11来源:知乎浏览量:94次

  • 企业数字化转型的五化建设

    企业数字化转型的五化建设

    企业数字化转型的五化建设利用新一代信息技术,构建业务数据的采集、传输、存储、处理、分析、可视化结果和反馈的闭环,打不同系统、不同技术、不……查看详情

    发布时间:2020.04.03来源:知乎浏览量:74次

  • 企业数据治理的实际步骤

    企业数据治理的实际步骤

    数据治理是一项业务活动。到目前为止,已经有多项努力从IT内部开始。但是,数据属于业务,而不属于IT。IT可以提供建议,帮助管理存储库,提……查看详情

    发布时间:2018.11.20来源:数据治理浏览量:65次

  • 中小银行数据治理工作所面临的问题

    中小银行数据治理工作所面临的问题

    虽然各银行积极响应监管要求,开展数据治理工作,但《中小银行金融科技发展研究报告(2019)》显示中小银行的数据治理基本处于萌芽期,达91……查看详情

    发布时间:2020.07.09来源:小亿浏览量:102次

  • 理解和证明数据治理2.0

    理解和证明数据治理2.0

    过去,证明数据治理的合理性是非常困难的。数据治理1.0的孤岛性质以及缺乏对增值的关注意味着买入率很低。……查看详情

    发布时间:2019.01.25来源:亿信华辰浏览量:105次

  • 正确的数据文化是数据治理成功的预测指标

    正确的数据文化是数据治理成功的预测指标

    获得数据治理计划的业务和领导支持 - 以及在该支持下建立数据文化 - 仍然是许多组织面临的重大挑战。然而,根据一项新的调查,获得这种支持……查看详情

    发布时间:2019.02.25来源:亿信华辰浏览量:82次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议