数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

发布时间:2019.03.07来源:亿信华辰浏览量:88次标签:数据治理

计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外……

大数据

在每种情况下,硬件和软件的进步都需要专业技能,再将它们交到通用人才的手中。在专业人员失业的同时,这些技术的民主化引发了创新、商业和创造就业的浪潮。

同样,我坚信数据科学家的工作在五到十年内就会过气。相反,经济领域各行各业的终端用户都将会使用数据科学软件,就像现在的非技术人员使用 Excel 一样。事实上,那些数据科学的工具可能只是 Excel 2029 中的一个选项卡而已。

当今的金融分析师不再需要聘请数据科学家来帮助他们,因为他们所使用的平台已经提供了他们所需的数据科学工具。这在其他领域也会变得普遍,因为对数据科学的基本了解已经成为许多工作的必需技能。与此同时,很多数据科学的工作也正在实现自动化,一些观察人士提出警告,称数据科学家可能正在让自己失去现有的工作。

数据科学不断飙升的人气

数据科学这一职业正在经历「淘金热」时期。2018 年彭博社(Bloomberg)的一篇文章将数据科学称为「全美最热门职业」,因为从 2015 年 1 月到 2018 年 1 月,招聘网站 Indeed.com 上的数据科学家需求增加了 75%。文章还提到,在一些咨询公司,数据科学博士的薪水为 30 万美元。

同时,美国数十所大学都推出了数据分析项目。加州大学伯克利分校(UC Berkeley)在 2018 年新开设了数据科学专业,该专业很快成为了学校最受欢迎的专业之一。去年十一月,该校开设了新的数据科学与信息系,并将其称为「几十年内最大的重组」。

但这些年轻人即将进入的行业将在未来10年内发生翻天覆地的变化。尽管他们的数据科学技能可以成为一项稳定的职业财富,但他们中会直接成为数据科学家的人可能少得惊人。

从机器编码到大规模编码再到数据自动化

当我在学习计算机科学时,编译器设计是必修课。我们需要了解如何将像 C 语言这样的编程语言直接转换成机器语言,也就是计算机可以直接解释的十六进制代码。用机器语言来编写商业应用程序以获得更高的性能是很常见的做法。

在过去的几十年间,连续的软件功能层被抽象为更高级的开发工具。现如今的大多数代码都是用像 Python 这样简单易学的高级语言完成的,相对而言,程序员很少需要了解如何直接和硬件对话。

数据科学也在快速地走着同样的道路。在未来的三到五年,越高级的工具对基础技术的需求会变得越低,这些基础技术包括高性能计算(CPU 的分区问题)、数据整理(准备原始数据以便进行分析)以及机器学习系统内部或初级统计方法等。所有这些过程都将在机器内部进行。

如今,包括 Trifacta、Element Analytics 和 Kylo 在内的数十家公司都在推出新的数据分析工具,它们中的大多数旨在减少繁琐的数据准备工作,帮助数据科学家迅速完成分析工作。此外还出现了可以自动选择算法和调整参数的数据科学框架(如 Auto-sklearn 和 DataRobot)。这些框架和工具与数据管理平台相结合,为未来的数据消费者建立了大型构建块。

数据科学家的前进道路

在未来几年,我认为数据科学家将至少分为五类:

通用人才:第一类是数据科学的通用人才,他们会对数据做出解释并使用数据。这些人的工作是指导终端用户,帮助用户对数据提出问题,但他们并不会自己找出答案。这更像是一个过渡性的工作,更可能在五年内出现。

行业专家:由行业专家组成的是第二类,也是人数最多的一类。他们将在制造、医药科学以及金融这样的特定垂直领域中使用数据科学技术和工具。我认为未来的大部分工作岗位都在这里。但这也不是数据科学工作。这些人不是了解制造业的数据科学家,而是了解数据科学的制造业领袖。相当于今天的以统计学为王牌的研究员。

深度专家:有专业数据科学技术的深度专家组成了第三类,也是人数最少的一类。这一类人从事的是纯数据科学工作。他们的工作是以抽象的方式研究数据科学、提升算法性能并设计出新的通用方式。他们就像如今的计算机科学家,主要工作是建立理论基础,而非解决日常问题。

分析开发人员:第四类是从数据科学家转为分析开发的人。这些人是软件开发专家,他们的工作是处理数据交互问题,以及通过数据报告帮助人们做出推论。算法设计也是他们工作的一小部分,数据平台和以一站式方式完成大量工作的鲁棒代码库会辅助他们。

数据工程师:另外,还会催生出像数据工程师这样的新工作,他们会构建将数据转换并传输到基础平台的管道,在这个管道中会对数据进行分析和可视化。尽管数据科学家通常因他们出色的算法而得到认可,但他们高达 80% 的时间都花在收集数据、清理数据和组织数据上。

结论

在十年内,数据科学将会融入特定行业的应用和广泛应用的生产力工具中,因此我们可能认为它不再是一个热门行业。正如一代又一代的数学和统计学的学生不会再将自己视为数学家或统计学家,而是在商界和学术界中扮演了各种各样的角色,新崛起的数据科学的毕业生未来也将会成为制造工程师、营销领导者以及医药科学领域的研究人员。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业数据治理项目如何落地?

    企业数据治理项目如何落地?

    数据治理在系统层面包括数据标准、元数据、数据质量、生命周期管理、数据安全、数据资产共六大核心模块;在管理层面需要通过数据治理组织、数据治……查看详情

    发布时间:2020.06.29来源:知乎浏览量:74次

  • 大数据时代不能没有数据治理

    大数据时代不能没有数据治理

    第一个提出大数据时代到来的是全球知名咨询公司麦肯锡,现如今大数据存在于各个行业,受到了人们的重视。现在社会科技告诉发展,信息流通快,使得……查看详情

    发布时间:2019.08.13来源:知乎浏览量:58次

  • 数据治理是否灵活?

    数据治理是否灵活?

    许多组织现在认识到数据治理的必要性,但仍在努力寻找正确的方法来构建它。一个好的方法是——敏捷!……查看详情

    发布时间:2019.01.11来源:亿信华辰浏览量:66次

  • 大数据对社会有多大用处?

    大数据对社会有多大用处?

    规范性分析是商业智能(BI)中使用的四种大数据类型之一。大数据是一个描述大量数据的术语-结构化和非结构化-这些大量数据淹没了企业或任何数……查看详情

    发布时间:2018.12.29来源:数据治理浏览量:75次

  • 超越法规遵从:从数据治理创造业务价值

    超越法规遵从:从数据治理创造业务价值

    基于模型的,基于标准的数据治理语义方法正迅速成为整个金融领域的行业规范。这方面的一些最普遍和开拓性的努力是由企业数据管理委员会(EDMC……查看详情

    发布时间:2019.02.28来源:亿信华辰浏览量:77次

  • 浅谈数据质量管理

    浅谈数据质量管理

    随着互联网及数字化技术的飞速发展,我们生活在一个数字化转型的时代,各种数字化正在实实在在的改变着企业的日常运营,以及我们每个人的衣食住行……查看详情

    发布时间:2019.07.26来源:知乎浏览量:75次

  • 从数据治理看医疗大数据的发展

    从数据治理看医疗大数据的发展

    《从数据治理看医疗大数据的发展》主要分享医疗大数据中数据治理的重要性,并结合具体案例来讲述大数据治理的框架和应用心得。……查看详情

    发布时间:2019.02.25来源:网络大数据浏览量:83次

  • 数据治理到底是什么?

    数据治理到底是什么?

    幸运的是,培训可以为精通数据的员工提供这些技能。通过正确的沟通工作,您的数据治理团队可以开展治理业务,确信他们能够为您的各种数据利益相关……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:77次

  • 大数据治理的核心要素有哪些

    大数据治理的核心要素有哪些

    当今的大型企业,内部分工日趋细化,采购、服务、市场、销售、开发、支持、物流、财务、人力等各个环节,无不每时每刻产生着大量的数据。数据的格……查看详情

    发布时间:2019.10.21来源:知乎浏览量:90次

  • 什么是数据治理?为何数据治理如此重要?

    什么是数据治理?为何数据治理如此重要?

    如我们所见,数据正在以前所未有的速度增长,IDC曾发布报告称,到2025年,全球数据圈预计将增长至175 ZB。如何在这样一个数据大爆发……查看详情

    发布时间:2020.03.26来源:知乎浏览量:72次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议