数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

发布时间:2019.03.07来源:亿信华辰浏览量:61次标签:数据治理

计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外……

大数据

在每种情况下,硬件和软件的进步都需要专业技能,再将它们交到通用人才的手中。在专业人员失业的同时,这些技术的民主化引发了创新、商业和创造就业的浪潮。

同样,我坚信数据科学家的工作在五到十年内就会过气。相反,经济领域各行各业的终端用户都将会使用数据科学软件,就像现在的非技术人员使用 Excel 一样。事实上,那些数据科学的工具可能只是 Excel 2029 中的一个选项卡而已。

当今的金融分析师不再需要聘请数据科学家来帮助他们,因为他们所使用的平台已经提供了他们所需的数据科学工具。这在其他领域也会变得普遍,因为对数据科学的基本了解已经成为许多工作的必需技能。与此同时,很多数据科学的工作也正在实现自动化,一些观察人士提出警告,称数据科学家可能正在让自己失去现有的工作。

数据科学不断飙升的人气

数据科学这一职业正在经历「淘金热」时期。2018 年彭博社(Bloomberg)的一篇文章将数据科学称为「全美最热门职业」,因为从 2015 年 1 月到 2018 年 1 月,招聘网站 Indeed.com 上的数据科学家需求增加了 75%。文章还提到,在一些咨询公司,数据科学博士的薪水为 30 万美元。

同时,美国数十所大学都推出了数据分析项目。加州大学伯克利分校(UC Berkeley)在 2018 年新开设了数据科学专业,该专业很快成为了学校最受欢迎的专业之一。去年十一月,该校开设了新的数据科学与信息系,并将其称为「几十年内最大的重组」。

但这些年轻人即将进入的行业将在未来10年内发生翻天覆地的变化。尽管他们的数据科学技能可以成为一项稳定的职业财富,但他们中会直接成为数据科学家的人可能少得惊人。

从机器编码到大规模编码再到数据自动化

当我在学习计算机科学时,编译器设计是必修课。我们需要了解如何将像 C 语言这样的编程语言直接转换成机器语言,也就是计算机可以直接解释的十六进制代码。用机器语言来编写商业应用程序以获得更高的性能是很常见的做法。

在过去的几十年间,连续的软件功能层被抽象为更高级的开发工具。现如今的大多数代码都是用像 Python 这样简单易学的高级语言完成的,相对而言,程序员很少需要了解如何直接和硬件对话。

数据科学也在快速地走着同样的道路。在未来的三到五年,越高级的工具对基础技术的需求会变得越低,这些基础技术包括高性能计算(CPU 的分区问题)、数据整理(准备原始数据以便进行分析)以及机器学习系统内部或初级统计方法等。所有这些过程都将在机器内部进行。

如今,包括 Trifacta、Element Analytics 和 Kylo 在内的数十家公司都在推出新的数据分析工具,它们中的大多数旨在减少繁琐的数据准备工作,帮助数据科学家迅速完成分析工作。此外还出现了可以自动选择算法和调整参数的数据科学框架(如 Auto-sklearn 和 DataRobot)。这些框架和工具与数据管理平台相结合,为未来的数据消费者建立了大型构建块。

数据科学家的前进道路

在未来几年,我认为数据科学家将至少分为五类:

通用人才:第一类是数据科学的通用人才,他们会对数据做出解释并使用数据。这些人的工作是指导终端用户,帮助用户对数据提出问题,但他们并不会自己找出答案。这更像是一个过渡性的工作,更可能在五年内出现。

行业专家:由行业专家组成的是第二类,也是人数最多的一类。他们将在制造、医药科学以及金融这样的特定垂直领域中使用数据科学技术和工具。我认为未来的大部分工作岗位都在这里。但这也不是数据科学工作。这些人不是了解制造业的数据科学家,而是了解数据科学的制造业领袖。相当于今天的以统计学为王牌的研究员。

深度专家:有专业数据科学技术的深度专家组成了第三类,也是人数最少的一类。这一类人从事的是纯数据科学工作。他们的工作是以抽象的方式研究数据科学、提升算法性能并设计出新的通用方式。他们就像如今的计算机科学家,主要工作是建立理论基础,而非解决日常问题。

分析开发人员:第四类是从数据科学家转为分析开发的人。这些人是软件开发专家,他们的工作是处理数据交互问题,以及通过数据报告帮助人们做出推论。算法设计也是他们工作的一小部分,数据平台和以一站式方式完成大量工作的鲁棒代码库会辅助他们。

数据工程师:另外,还会催生出像数据工程师这样的新工作,他们会构建将数据转换并传输到基础平台的管道,在这个管道中会对数据进行分析和可视化。尽管数据科学家通常因他们出色的算法而得到认可,但他们高达 80% 的时间都花在收集数据、清理数据和组织数据上。

结论

在十年内,数据科学将会融入特定行业的应用和广泛应用的生产力工具中,因此我们可能认为它不再是一个热门行业。正如一代又一代的数学和统计学的学生不会再将自己视为数学家或统计学家,而是在商界和学术界中扮演了各种各样的角色,新崛起的数据科学的毕业生未来也将会成为制造工程师、营销领导者以及医药科学领域的研究人员。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 企业大数据体系构建,从这4层逐步递进递进

    企业大数据体系构建,从这4层逐步递进递进

    关于企业的大数据体系构建,可以分为4个层级,每个层级之间可以是递进的关系,虽然业务主导不同,但构建思路相通。关于企业的大数据体系构建,可……查看详情

    发布时间:2019.05.20来源:数据分析网浏览量:51次

  • 打破数据治理:数据质量

    打破数据治理:数据质量

    任何数据驱动的计划的成功取决于该数据是否相关且值得信赖。随着越来越多的大学将数据视为负责任的战略规划和计划的关键,许多人都意识到:有些数……查看详情

    发布时间:2019.07.11来源:知乎浏览量:67次

  • 数据治理:收集表单数据的最佳实践

    数据治理:收集表单数据的最佳实践

    什么是数据治理以及它与您的组织有什么关系?……查看详情

    发布时间:2019.03.26来源:亿信华辰浏览量:38次

  • 数据治理金融行业解决方案

    数据治理金融行业解决方案

    我国银行数据现状1、缺乏数据梳理,造成行领导看到的数据相互冲突和矛盾 2、业务职能不清晰或相互重叠,观察数据视角不尽相同,缺少数据标准与……查看详情

    发布时间:2019.08.26来源:知乎浏览量:57次

  • 治理:如何做对

    治理:如何做对

    如果您在任何规模的组织中工作,您可能不得不与某种治理委员会打交道。这些都是出了名的狡猾。继续阅读,看看如何避免常见的陷阱。……查看详情

    发布时间:2019.03.11来源:亿信华辰浏览量:43次

  • 数据治理中如何做好数据清理与归档

    数据治理中如何做好数据清理与归档

    传统上,数据的清理和归档属于DBA的职责,随着企业数字化转型、数据治理工作的推进,这项工作也被纳入了数据治理工作的重要内容。数据团队定期……查看详情

    发布时间:2022.05.31来源:互联网浏览量:164次

  • 大数据时代地方政府大数据治理战略

    大数据时代地方政府大数据治理战略

    全球各地的组织正在投资于能够以先前无法想象的方式容纳和处理数据的系统。在某些情况下,企业甚至会根据这些新系统重新构建现有的IT环境。这些……查看详情

    发布时间:2019.08.15来源:浏览量:34次

  • 最终有人把数据治理的元数据、主数据等概念讲明白了

    最终有人把数据治理的元数据、主数据等概念讲明白了

    数据治理就是以服务组织战略目标为基本原则,通过组织成员的协同努力,流程制度的制定,以及数据资产的梳理、采集清洗、结构化存储、可视化管理和……查看详情

    发布时间:2022.06.24来源:小亿浏览量:99次

  • 数据治理:指定您的业务战略

    数据治理:指定您的业务战略

    数据治理是作为一个重要的业务计划,治理需要政策,所以在进行治理的时候就需要通过多方协调找到最适合自身组织的治理方法。 ……查看详情

    发布时间:2019.09.04来源:知乎浏览量:38次

  • 数据治理的重点领域:关注管理层调整

    数据治理的重点领域:关注管理层调整

    当管理者发现由于其对运营或合规工作的潜在影响而难以做出“常规”数据相关的管理决策时,这种类型的程序通常会存在。……查看详情

    发布时间:2019.03.19来源:亿信华辰浏览量:37次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议