数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?

发布时间:2019.03.07来源:亿信华辰浏览量:139次标签:数据治理

计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不会例外……

大数据

在每种情况下,硬件和软件的进步都需要专业技能,再将它们交到通用人才的手中。在专业人员失业的同时,这些技术的民主化引发了创新、商业和创造就业的浪潮。

同样,我坚信数据科学家的工作在五到十年内就会过气。相反,经济领域各行各业的终端用户都将会使用数据科学软件,就像现在的非技术人员使用 Excel 一样。事实上,那些数据科学的工具可能只是 Excel 2029 中的一个选项卡而已。

当今的金融分析师不再需要聘请数据科学家来帮助他们,因为他们所使用的平台已经提供了他们所需的数据科学工具。这在其他领域也会变得普遍,因为对数据科学的基本了解已经成为许多工作的必需技能。与此同时,很多数据科学的工作也正在实现自动化,一些观察人士提出警告,称数据科学家可能正在让自己失去现有的工作。

数据科学不断飙升的人气

数据科学这一职业正在经历「淘金热」时期。2018 年彭博社(Bloomberg)的一篇文章将数据科学称为「全美最热门职业」,因为从 2015 年 1 月到 2018 年 1 月,招聘网站 Indeed.com 上的数据科学家需求增加了 75%。文章还提到,在一些咨询公司,数据科学博士的薪水为 30 万美元。

同时,美国数十所大学都推出了数据分析项目。加州大学伯克利分校(UC Berkeley)在 2018 年新开设了数据科学专业,该专业很快成为了学校最受欢迎的专业之一。去年十一月,该校开设了新的数据科学与信息系,并将其称为「几十年内最大的重组」。

但这些年轻人即将进入的行业将在未来10年内发生翻天覆地的变化。尽管他们的数据科学技能可以成为一项稳定的职业财富,但他们中会直接成为数据科学家的人可能少得惊人。

从机器编码到大规模编码再到数据自动化

当我在学习计算机科学时,编译器设计是必修课。我们需要了解如何将像 C 语言这样的编程语言直接转换成机器语言,也就是计算机可以直接解释的十六进制代码。用机器语言来编写商业应用程序以获得更高的性能是很常见的做法。

在过去的几十年间,连续的软件功能层被抽象为更高级的开发工具。现如今的大多数代码都是用像 Python 这样简单易学的高级语言完成的,相对而言,程序员很少需要了解如何直接和硬件对话。

数据科学也在快速地走着同样的道路。在未来的三到五年,越高级的工具对基础技术的需求会变得越低,这些基础技术包括高性能计算(CPU 的分区问题)、数据整理(准备原始数据以便进行分析)以及机器学习系统内部或初级统计方法等。所有这些过程都将在机器内部进行。

如今,包括 Trifacta、Element Analytics 和 Kylo 在内的数十家公司都在推出新的数据分析工具,它们中的大多数旨在减少繁琐的数据准备工作,帮助数据科学家迅速完成分析工作。此外还出现了可以自动选择算法和调整参数的数据科学框架(如 Auto-sklearn 和 DataRobot)。这些框架和工具与数据管理平台相结合,为未来的数据消费者建立了大型构建块。

数据科学家的前进道路

在未来几年,我认为数据科学家将至少分为五类:

通用人才:第一类是数据科学的通用人才,他们会对数据做出解释并使用数据。这些人的工作是指导终端用户,帮助用户对数据提出问题,但他们并不会自己找出答案。这更像是一个过渡性的工作,更可能在五年内出现。

行业专家:由行业专家组成的是第二类,也是人数最多的一类。他们将在制造、医药科学以及金融这样的特定垂直领域中使用数据科学技术和工具。我认为未来的大部分工作岗位都在这里。但这也不是数据科学工作。这些人不是了解制造业的数据科学家,而是了解数据科学的制造业领袖。相当于今天的以统计学为王牌的研究员。

深度专家:有专业数据科学技术的深度专家组成了第三类,也是人数最少的一类。这一类人从事的是纯数据科学工作。他们的工作是以抽象的方式研究数据科学、提升算法性能并设计出新的通用方式。他们就像如今的计算机科学家,主要工作是建立理论基础,而非解决日常问题。

分析开发人员:第四类是从数据科学家转为分析开发的人。这些人是软件开发专家,他们的工作是处理数据交互问题,以及通过数据报告帮助人们做出推论。算法设计也是他们工作的一小部分,数据平台和以一站式方式完成大量工作的鲁棒代码库会辅助他们。

数据工程师:另外,还会催生出像数据工程师这样的新工作,他们会构建将数据转换并传输到基础平台的管道,在这个管道中会对数据进行分析和可视化。尽管数据科学家通常因他们出色的算法而得到认可,但他们高达 80% 的时间都花在收集数据、清理数据和组织数据上。

结论

在十年内,数据科学将会融入特定行业的应用和广泛应用的生产力工具中,因此我们可能认为它不再是一个热门行业。正如一代又一代的数学和统计学的学生不会再将自己视为数学家或统计学家,而是在商界和学术界中扮演了各种各样的角色,新崛起的数据科学的毕业生未来也将会成为制造工程师、营销领导者以及医药科学领域的研究人员。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 跨域数据交换平台解决方案

    跨域数据交换平台解决方案

    随着信息社会的不断发展,信息融合正逐步走向深化。业务系统如何跨越不同安全等级的网络域进行数据传输,是整合各类信息资源、降低各系统间信息壁……查看详情

    发布时间:2020.08.07来源:知乎浏览量:213次

  • 2019年的数据管理趋势:治理,DataOps,云

    2019年的数据管理趋势:治理,DataOps,云

    GDPR的数据治理要求,对AI驱动的分析的追求以及云计算的拉动为2018年数据管理和大数据团队的努力奠定了基调。这些和相关的数据管理趋势……查看详情

    发布时间:2019.01.02来源:亿信华辰浏览量:124次

  • 谈谈工业企业数据治理建设的趋势

    谈谈工业企业数据治理建设的趋势

    工业企业数据环境复杂,数据类型多、产生速度快、数据量大、数据质量不高、数据人才匮乏,因此如何发挥和挖掘数据要素的价值成为当代企业关注的话……查看详情

    发布时间:2022.06.28来源:互联网浏览量:408次

  • 数据治理的价值体系包括哪些方面?

    数据治理的价值体系包括哪些方面?

    数据治理的目标是通过对数据资产的有效管控持续创造价值,价值域通过对治理结果的有效整理,通过构建具体化的数据产品,实现上述的价值创造。那么……查看详情

    发布时间:2022.05.05来源:小亿浏览量:342次

  • 谈大数据时代下的数据治理

    谈大数据时代下的数据治理

    2013年被众多的IT人定义为中国的大数据元年,这一年国内的大数据项目开始在交通、电信、金融部门被广泛推动。各大银行对Hadoop的规划……查看详情

    发布时间:2019.01.03来源:亿信华辰浏览量:124次

  • 如何搭建数据质量管理平台

    如何搭建数据质量管理平台

    数据往往在一个企业是相当于一个重要资产,企业在经营的过程中也会积累不少各类数据,这类数据后期也可通过归纳、提炼从而进行深度挖掘分析,给企……查看详情

    发布时间:2019.07.30来源:知乎浏览量:143次

  • 数据治理到底应该怎么治?

    数据治理到底应该怎么治?

    数据到底怎么治,这确实是一个宽泛的话题,首先是要明确治理的内容。针对不同的治理内容采取不同的数据治理策略。关于小数据和大数据的治理侧重点……查看详情

    发布时间:2020.07.07来源:知乎浏览量:152次

  • 大数据必备知识:数据的分类方式

    大数据必备知识:数据的分类方式

    数据分类在收集、处理和应用数据过程中非常重要。数据的分类方式很多,每种方式都有特别的作用。数据工作中不同角色往往需要理解和掌握不同的分类……查看详情

    发布时间:2019.03.12来源:亿信华辰浏览量:162次

  • 数据治理和当今的新数据目标

    数据治理和当今的新数据目标

    尽管实施全面的治理计划似乎令人生畏,但拥有有效数据治理策略和MDM解决方案的公司不断寻找新方法从数据中提取价值。……查看详情

    发布时间:2019.03.25来源:亿信华辰浏览量:132次

  • 为什么您的主数据管理需要数据治理

    为什么您的主数据管理需要数据治理

    近年来,各组织越来越意识到他们的数据及其在最关键业务功能的成功或失败中所起的作用。这种思维方式的转变以及云技术的发展已经形成了技术预算变……查看详情

    发布时间:2018.12.25来源:数据治理浏览量:140次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议