构建有效的数据科学团队

发布时间:2019.03.15来源:亿信华辰浏览量:8次标签:数据治理


随着数据科学和人工智能几乎进入阳光下的每个行业,建立一个能够建立成功的AI项目的团队的挑战也是如此。对统计学家,程序员和沟通者完美融合的原型“数据科学家”的需求从未如此强烈。但随着尘埃落定,我们开始听到失败的 项目和  失望的  专业人士的故事  。

您可能听说过昂贵的专家团队一次又一次失败。作为一名在各个行业工作的数据科学顾问,我有机会亲眼看到这一趋势。许多人倾向于认为数据科学是一个新领域,并期望它成为主流时会有成长的痛苦,但我们忘记了这个领域的来源。这是我尝试通过自己的经验反映成功数据团队的品质,并帮助商业领袖和高管创建更好的人工智能策略。

不要忘记你的根

首先,我们需要将数据科学视为现有学科的自然演变,而不是全新的学科。毕竟,我们在计算机时代开始之前一直在处理数据,至少从20世纪60年代开始,人工智能的概念就已存在。其他学科,如数据库知识发现,决策支持系统,商业智能,数据挖掘,分析,预测分析等,已经存在很长时间了。每个人的主要目标是从数据中提取有意义的模式,并利用这些模式获取见解并为未来做出决策。

数据科学是这一趋势的最新体现,这是因为我们在互联网时代可以获得的数量和种类数据大量增加。相对便宜的计算能力和机器学习算法的新突破可以利用这些丰富的数据进一步推动它。这些新算法的复杂性和数学复杂性的增加使得具有高级学位的人突然需要能够理解它们,因此AI比赛已经开始。

但尽管这项技术显而易见,但我坚信,我们可以从旧学科中的神话和最佳实践中学到很多东西。

秘密成分?

好的,这是一个棘手的问题。我见过公司经常会遇到最新最好的算法和计算处理器,同时把数据视为   理所当然。我们可能有大量数据可用,但数据的质量不是特定的。良好的数据仍然难以收集,因此可能是您可能拥有的主要竞争优势。除非您提供良好的数据,否则最好的算法无法保证良好的模型。正如他们所说 - 垃圾进去,垃圾出来。

人工智能最容易被忽视的一个方面是,大多数算法都是通过开源软件或通过云提供商以极低的成本免费提供的。在某种程度上,AI算法已经或将要通过这些库和服务商品化。

我的建议是首先将您的数据科学路线图分解为每个人都同意的简单用例,并且可以在一位数的周数内实现。还要确保可以获得数据,明确定义ROI和/或可交付成果,并且数据团队遵循迭代执行过程。

因为,数据是任何数据科学战略中最重要的组成部分,您需要的第一批人才是  数据工程师。数据工程师通常是具有良好编程和硬件技能的人员,可以构建您的数据基础架构。这取决于您的数据大小,但他们通常很适合使用大数据和云技术,知道如何构建数据管道,设计数据库以及从中提取数据。他们将知道如何在基本级别查看数据,并对数据质量进行简单的聚合以进行健全性检查,但不一定是分析数据的专家。

在构建了数据基础架构之后,您将需要能够获取该数据的人员,清理它,分析数据,在其上运行实验并传达结果。根据您的业务需求,确切的技能会有所不同。大部分时间,这项工作由数据分析师完成,   他们擅长处理和清理数据,创建统计推断或预测模型,运行实验,绘制结果,创建报告以及向更高层次的利益相关者提供见解。他们主要在Jupyter笔记本或Rstudio工作,并结合了编程,统计和机器学习知识。我们不应指望他们编写生产质量代码。

这让我接下来的角色。如果您正在构建数据产品,则需要  团队中的机器学习工程师 。这些人不是构建机器学习算法的研究人员,而是熟悉各种数据科学库的数据聚焦软件开发人员,并且知道如何根据分析师开发的模型编写生产质量代码。要完成这项工作,他们必须与数据工程师密切合作,或者也可以由数学精通的数据工程师为小型团队完成。大多数希望进入数据科学领域的开发人员都应该将其视为一个很好的职业选择。

有时,拥有一个更注重设计的数据可视化专家  来创建高度优化的图表和报告以传达分析结果也可能是有用  的。

我倾向于将  数据科学家  视为在所有上述角色中均高于平均水平的人,以及谁知道如何与  领域专家合作  以提供结果。这些合作者通常在您的团队或组织之外,在医学,金融,经济学,市场营销,法律等案例中利用他们的主题专业知识。

如果您正在处理需要某些自定义或专有数据科学算法的问题,那么可能需要聘请具有博士或核心研究背景的人员。他们可能对会话AI,计算机视觉,机器人,强化学习,图形模型等AI领域背后的理论和算法有深刻的理解。我倾向于喜欢  研究工程师 或  研究科学家这样  的角色。

数据科学团队中另一个重要但较少谈论的角色是  数据科学经理  或  数据科学负责人。对于规模较小的团队而言,拥有一名对团队中所有不同角色有深入了解的团队中的高级成员可能就足够了。但是一旦团队成长,你可能需要具备强大技术和商业战略背景的人。

数据科学经理是实践领导者,他们将构建您的数据科学战略的基础,招募和建立您的团队,确保每个人彼此交互,拥有他们需要的数据和信息,并开发整个团队的流程可以按照。它们是数据团队与组织其他成员,协作者和管理人员的接口。他们将复杂的AI术语翻译成非专家,并确保他们的工作与整个组织的战略保持一致。

管理者需要经常发挥的另一个重要作用是在整个团队中设计  数据治理  和  道德 标准。来自该领域的大多数专业人员都学习了完成工作所需的技术技能,但我很少看到数据隐私和分析结果的道德沟通的重要性。这导致像Facebook丑闻一样   使我们的领域声名狼借。在我看来,拥有在团队中了解并执行这些价值观的人会让您超越其他人。

所以,这些是我对成功的数据科学团队的看法。主要的方法是 - 如果我们始终保持简单的策略,在合适的时间雇用合适的人员,利用从以前的领域收集的知识,并开发一个最适合您的团队和目标的过程,有没有理由你不能成为一个有效的数据驱动组织。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 如何有效地进行数据治理?

    如何有效地进行数据治理?

    无论企业大小,在使用数据上都面临相似的数据挑战。企业越大,数据越多,而数据越多,越发需要制定一个有效的、正式的数据治理策略。……查看详情

    发布时间:2018.12.10来源:亿信华辰浏览量:20次

  • 智与理的结合:当数据治理遇上人工智能

    智与理的结合:当数据治理遇上人工智能

    近日,中国移动研究院发布文章,解说了数据治理和人工智能两者之间各自发展历程,论证了两者在结构功能上的相互作用,阐明了两者共同发展的前……查看详情

    发布时间:2018.09.18来源:中国大数据产业观察网浏览量:15次

  • 如何有效的进行数据交换管理

    如何有效的进行数据交换管理

    在现代信息社会,政府、企事业单位相继建立了各自的信息管理系统,这些独立的系统创建之初没有统一的规划,彼此之间数据的存储环境和存储形式差异……查看详情

    发布时间:2020.04.23来源:知乎浏览量:16次

  • 提高企业数据质量能做些什么?

    提高企业数据质量能做些什么?

    如今,我们生活在数据时代,各种数字化正在实实在在的改变着企业的日常运营,我们的生活、工作、学习,现在都离不开数据,对于企业来说,数据就是……查看详情

    发布时间:2019.11.01来源:知乎浏览量:14次

  • 为什么数据治理是数据管理的关键

    为什么数据治理是数据管理的关键

    如果要将数据用于战略业务决策,运营效率,增加盈利能力和增强增长,那么正确管理数据至关重要。管理不善的数据导致数据不信任,数据利用率很快就……查看详情

    发布时间:2019.06.18来源:知乎浏览量:4次

  • 区块链是金融数据治理的天然工具

    区块链是金融数据治理的天然工具

    一、从金融数据管理到金融数据治理进入“大数据时代”,不仅催生更多金融业态,数据体量更是呈现爆炸式增长。如何将金融……查看详情

    发布时间:2019.01.07来源:亿信华辰浏览量:16次

  • 企业做好数据治理才能更快更好地推进数字化转型

    企业做好数据治理才能更快更好地推进数字化转型

    企业做好数据治理才能更快更好地推进数字化转型数据治理之“困”在谈到当前的数据治理之“困”时,主要有四方面:……查看详情

    发布时间:2019.12.12来源:知乎浏览量:11次

  • 企业数字化转型需重视哪些问题

    企业数字化转型需重视哪些问题

    大数据可以帮助企业制定可行的战略规划,获取客户洞察力,支持客户购买行为,建立新的商业模式,从而赢得竞争优势。成功的企业数字案例显然有自己……查看详情

    发布时间:2019.11.07来源:知乎浏览量:10次

  • 数据治理的3W1H:治什么?谁来治?怎么治?选哪个?

    数据治理的3W1H:治什么?谁来治?怎么治?选哪个?

    数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁能根据什么信息,在什……查看详情

    发布时间:2021.04.23来源:浏览量:32次

  • 简述标准的数据治理流程及实施细则

    简述标准的数据治理流程及实施细则

    在企业业务高速发展的过程中,数据的规范性与质量受到的重视度并不高。随着大数据时代的到来,由于公司战略政策和业务日益变大的数据需求和要求,……查看详情

    发布时间:2022.03.09来源:小亿浏览量:89次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议