构建有效的数据科学团队

发布时间:2019.03.15来源:亿信华辰浏览量:63次标签:数据治理


随着数据科学和人工智能几乎进入阳光下的每个行业,建立一个能够建立成功的AI项目的团队的挑战也是如此。对统计学家,程序员和沟通者完美融合的原型“数据科学家”的需求从未如此强烈。但随着尘埃落定,我们开始听到失败的 项目和  失望的  专业人士的故事  。

您可能听说过昂贵的专家团队一次又一次失败。作为一名在各个行业工作的数据科学顾问,我有机会亲眼看到这一趋势。许多人倾向于认为数据科学是一个新领域,并期望它成为主流时会有成长的痛苦,但我们忘记了这个领域的来源。这是我尝试通过自己的经验反映成功数据团队的品质,并帮助商业领袖和高管创建更好的人工智能策略。

不要忘记你的根

首先,我们需要将数据科学视为现有学科的自然演变,而不是全新的学科。毕竟,我们在计算机时代开始之前一直在处理数据,至少从20世纪60年代开始,人工智能的概念就已存在。其他学科,如数据库知识发现,决策支持系统,商业智能,数据挖掘,分析,预测分析等,已经存在很长时间了。每个人的主要目标是从数据中提取有意义的模式,并利用这些模式获取见解并为未来做出决策。

数据科学是这一趋势的最新体现,这是因为我们在互联网时代可以获得的数量和种类数据大量增加。相对便宜的计算能力和机器学习算法的新突破可以利用这些丰富的数据进一步推动它。这些新算法的复杂性和数学复杂性的增加使得具有高级学位的人突然需要能够理解它们,因此AI比赛已经开始。

但尽管这项技术显而易见,但我坚信,我们可以从旧学科中的神话和最佳实践中学到很多东西。

秘密成分?

好的,这是一个棘手的问题。我见过公司经常会遇到最新最好的算法和计算处理器,同时把数据视为   理所当然。我们可能有大量数据可用,但数据的质量不是特定的。良好的数据仍然难以收集,因此可能是您可能拥有的主要竞争优势。除非您提供良好的数据,否则最好的算法无法保证良好的模型。正如他们所说 - 垃圾进去,垃圾出来。

人工智能最容易被忽视的一个方面是,大多数算法都是通过开源软件或通过云提供商以极低的成本免费提供的。在某种程度上,AI算法已经或将要通过这些库和服务商品化。

我的建议是首先将您的数据科学路线图分解为每个人都同意的简单用例,并且可以在一位数的周数内实现。还要确保可以获得数据,明确定义ROI和/或可交付成果,并且数据团队遵循迭代执行过程。

因为,数据是任何数据科学战略中最重要的组成部分,您需要的第一批人才是  数据工程师。数据工程师通常是具有良好编程和硬件技能的人员,可以构建您的数据基础架构。这取决于您的数据大小,但他们通常很适合使用大数据和云技术,知道如何构建数据管道,设计数据库以及从中提取数据。他们将知道如何在基本级别查看数据,并对数据质量进行简单的聚合以进行健全性检查,但不一定是分析数据的专家。

在构建了数据基础架构之后,您将需要能够获取该数据的人员,清理它,分析数据,在其上运行实验并传达结果。根据您的业务需求,确切的技能会有所不同。大部分时间,这项工作由数据分析师完成,   他们擅长处理和清理数据,创建统计推断或预测模型,运行实验,绘制结果,创建报告以及向更高层次的利益相关者提供见解。他们主要在Jupyter笔记本或Rstudio工作,并结合了编程,统计和机器学习知识。我们不应指望他们编写生产质量代码。

这让我接下来的角色。如果您正在构建数据产品,则需要  团队中的机器学习工程师 。这些人不是构建机器学习算法的研究人员,而是熟悉各种数据科学库的数据聚焦软件开发人员,并且知道如何根据分析师开发的模型编写生产质量代码。要完成这项工作,他们必须与数据工程师密切合作,或者也可以由数学精通的数据工程师为小型团队完成。大多数希望进入数据科学领域的开发人员都应该将其视为一个很好的职业选择。

有时,拥有一个更注重设计的数据可视化专家  来创建高度优化的图表和报告以传达分析结果也可能是有用  的。

我倾向于将  数据科学家  视为在所有上述角色中均高于平均水平的人,以及谁知道如何与  领域专家合作  以提供结果。这些合作者通常在您的团队或组织之外,在医学,金融,经济学,市场营销,法律等案例中利用他们的主题专业知识。

如果您正在处理需要某些自定义或专有数据科学算法的问题,那么可能需要聘请具有博士或核心研究背景的人员。他们可能对会话AI,计算机视觉,机器人,强化学习,图形模型等AI领域背后的理论和算法有深刻的理解。我倾向于喜欢  研究工程师 或  研究科学家这样  的角色。

数据科学团队中另一个重要但较少谈论的角色是  数据科学经理  或  数据科学负责人。对于规模较小的团队而言,拥有一名对团队中所有不同角色有深入了解的团队中的高级成员可能就足够了。但是一旦团队成长,你可能需要具备强大技术和商业战略背景的人。

数据科学经理是实践领导者,他们将构建您的数据科学战略的基础,招募和建立您的团队,确保每个人彼此交互,拥有他们需要的数据和信息,并开发整个团队的流程可以按照。它们是数据团队与组织其他成员,协作者和管理人员的接口。他们将复杂的AI术语翻译成非专家,并确保他们的工作与整个组织的战略保持一致。

管理者需要经常发挥的另一个重要作用是在整个团队中设计  数据治理  和  道德 标准。来自该领域的大多数专业人员都学习了完成工作所需的技术技能,但我很少看到数据隐私和分析结果的道德沟通的重要性。这导致像Facebook丑闻一样   使我们的领域声名狼借。在我看来,拥有在团队中了解并执行这些价值观的人会让您超越其他人。

所以,这些是我对成功的数据科学团队的看法。主要的方法是 - 如果我们始终保持简单的策略,在合适的时间雇用合适的人员,利用从以前的领域收集的知识,并开发一个最适合您的团队和目标的过程,有没有理由你不能成为一个有效的数据驱动组织。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理那些事儿

    数据治理那些事儿

    业务分析师不得不对IT部门负责,因为他们不知道如何导航信息管理系统数据库,即使他们可以也不会被授予访问权限。IT部门打印出月度报告并分发……查看详情

    发布时间:2019.08.29来源:简书浏览量:70次

  • 统一数据平台 - 连接所有重要事项

    统一数据平台 - 连接所有重要事项

    企业可以从统一的数据平台中获益良多。……查看详情

    发布时间:2019.02.15来源:亿信华辰浏览量:41次

  • 主数据管理第二步——体系构建

    主数据管理第二步——体系构建

    “纸上得来终觉浅,绝知此事要躬行。”然而主数据管理工作该怎么做?流程是怎样的?责任如何落实?……这些问题无不与主数据管理体系的构建有着密……查看详情

    发布时间:2019.10.24来源:亿信华辰浏览量:50次

  • 企业架构与数据治理:探索链接

    企业架构与数据治理:探索链接

    从公司意义上讲,创新管理是通过采用创新的想法,产品,流程和业务模型,快速有效地实现组织目标。大多数组织开始意识到,为了推动业务增长并保持……查看详情

    发布时间:2019.02.19来源:亿信华辰浏览量:73次

  • 从数据管理开始 才能为人工智能的成功做好准备

    从数据管理开始 才能为人工智能的成功做好准备

    如果你已经决定在今年做更多的人工智能实验,请首先仔细研究您的数据管理实践。……查看详情

    发布时间:2019.02.15来源:亿信华辰浏览量:49次

  • 如何开展企业ERP(SAP)数据治理工作?

    如何开展企业ERP(SAP)数据治理工作?

    在企业ERP数据治理这个范畴上,我们应该首先解决的是企业对其数据的了解和认知。由于IT系统数据模型反映了应用关系型数据库在数据存储及数据……查看详情

    发布时间:2019.01.07来源:飞鱼浏览量:51次

  • 数据治理的十五个最佳实践

    数据治理的十五个最佳实践

    数据治理研究所(DGI)认为,它是一套切实可行的框架,帮助任何组织的各种数据利益相关方识别并满足其信息需求。DGI认为,企业不仅需要管理……查看详情

    发布时间:2020.07.31来源:知乎浏览量:60次

  • 主数据管理平台有哪些?

    主数据管理平台有哪些?

    主数据管理平台正是基于平台型建设思路设计的多主题域管理平台,以统一的数据平台为支撑,通过数据模型的扩展,实现对企业的顶层业务模型的支持,……查看详情

    发布时间:2022.05.09来源:小亿浏览量:138次

  • 数据治理的7大误区

    数据治理的7大误区

    大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物,然而如果石油的杂质太多,电流的电压不稳,数据的价值岂不是大……查看详情

    发布时间:2018.11.30来源:51cto浏览量:54次

  • [数据治理方法论]6点数据治理最佳实施方法

    [数据治理方法论]6点数据治理最佳实施方法

    在寻找数据治理最佳实施方法时,您可以从其他通过数据治理项目的各种流程和模型中学到东西。尽管每个企业都不同,但仍有可借鉴之处,因此无需完全……查看详情

    发布时间:2021.05.28来源:亿信数据治理知识库浏览量:90次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议