强大的数据治理是机器学习成功的关键

发布时间:2019.01.17来源:数据治理浏览量:127次标签:数据治理

人工智能和机器学习这两个术语通常被视为同一枚硬币的两面。尽管如此,虽然ML算法增强了AI功能,并使它们能够进行更多的尖端和智能计算,但还有一层额外的感知不可穿透性,现在它掩盖了机器推理和做出有影响力的决策的能力。
行业专家推测机器学习算法是潜在的“ 黑匣子”,这主要是因为人们对信任生态系统持怀疑态度,因为生态系统对数据合规性和决策过程的透明度有限。
全球数据分析师社区帮助设计了AI或ML驱动的半自动或全自动分析系统。但是,数据质量的核心和经常出现问题可能总是占上风。除此之外,各种各样不同的数据源,巨大的数据量和非结构化数据类型增加了现有的数据管理问题,特别是与数据治理相关的问题。
随着ML的发展势头并继续处于改变组织运作方式的最前沿,谨慎行事可能是明智之举。在缺乏强大的数据治理流程的情况下,允许ML完全接管决策流程的热情有可能释放出一些关键问题 - 不可靠和误导性的信息以及意外的费用开销。
那么我们如何有效地做到这一点:
建立,组织和实施有效且稳健的ML模型的必要性之间的差距是否应该弥合?
我们是否应该满足指数级增长的需求,以及理解和解密这些模型如何工作的需要?
我们如何理解ML算法正在访问和利用的数据?此外,长期持续且往往不可逆转的后果是什么?
数据治理无疑是最合乎逻辑的答案。

作为框架的数据治理定义并帮助实现对任何生态系统中使用的数据的可获得性,可用性,完整性,安全性和有效性的整体管理。


在当今竞争激烈的世界中,每个组织都需要一个精心设计和可持续的数据治理模型,在加强数据治理和不限制机器学习的深远潜力之间取得适当的平衡。
那么数据治理如何影响ML和AI呢?
实施数据治理模型的最初步骤可能是最难的,并且面临最大阻力。数据治理不仅仅是关于合规性,它也是一门可以加速ML工作并使AI成为一种力量的学科:
有什么优点?
数据治理提供了一种朴实无华的直接方法,用于跟踪和保护正确数据的使用,但也可识别数据错误并及时引发危险信号并帮助消除这些错误。
它使组织能够花更少的时间挖掘提供ML算法所需的准确数据源,并将更多时间用于创建和改进AI模型。
数据治理的最大好处是它可以证明数据是可靠且一致的。这是必要的,因为越来越多的组织现在依赖大量数据,做出业务决策,增加运营,创造新业务,并提高盈利能力。
有什么缺点?
      太多的治理可能会受到限制,因为试图控制大量数据的最大缺点之一是忽视业务需求和目标。组织最终可能浪费大量宝贵的时间和资源,通过不重要的数据进行过滤,并最终获得具有重要价值的数据来为ML算法提供支持。
      数据治理模型也可能对数据的处理方式施加限制,并且可能会引起争议,并且通常会限制组织的进展。
ML算法可能发现数据过滤和策划规则过于严格,并且约束可能限制其在现代和动态演进的数据环境中有效执行的固有能力。
      随着ML和AI的使用和范围的发展,以及更新的技术的实施,数据治理将获得更广泛的应用和接受。最近发生的大量高安全性数据违规事件使数据安全成为数据治理工作的重要组成部分。欧盟(EU)关于通用数据保护法规(GDPR)的指令是数据治理措施的一个主要例子,并强化了建立更强大模型的必要性。
       我们还有很长的路要走,以发现ML和AI的完整潜力和企业真正的能力。在一天结束时,在破坏性数据,智能ML算法和快速发展的AI环境的世界中,数据治理是为疯狂提供一些急需方法的唯一方法。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 面对数据治理的挑战及难点,如何找到最佳方案?

    面对数据治理的挑战及难点,如何找到最佳方案?

    面对以上8点数据治理最佳实践方法,小编为您推荐一款好用的数据治理工具配合实施数据治理方案,不仅可以保证您的数据治理项目按计划实施,也可以……查看详情

    发布时间:2021.07.01来源:亿信数据治理知识库浏览量:99次

  • 着力提升工业数据资源管理能力,加快工业互联网创新发展步伐

    着力提升工业数据资源管理能力,加快工业互联网创新发展步伐

    工业互联网是第四次工业革命的重要基石,作为数字化转型的关键支撑力量,正在全球范围不断颠覆传统制造模式、生产组织方式和产业形态,推动传统产……查看详情

    发布时间:2019.03.07来源:数据管理浏览量:143次

  • 区块链和AI如何帮助掌握数据管理

    区块链和AI如何帮助掌握数据管理

    主数据很容易成为企业拥有的最重要的资产之一。随着数字化的不断发展和第四次工业革命的到来,主数据的价值和主数据管理的重要性才会增长。在我们……查看详情

    发布时间:2019.07.11来源:福布斯浏览量:109次

  • 数据治理与数据质量的关系

    数据治理与数据质量的关系

    单纯从数据层面来看,数据体系包括治理、管理和应用三个部分。治理是负责解决人与人之间的事,管理负责各个职能领域,应用则是价值的实现。不讨论……查看详情

    发布时间:2018.11.29来源:知乎浏览量:113次

  • 创新者的破局之路:煤炭行业首个集团级数据治理项目落地

    创新者的破局之路:煤炭行业首个集团级数据治理项目落地

    工业互联网激起能源领域一池春水,新一代信息技术则是其不断发展的加速器。山东能源集团下属临沂矿业集团有限责任公司(以下简称临矿集团)率先在……查看详情

    发布时间:2021.01.29来源:头条浏览量:142次

  • 从元数据角度来认识大数据

    从元数据角度来认识大数据

    什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数……查看详情

    发布时间:2020.02.21来源:知乎浏览量:113次

  • 构建金融大数据标准体系的意义和目标

    构建金融大数据标准体系的意义和目标

    随着政府职能的逐步简政放权,标准作为辅助行业管理、规范行业发展、形成规模化效应的重要手段,将在社会治理体系中发挥更重要的作用。为顺应形势……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:125次

  • 数据资产如何安全可追溯,你们应该这样做!

    数据资产如何安全可追溯,你们应该这样做!

    近年来,食品安全中提到产地的可追溯性,给许多生鲜打上了专属的身份证以便出现问题可以追根溯源。而这并不稀奇,在使用报表工具时处于数据安全考……查看详情

    发布时间:2021.03.12来源:知乎浏览量:123次

  • 2019—开启你的数据治理道路

    2019—开启你的数据治理道路

    如今,数字系统正在生产越来越多具有公认价值的数据,数据治理正变得越来越受欢迎和必要。然而,并非所有数据都被视为相同。……查看详情

    发布时间:2019.06.28来源:知乎浏览量:118次

  • 云管理与云治理

    云管理与云治理

    混合云或多云已成为当今组织IT战略的重要组成部分。作为多云战略的一部分,组织需要定义如何在多个云中管理,控制,操作,优化和保护云基础架构……查看详情

    发布时间:2019.03.08来源:亿信华辰浏览量:172次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议