强大的数据治理是机器学习成功的关键

发布时间:2019.01.17来源:数据治理浏览量:4次标签:数据治理

人工智能和机器学习这两个术语通常被视为同一枚硬币的两面。尽管如此,虽然ML算法增强了AI功能,并使它们能够进行更多的尖端和智能计算,但还有一层额外的感知不可穿透性,现在它掩盖了机器推理和做出有影响力的决策的能力。
行业专家推测机器学习算法是潜在的“ 黑匣子”,这主要是因为人们对信任生态系统持怀疑态度,因为生态系统对数据合规性和决策过程的透明度有限。
全球数据分析师社区帮助设计了AI或ML驱动的半自动或全自动分析系统。但是,数据质量的核心和经常出现问题可能总是占上风。除此之外,各种各样不同的数据源,巨大的数据量和非结构化数据类型增加了现有的数据管理问题,特别是与数据治理相关的问题。
随着ML的发展势头并继续处于改变组织运作方式的最前沿,谨慎行事可能是明智之举。在缺乏强大的数据治理流程的情况下,允许ML完全接管决策流程的热情有可能释放出一些关键问题 - 不可靠和误导性的信息以及意外的费用开销。
那么我们如何有效地做到这一点:
建立,组织和实施有效且稳健的ML模型的必要性之间的差距是否应该弥合?
我们是否应该满足指数级增长的需求,以及理解和解密这些模型如何工作的需要?
我们如何理解ML算法正在访问和利用的数据?此外,长期持续且往往不可逆转的后果是什么?
数据治理无疑是最合乎逻辑的答案。

作为框架的数据治理定义并帮助实现对任何生态系统中使用的数据的可获得性,可用性,完整性,安全性和有效性的整体管理。


在当今竞争激烈的世界中,每个组织都需要一个精心设计和可持续的数据治理模型,在加强数据治理和不限制机器学习的深远潜力之间取得适当的平衡。
那么数据治理如何影响ML和AI呢?
实施数据治理模型的最初步骤可能是最难的,并且面临最大阻力。数据治理不仅仅是关于合规性,它也是一门可以加速ML工作并使AI成为一种力量的学科:
有什么优点?
数据治理提供了一种朴实无华的直接方法,用于跟踪和保护正确数据的使用,但也可识别数据错误并及时引发危险信号并帮助消除这些错误。
它使组织能够花更少的时间挖掘提供ML算法所需的准确数据源,并将更多时间用于创建和改进AI模型。
数据治理的最大好处是它可以证明数据是可靠且一致的。这是必要的,因为越来越多的组织现在依赖大量数据,做出业务决策,增加运营,创造新业务,并提高盈利能力。
有什么缺点?
      太多的治理可能会受到限制,因为试图控制大量数据的最大缺点之一是忽视业务需求和目标。组织最终可能浪费大量宝贵的时间和资源,通过不重要的数据进行过滤,并最终获得具有重要价值的数据来为ML算法提供支持。
      数据治理模型也可能对数据的处理方式施加限制,并且可能会引起争议,并且通常会限制组织的进展。
ML算法可能发现数据过滤和策划规则过于严格,并且约束可能限制其在现代和动态演进的数据环境中有效执行的固有能力。
      随着ML和AI的使用和范围的发展,以及更新的技术的实施,数据治理将获得更广泛的应用和接受。最近发生的大量高安全性数据违规事件使数据安全成为数据治理工作的重要组成部分。欧盟(EU)关于通用数据保护法规(GDPR)的指令是数据治理措施的一个主要例子,并强化了建立更强大模型的必要性。
       我们还有很长的路要走,以发现ML和AI的完整潜力和企业真正的能力。在一天结束时,在破坏性数据,智能ML算法和快速发展的AI环境的世界中,数据治理是为疯狂提供一些急需方法的唯一方法。



(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据标准管理组织职能划分与数据标准设计流程

    数据标准管理组织职能划分与数据标准设计流程

    数据标准的设计从需求发起到落地执行,一般需要经过标准编制、标准审查、标准发布、标准贯彻四个阶段:……查看详情

    发布时间:2020.09.18来源:知乎浏览量:2次

  • 6个实施数据治理的最佳实践方法

    6个实施数据治理的最佳实践方法

    在寻找数据治理最佳实施方法时,您可以从已有的各种流程和模板工作的人那里学到很多东西。尽管每个企业都不同,您将需要根据流程调整数据治理实践……查看详情

    发布时间:2021.07.28来源:亿信数据治理知识库浏览量:4次

  • 数据治理系列5:浅谈数据质量管理

    数据治理系列5:浅谈数据质量管理

    数据质量管理是对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的数据质量问题,进行识别、度量、监控、预警等一……查看详情

    发布时间:2019.12.06来源:CSDN浏览量:2次

  • 数据服务交换和服务工具经历三个阶段

    数据服务交换和服务工具经历三个阶段

    数据交换平台是为校内各部门的管理信息系统提供数据交换,实现数据共享,并建立公共数据库,实现数据积累,为数据统计、分析、挖掘做准备。……查看详情

    发布时间:2020.08.06来源:知乎浏览量:5次

  • 治理成熟度差距以及如何克服它

    治理成熟度差距以及如何克服它

    了解您在真正的IG成熟度方面的立场,并在自己和团队中识别变革的阻力。不要回避要求定期审核和验尸以评估进度和后续步骤。通过具体信息,您可以……查看详情

    发布时间:2019.03.13来源:亿信华辰浏览量:2次

  • 银行业重塑数据治理体系 助力转型升级

    银行业重塑数据治理体系 助力转型升级

    银行业金融机构要深化认识,积极主动对接国家政策,改革数据治理体系,依靠数据治理改进决策、缩减成本、降低风险、增强核心竞争力,推动银行业向……查看详情

    发布时间:2019.10.18来源:知乎浏览量:3次

  • 实施数据治理 - 学到3个主要经验教训

    实施数据治理 - 学到3个主要经验教训

    尽管数据治理在开发过程中可能会有些流动和迭代,但遵循最佳实践并设计精心定位的路线图有助于确保成功。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:2次

  • 什么是主数据?

    什么是主数据?

    企业主数据(Master Data)是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值……查看详情

    发布时间:2020.04.29来源:知乎浏览量:5次

  • 如何获得各部门系统的数据?

    如何获得各部门系统的数据?

    不少学校在开展数据治理的时候,会遇到部门数据共享的问题。一方面,一些部门不愿意分享所管理的数据,比如,认为拥有某些数据是特权,或担心数据……查看详情

    发布时间:2020.10.31来源:知乎浏览量:2次

  • 数据质量在数据治理中的重要意义

    数据质量在数据治理中的重要意义

    数据的质量问题从一定的角度反映出组织当中存在的一些问题,而问题的来源可能是数据流动,可能业务流程也可能源于管理问题等等,数据质量问题的分……查看详情

    发布时间:2020.01.10来源:CSDN浏览量:5次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议