数据治理的关键要求是什么?

发布时间:2019.03.20来源:亿信华辰浏览量:6次标签:数据治理


这些功能中的每一项都可以实现受管理的环境 目录和数据字典元数据的组合为数据策略和使用的可审计性提供了完整的信息。它还包含血统和操纵。工作流控制信息生命周期管理的过程,包括摄取,操作/派生和处置。强大的分布式基础架构可实现业务连续性,快速处理和数据的持续可用性。

确保系统可靠性和可用性

虽然高可用性和灾难恢复等概念通常不被归类为数据治理策略的组件,但这些功能对于数据是有价值资产的任何环境都至关重要。因此,数据治理策略必须包含高可用性和灾难恢复策略。毕竟,如果系统无法可靠地保持运行,那么数据将与相关的数据治理策略一起贬值。

高可用性或确保您的系统在单个数据中心持续运行通常是一个复杂的目标。理想情况下,您应该寻求一种旨在最大限度地减少克服群集内故障的管理开销的系统。如果硬件组件发生故障,您的团队应该能够将响应限制为仅更换故障组件,而不是重新配置软件以克服故障。

灾难恢复有时被忽视作为生产环境的关键组成部分,主要是因为现场灾难的可能性很少。但对于任何关键任务环境而言,实施这些保障措施非常重要。有趣的是,越来越多的组织寻求全球部署,将数据副本放在地理位置分散的地区。在这些情况下,通常主要目标是通过将数据放在更靠近用户的位置来减少访问时间。全局部署的另一个好处是复制同时提供灾难恢复配置的数据。如果任何站点遭受中断,本地用户可以在此期间访问远程群集以继续日常操作。然而,我们越来越多地看到这些类型的全球部署以应对监管压力,例如将个人身份信息保存在个人的本国。这是一个很好的例子,说明数据的治理以及有关其保留和位置的策略如何与系统配置以及可用性和灾难恢复方法相交叉。

组织还应防范因应用程序或用户错误导致的数据损坏。例如,快照功能可创建数据的时间点视图,确保在数据损坏发生时使用数据恢复选项。快照也是通过捕获特定时间点的数据的只读视图来跟踪数据历史和谱系的好方法,该视图可以在取证分析期间追溯。

识别数据和维护数据目录

由于各种数据的爆炸式增长,对数据进行编目并使该目录可供用户使用至关重要。但是,这不仅仅是跟踪有关信息的技术元数据。它需要一个可以自动完成该过程的大部分引擎。数据太多,而且手动分类所有内容的速度增长太快。其次,业务用户需要可以访问此目录,因此他们可以“购买”他们检查业务问题所需的数据。这意味着数据的实施必须与业务术语相关联。组织需要一个可以轻松扩充和更新的业务术语表,因为新数据和现有数据的新用途将发挥作用。此外,环境能够跟踪与数据相关的各种资产至关重要,它的使用和加工。诸如MapReduce作业,用户方法(如可视化)和数据分析对象(如模型,子模型和源数据集)等技术组件都必须能够在数据字典中轻松表示。

探索该数据以识别机会

获得数据目录后,您需要一种很好的方法来查找该目录中的内容。组织内的不同角色需要以不同的方式看待事物。IT专业人员需要在系统或应用程序上下文中查看数据。安全团队需要根据其隐私策略上下文查看信息,审核员需要通过灵活的可视化查看完整的血统和相关信息,能够在上下文中显示任何类型的关系。这应该与基于角色的视图和模板相结合,以及按角色定制导航,以使业务用户尽可能简单地找到他或她需要的内容。可以使用先进的机器学习和人工智能来帮助找到适当的数据。当然,

保持数据的有效性

保持数据的有效性是两部分的努力。首先是建立围绕数据的系统政策和控制,并确保测量的数据准确性适合其用途。工作流和策略管理功能使了解数据的业务用户可以轻松地协作,协商和批准策略和过程。与IT服务管理系统集成后,可以将策略信息一旦最终确定,即可转移到IT部门进行实施,而不会丢失上下文以及策略及其要求的细节。自动规则可以轻松确定策略是否没有准则。全面的业务沿袭使任何人都可以确定哪些策略适用于哪些信息,哪些业务术语涉及哪些数据,

数据质量仪表板显示数据质量扫描的结果,并提供数据质量是否在提高的视角。它们应该使组织能够积累有关未通过质量规则的数据的值,以帮助确定优先级和改进。

快速响应的策略管理与持续的质量改进相结合,为维护数据和保持高质量创造了理想的环境。

保护敏感数据

保护数据可能是一项复杂的工作,虽然这种能力还依赖于拥有合适的人员和流程,但该技术可以在确保适当保护方面发挥很大作用。保护敏感数据需要几个步骤。首先,必须确定数据及其敏感性。其次,必须有一种方法可以明确说明围绕数据做什么以及由谁做的政策。第三,必须有一种系统的方法来收集这些信息并将其传播给数据的消费者和能够对信息实施物理控制的技术人员。这三个步骤通常是由实现合规性的需要驱动的,但也与您自己的内部政策相关联。重要的是,

有三种治理活动对于确保在大数据环境中保护数据至关重要。首先,在将数据带入环境时必须对数据进行一些控制。这种摄取控制对于确保正确识别数据非常重要。其次,必须有一种方法来分配适当的政策并制定新的数据安全和隐私政策。这些策略需要与特定的数据集明确关联,并且需要对可以使用该数据的每个人都可见。此外,这些政策必须与具体执法挂钩。这通常是使用数据管理环境中的控件,过程和脚本的第三个元素。这些事物中的每一个都需要集成,这样当数据处于大数据环境中时,其保护就得到了保证并且毫不含糊。


(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议