如今企业面临哪些数据湖管理挑战?

发布时间:2020.04.02来源:知乎浏览量:182次标签:数据治理

成功的数据治理方案涉及部署策略、标准和流程,以在整个企业中有效正确地利用高质量数据。如果你的企业具有数据湖环境,并希望从中获得高质量的分析结果,则你需要部署正确数据湖治理,作为整体治理计划的一部分。

但数据湖给企业数据管理的方方面面都带来挑战,包括数据治理。在开始讨论治理挑战前,我们有必要定义什么是数据湖:一种可容纳大量原始数据的数据平台,这些数据通常以其本机格式保留,直到需要用于分析。

传统的数据仓库将数据存储在关系表中,而数据湖则使用平面结构。每个数据元素被分配唯一标识符,并用一组元数据标签进行标记。这就是说,数据湖没有数据仓库那么结构化。在访问数据进行分析时,数据会被分类和整理,而不是在将数据加载到数据湖中时。

有效的数据治理使企业能够提高数据质量和一致性,并很大程度地利用数据进行业务决策,从而可以改善业务规划和财务绩效。数据治理的配套数据管理学科包括数据质量、元数据管理和数据安全性,所有这些因素都影响到数据湖治理。

现在,让我们看看下面5个数据湖部署中的数据治理挑战。

1.识别和维护正确的数据源
在很多数据湖部署中,源元数据没有被获取或根本不可用,这使得数据湖内容的有效性令人质疑。例如,可能未列出记录系统或数据集的业务所有者,或者显然冗余数据可能会给数据分析人员造成问题。至少应记录数据湖中所有数据的源元数据,并使用户可以使用它来了解其出处。

2.元数据管理问题
元数据为数据集内容提供背景信息,并且是使数据在应用程序中易于理解和可使用的重要组件。但是很多数据湖部署忽略了对收集的数据应用正确数据定义的需求。而且,由于原始数据通常被加载到数据湖中,很多企业没有采取步骤来验证数据或对其应用企业数据标准。缺少适当的元数据管理使得数据湖中的数据对分析的用处不大。

3.在数据治理和数据质量方面缺乏协调性
不协调的数据湖治理和数据质量工作会导致劣质数据进入数据湖。当这些数据用于分析并驱动业务决策时,这可能导致结果不准确,从而导致丧失对数据湖的信心以及整个企业对数据普遍不信任。有效的数据湖部署需要数据质量分析师和工程师与数据治理团队及数据管理员密切合作,以部署数据质量策略、分析数据并采取必要的措施来提高其质量。

4.在数据治理和数据安全方面缺乏协调性
在这种情况下,如果数据安全标准和策略未被正确纳入治理流程中,可能会导致无法访问受隐私法规和其他类型的敏感数据保护的个人数据。尽管数据湖旨在成为相当开放的数据源,但仍需要安全性和访问控制措施,并且,数据治理和数据安全团队应携手完成数据湖设计和加载过程,以及持续的数据治理工作。

5.使用相同数据湖的业务部门之间的冲突
不同部门对于相似数据可能具有不同的业务规则,这可能导致无法协调数据差异以进行准确的分析。完善的数据治理方案应具有对数据策略、标准、流程和定义的企业视角,包括企业业务词汇表,这可减少多个业务部门使用同一数据湖时出现的问题。如果企业有多个数据湖,则每个数据湖都应包含在数据湖治理流程中,并为其分配业务数据管理员。 总之,通过在数据湖的设计、加载和维护过程中加入强大的数据治理、元数据管理、数据质量和数据安全流程,并由所有这些领域的经验丰富的专业人员积极参与,可显着提高数据湖的价值。否则,你的数据湖可能会变成数据沼泽。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 了解变更治理与数据管理实践

    了解变更治理与数据管理实践

    组织实施变革,为内部利益相关者或股东创造价值和利益。通常,价值创造只不过是在优化风险的同时享受理想资源成本带来的好处。……查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:219次

  • 数据治理:建立有效政策的10个步骤

    数据治理:建立有效政策的10个步骤

    数据治理通常与法规遵从性相关。但数据质量和理解是数据治理的核心。作为竞争优势,更全面地使用快速增长的企业数据的能力也是数据治理策略的公认……查看详情

    发布时间:2018.12.14来源:数据治理浏览量:257次

  • 零售商的数据治理势在必行

    零售商的数据治理势在必行

    最好的零售商擅长推销商品。在顶级的实体和电子商务商店,产品组织巧妙,布置精美,色彩鲜明,使客户可以轻松找到他们想要的东西。做得好,商品推……查看详情

    发布时间:2018.12.27来源:亿信华辰浏览量:184次

  • 理解和证明数据治理2.0

    理解和证明数据治理2.0

    过去,证明数据治理的合理性是非常困难的。数据治理1.0的孤岛性质以及缺乏对增值的关注意味着买入率很低。……查看详情

    发布时间:2019.01.25来源:亿信华辰浏览量:278次

  • 银行业重塑数据治理体系 助力转型升级

    银行业重塑数据治理体系 助力转型升级

    银行业金融机构要深化认识,积极主动对接国家政策,改革数据治理体系,依靠数据治理改进决策、缩减成本、降低风险、增强核心竞争力,推动银行业向……查看详情

    发布时间:2019.10.18来源:知乎浏览量:193次

  • 国内数据治理系统全面介绍

    国内数据治理系统全面介绍

    随着大数据技术的飞速发展,大数据已经融入到了各行各业,为了能让各企业的数据资产得到充分的利用,数据治理非常重要,如今数据治理已经逐渐成为……查看详情

    发布时间:2019.09.19来源:知乎浏览量:282次

  • “安全”与“共享”同行,大数据正改变着世界

    “安全”与“共享”同行,大数据正改变着世界

    什么是大数据?早在2011年,世界著名咨询公司麦肯锡就曾在《大数据:下一个创新、竞争和生产力的前沿》报告中对其进行了基础定义:“大数据是……查看详情

    发布时间:2019.01.14来源:亿信华辰浏览量:210次

  • 政务数据治理真落地!让数据多跑路,让群众少跑腿

    政务数据治理真落地!让数据多跑路,让群众少跑腿

    DT时代,人们对“大数据”一词已不再陌生,但“数据治理是什么?数据治理和我们有什么关系?”,恐怕普通大众还是很难说清楚。实际上,现在已经……查看详情

    发布时间:2019.11.20来源:亿信华辰浏览量:181次

  • 大数据和BI商业智能有何区别?有何相关?

    大数据和BI商业智能有何区别?有何相关?

    BI(BusinessIntelligence)即商业智能,它是企业数据化管理的一整套的方案,用来将企业中现有的数据进行有效的整合,快速……查看详情

    发布时间:2019.01.08来源:亿信华辰浏览量:160次

  • 数据治理方法 | 美国高校数据治理方法借鉴

    数据治理方法 | 美国高校数据治理方法借鉴

    高等教育中的数据治理是一种风险管理工具,可促进家庭教育和监管合规性,因为它旨在保护隐私和敏感信息。最后,数据是一种资产,如果使用得当,可……查看详情

    发布时间:2021.06.02来源:亿信华辰数据治理知识库浏览量:186次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议