从大数据到好数据:缩小数据治理和业务洞察力之间的差距

发布时间:2019.01.14来源:亿信华辰浏览量:60次标签:数据治理

     

 随着数字淘金热的扩大,数据正成为人们关注的焦点,成为一种宝贵的信息来源。据估计,数字世界将至少每两年翻一番,到2020年将达到44千字节,比2010年增长50倍。数据湖的规模是惊人的,但百万美元的问题仍然存在;也就是说,如何从数据海啸中找到意义并加以利用。      

      几十年来,人们一直在观察被称为摩尔定律的现象,随着新技术(固态硬盘、软件定义存储、对象存储等)的出现以及存储行业的整合,价格螺旋以每年两位数的降幅向南发展。    

      在数字时代,数据存储的真正成本不再是购买硬件,而是努力管理数字资产所需的努力和知识。在许多行业和地区,由于对数据生命周期管理的要求越来越严格,针对特定国家的隐私法和加强了数据保留期的合规性法规,加密技术的利用率越来越高,这一点变得更具挑战性。尽管在大数据上的支出不断增加,技术公司仍在摸索。 

       尽管企业在收集、存储和管理数据上花费了大量资金,但在将原始数据转换为可操作信息方面,只有少数企业表现出色。就非结构化内容而言,这一点尤其正确,因为它仍然占公司所有数据的80%到90%。 

       Veritas最近的一份报告得出结论,目前全球企业存储和处理的所有数据中,52%被认为是“黑暗”数据,其价值未知。多达33%的数据被认为是多余的、过时的或微不足道的,甚至被认为是无用的。平均而言,只有15%的存储数据被认为是业务关键数据。除非企业采取纠正措施并更加体谅,估计到2020年,“数据囤积”文化将累积导致3.3万亿美元的可避免成本,用于管理数字公墓。 

云化:朋友还是敌人?

       鉴于激烈的价格战,特别是公共云领域的价格战,以及企业以每单位低成本存储大量数据的能力,许多企业都强烈希望利用IT并迅速将企业数据转换为云。虽然这样做有很多合理的理由,并且有大量的用例,但是应该彻底地做出接触数兆字节数据的决定。 

       首先,企业需要从内容类型、年龄、相关性等方面正确理解数据的构成,并对其进行分类。例如,将黑暗数据卸载到云中除了浪费时间和金钱外,什么都不是。此外,数据在转换重力时会展开重力,这只会使问题进一步远离。随着数字世界呈指数级扩张,如果不是真正的噩梦,那么将不断增长的数据产业转移回来至少将成为一项具有挑战性的任务。因此,企业在开始云计算之前应该仔细评估、可视化和分类数据。 

       处理结构化数据可能没什么大不了的,但是管理非结构化数据是一个比最初看起来更大的挑战。由于大部分数据都是非结构化的,因此在实施数据中心业务模型时,评估其价值并识别重复的、机密的和敏感的信息是关键组件。        

       无论是所有权与首席信息官(CIO)或专用首席数据官(CDO),数据和分析领导者应该密切合作,与他们的业务单位同行,并提出了一个数据治理框架,建立了基础,为所有使用情况。这通常包括如何对数据进行分类、捕获、精炼、分析、管理、货币化、保留和删除,同时考虑到合规性和可能适用的其他监管要求。       

       开发了能够使企业获得商业价值的专有算法的企业,应考虑申请专利以保护其知识产权。    

       尽管支出不断增加,但仍有许多基础工作必须完成。企业应避免陷入机会主义的“数据囤积”文化中,并意识到存在一个转折点,在这个转折点上,创建更大的数据仓库不一定会带来更大的回报,尤其是在记住有多少内容是“黑暗”或“古老”的情况下。事实上,结果在任何大数据分析项目中,只有利用数据的质量是一样好的。在很大程度上,这与将“好数据”与“大数据”分开的、实施良好的治理模型有关。  

       云化可以带来很大的经济意义和充足的用例,但是它需要有可靠的规划,以避免被引导到花园的道路上。

      虽然一开始可能被错误地认为是一项相当无聊的内务管理工作,但建立一个可靠的数据治理模型确实与精通数据的企业的成功紧密相关,并遵循两个与公司资产负债表直接相关的基本原则:获得战略洞察力以产生新的数据。Gital的收入流,并消除了管理大量无用数据的不必要成本。

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议