数据质量对区块链的重要性

发布时间:2019.02.20来源:亿信华辰浏览量:156次标签:数据治理


区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数据。需要通过识别所有者,他们拥有的对象的标识以及所有者和对象之间的映射来建立所有权。

区块链提供的优势包括能够提供完整的交易审计跟踪,并验证符合数据质量确认维度中定义的数据质量改进的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和代表。

迈尔斯借鉴了区块链如何改善与汽车相关的交易的理论范例。将重新设想的业务流程的多个步骤与数据质量维度相辅相成:纸质标题可以以数字方式分发,在这种情况下,区块链将现实世界与数字标题连接起来,同时具有可打印和数字标题; 并且对数据质量的改进以所有权的表示形式和对区块链的验证形式进行。或者使用区块链的私人汽车销售保护家庭和邮寄地址的隐私,同时提供实体和销售权限的验证,从而实现数据质量改进,以确保销售价格的准确性和进行商业交易的各方的完整性。   

区块链背景 - 数据质量维度

在对等的分类账系统中运行,区块链是存储的网络节点,并使用由协商有序和连接数据块的信息内容以及密码和安全技术的算法组成的软件单元。“从架构的角度来看,你将所有这些都推到了一个合理的解决方案中,以实现并保持其完整性,”迈尔斯说。

例如,Blockchain与加密相关,存在用于管理身份和私钥以进行授权的公钥,这对于数据质量很重要。独特个体之间的交易采取以其公钥识别个人的形式,并使用与其私钥相关的签名来记录每笔交易的协议和批准。他说:“你进行交易,并通过增加一个密封交易信封的钥匙来封闭或同意交易。” “真正的关键是独特的个人识别。”

由于它涉及客户端 - 服务器和分布式分类帐架构,因此整个区块链的副本存储在每个节点上的分布式上下文中。每个参与者维护,计算并将新条目添加到他们自己的分类帐中,并与所有其他分类帐同步。“分布式共识用于确保所有节点得出相同的结论,”他说。

由于它涉及完整性 - 一种不可变的数据结构 - 他使用了书的类比,其页面是连续的。“如果你正在阅读并阅读一些涉及另一件事的东西,那么你需要书的完整性 - 它的序列 - 所以你要读那页,”他说。但如果页面被删除,读者就会知道完整性已被破坏。

由于它涉及数据结构中的完整性和事务散列值,因此创建块创建包含第一条数据的第一个块的散列或数字签名。第二个事务创建第二条数据和来自先前事务的散列的散列,从而连接两者。因此,每个数据块都是通过每个哈希唯一标识的,这很不可能重复。利用这些唯一密钥,可以链接或加入其他“离线”数据结构,确保链中事务与其他地方存储的其他数据之间的参照完整性。 

一致性和完整性是数据质量的最重要的两个维度,最适用于区块链。“分布式数据的等效性或冗余性是衡量代表相同概念的其他数据来源的相似性的指标,”他说 - 即一致性。回到汽车的例子,买方知道卖方已经卖掉了汽车,但是其他人不会在分配的分类账被同步之前并且在所需的人数之间达成协议以确保交易的一致性。如数据质量一致维度中所定义的完整性对于区块链的目的是稳健的,因为它测量数据集的结构或关系质量。

要回答的问题,需要解决的问题

迈尔斯认为,围绕链接到脱链数据结构的唯一密钥存在问题。他问道,如何能够处理离线存储的数据质量,因为人们会想要将大量数据泵入区块链?“由于性能原因和分布式分类账的影响,你通常不会在区块链中放入大量数据,”他说。“首席执行官可能会说'让我们取下数据仓库,然后将所有内容放入区块链中,以便全部协调,并且没有数据质量问题。' 这不是解决问题的方法,“他说。

 “你在区块链中放入了多少数据,这是人们现在想要解决的一个重大架构问题,”他说。

还存在数据质量问题,因为数据完整性与数据准确性不同。可能会将错误的数据正确输入系统,“但这并不能准确地代表现实世界,”他指出。 

迈尔斯建议企业在进行区块链时考虑以下因素:   

  • 了解什么是“拥有”以及供应商是谁,并了解您的业务的数据质量需求。
  • 了解区块链的组件以及您真正需要的组件。
  • 研究替代架构/方法,看看是否有类似的收益,减少炒作和风险/成本。
  • 使用区块链/分布式分类帐技术向前推进,睁大眼睛。
  • 并确定是否所有东西都必须在链条上以及为什么。 

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 大数据必备知识:数据的分类方式

    大数据必备知识:数据的分类方式

    数据分类在收集、处理和应用数据过程中非常重要。数据的分类方式很多,每种方式都有特别的作用。数据工作中不同角色往往需要理解和掌握不同的分类……查看详情

    发布时间:2019.03.12来源:亿信华辰浏览量:162次

  • 中国“大数据转型”引人关注:万亿市场可期 地方密集发力

    中国“大数据转型”引人关注:万亿市场可期 地方密集发力

    以人工智能、大数据、云计算为代表的信息产业,正在成为地方经济发展的新亮点。以大数据产业为例,过去一段时间以来,各地已陆续释放了推动该产业……查看详情

    发布时间:2019.02.26来源:亿信华辰浏览量:132次

  • 做好数据治理,助力政府治理体系和治理能力现代化

    做好数据治理,助力政府治理体系和治理能力现代化

    当前,数据及其技术的融合应用在政府经济调节、市场监管、社会管理、公共服务、生态环境保护等各项工作中强劲助攻、潜力无限。但由于数据是新型生……查看详情

    发布时间:2020.06.22来源:知乎浏览量:130次

  • 数据治理理论

    数据治理理论

    数据治理是对数据资产的管理行使权力和控制的活劢集合(规划、监控和执行)。数据治理职能指导其他数据管理职能如何执行。……查看详情

    发布时间:2019.08.27来源:知乎浏览量:321次

  • 如今企业面临哪些数据湖管理挑战?

    如今企业面临哪些数据湖管理挑战?

    成功的数据治理方案涉及部署策略、标准和流程,以在整个企业中有效正确地利用高质量数据。如果你的企业具有数据湖环境,并希望从中获得高质量的分……查看详情

    发布时间:2020.04.02来源:知乎浏览量:142次

  • 什么是数据治理及其为什么对您的业务至关重要?

    什么是数据治理及其为什么对您的业务至关重要?

    数据治理如何影响他们:由于您没有雇用一组全新的理事会成员,因此DGC数据治理的最大影响将是与数据和数据策略相关的额外工作。如果或出现问题……查看详情

    发布时间:2018.11.26来源:数据治理浏览量:184次

  • 企业如何进行数据资产管理

    企业如何进行数据资产管理

    大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计算存储资源,如果没有合理的资产管理,很可能在大数据还没来得及发……查看详情

    发布时间:2020.08.28来源:知乎浏览量:118次

  • 释放数据民主:5种数据治理的误解

    释放数据民主:5种数据治理的误解

    释放数据民主:5种数据治理的误解……查看详情

    发布时间:2018.12.25来源:亿信华辰浏览量:176次

  • 数据质量管理策略-从产生数据的源头开始抓

    数据质量管理策略-从产生数据的源头开始抓

    为了改进和提高数据质量,必须从产生数据的源头开始抓起,从管理入手,对数据运行的全过程进行监控,密切关注数据质量的发展和变化,深入研究数据……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:191次

  • 数据治理和风险管理

    数据治理和风险管理

    风险管理对于任何数据驱动的业务都至关重要。前联邦调查局局长罗伯特·穆勒(Robert Mueller)曾说过,“只有两种类型的公司:那些……查看详情

    发布时间:2019.01.27来源:亿信华辰浏览量:156次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议