数据质量对区块链的重要性

发布时间:2019.02.20来源:亿信华辰浏览量:159次标签:数据治理


区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数据。需要通过识别所有者,他们拥有的对象的标识以及所有者和对象之间的映射来建立所有权。

区块链提供的优势包括能够提供完整的交易审计跟踪,并验证符合数据质量确认维度中定义的数据质量改进的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和代表。

迈尔斯借鉴了区块链如何改善与汽车相关的交易的理论范例。将重新设想的业务流程的多个步骤与数据质量维度相辅相成:纸质标题可以以数字方式分发,在这种情况下,区块链将现实世界与数字标题连接起来,同时具有可打印和数字标题; 并且对数据质量的改进以所有权的表示形式和对区块链的验证形式进行。或者使用区块链的私人汽车销售保护家庭和邮寄地址的隐私,同时提供实体和销售权限的验证,从而实现数据质量改进,以确保销售价格的准确性和进行商业交易的各方的完整性。   

区块链背景 - 数据质量维度

在对等的分类账系统中运行,区块链是存储的网络节点,并使用由协商有序和连接数据块的信息内容以及密码和安全技术的算法组成的软件单元。“从架构的角度来看,你将所有这些都推到了一个合理的解决方案中,以实现并保持其完整性,”迈尔斯说。

例如,Blockchain与加密相关,存在用于管理身份和私钥以进行授权的公钥,这对于数据质量很重要。独特个体之间的交易采取以其公钥识别个人的形式,并使用与其私钥相关的签名来记录每笔交易的协议和批准。他说:“你进行交易,并通过增加一个密封交易信封的钥匙来封闭或同意交易。” “真正的关键是独特的个人识别。”

由于它涉及客户端 - 服务器和分布式分类帐架构,因此整个区块链的副本存储在每个节点上的分布式上下文中。每个参与者维护,计算并将新条目添加到他们自己的分类帐中,并与所有其他分类帐同步。“分布式共识用于确保所有节点得出相同的结论,”他说。

由于它涉及完整性 - 一种不可变的数据结构 - 他使用了书的类比,其页面是连续的。“如果你正在阅读并阅读一些涉及另一件事的东西,那么你需要书的完整性 - 它的序列 - 所以你要读那页,”他说。但如果页面被删除,读者就会知道完整性已被破坏。

由于它涉及数据结构中的完整性和事务散列值,因此创建块创建包含第一条数据的第一个块的散列或数字签名。第二个事务创建第二条数据和来自先前事务的散列的散列,从而连接两者。因此,每个数据块都是通过每个哈希唯一标识的,这很不可能重复。利用这些唯一密钥,可以链接或加入其他“离线”数据结构,确保链中事务与其他地方存储的其他数据之间的参照完整性。 

一致性和完整性是数据质量的最重要的两个维度,最适用于区块链。“分布式数据的等效性或冗余性是衡量代表相同概念的其他数据来源的相似性的指标,”他说 - 即一致性。回到汽车的例子,买方知道卖方已经卖掉了汽车,但是其他人不会在分配的分类账被同步之前并且在所需的人数之间达成协议以确保交易的一致性。如数据质量一致维度中所定义的完整性对于区块链的目的是稳健的,因为它测量数据集的结构或关系质量。

要回答的问题,需要解决的问题

迈尔斯认为,围绕链接到脱链数据结构的唯一密钥存在问题。他问道,如何能够处理离线存储的数据质量,因为人们会想要将大量数据泵入区块链?“由于性能原因和分布式分类账的影响,你通常不会在区块链中放入大量数据,”他说。“首席执行官可能会说'让我们取下数据仓库,然后将所有内容放入区块链中,以便全部协调,并且没有数据质量问题。' 这不是解决问题的方法,“他说。

 “你在区块链中放入了多少数据,这是人们现在想要解决的一个重大架构问题,”他说。

还存在数据质量问题,因为数据完整性与数据准确性不同。可能会将错误的数据正确输入系统,“但这并不能准确地代表现实世界,”他指出。 

迈尔斯建议企业在进行区块链时考虑以下因素:   

  • 了解什么是“拥有”以及供应商是谁,并了解您的业务的数据质量需求。
  • 了解区块链的组件以及您真正需要的组件。
  • 研究替代架构/方法,看看是否有类似的收益,减少炒作和风险/成本。
  • 使用区块链/分布式分类帐技术向前推进,睁大眼睛。
  • 并确定是否所有东西都必须在链条上以及为什么。 

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 云中的数据治理

    云中的数据治理

    IT中心,内部部署基础架构变得越来越复杂和昂贵,并且需要高技能的人力,因此企业现在将其IT和数据科学功能转移到云。云计算承诺提供低成本存……查看详情

    发布时间:2018.12.29来源:亿信华辰浏览量:168次

  • 如何通过访问控制和强有力的治理使所有级别的数据更易于访问

    如何通过访问控制和强有力的治理使所有级别的数据更易于访问

    支持数据驱动的业务开始了解数据的位置和访问权限。……查看详情

    发布时间:2018.12.25来源:亿信华辰浏览量:118次

  • 数据质量衡量标准有几个属性

    数据质量衡量标准有几个属性

    数据分析和数据挖掘都离不开数据的质量,做过数据产品的人都知道,质量高的数据对于产品的意义有多大,如果说数据是不具备完整性、规范性以及一致……查看详情

    发布时间:2022.03.28来源:小亿浏览量:431次

  • 国内主流的主数据管理方案

    国内主流的主数据管理方案

    主数据管理 (MDM) 是一种能够定义和管理组织中关键数据的全面方法。它提供跨整个企业的一站式可信任数据视图、敏捷的自助服务访问、基于分……查看详情

    发布时间:2020.05.07来源:知乎浏览量:602次

  • 数据治理的定义:什么是数据治理?

    数据治理的定义:什么是数据治理?

    数据治理(DG)是增长最快的学科之一,但在定义数据治理方面,许多组织都在努力。 Dataversity称DG是“有助于确保组织内数据资……查看详情

    发布时间:2018.11.15来源:Zak Cole浏览量:206次

  • 数据治理—设计利用数据

    数据治理—设计利用数据

    围绕数据使用创建系统和流程是一回事,但企业需要确保其基础架构和团队随时可以利用可用信息。……查看详情

    发布时间:2019.04.04来源:亿信华辰浏览量:135次

  • 企业做好数据治理才能更快更好地推进数字化转型

    企业做好数据治理才能更快更好地推进数字化转型

    企业做好数据治理才能更快更好地推进数字化转型数据治理之“困”在谈到当前的数据治理之“困”时,主要有四方面:……查看详情

    发布时间:2019.12.12来源:知乎浏览量:126次

  • 敏捷方法如何帮助解决您的数据问题

    敏捷方法如何帮助解决您的数据问题

    无论哪种方式,您都必须像软件开发人员一样思考,并确保您拥有正确的思维方式,技能组合和工具集,以保持数据掌握的灵活性。……查看详情

    发布时间:2019.02.27来源:亿信华辰浏览量:132次

  • 企业数据治理到底怎么做?

    企业数据治理到底怎么做?

    数据治理对于确保数据的准确、适度分享和保护是至关重要的。有效的数据治理计划会通过改进决策、缩减成本、降低风险和提高安全合规等方式,将价值……查看详情

    发布时间:2019.08.30来源:知乎浏览量:163次

  • 大数据时代还需要数据治理吗?

    大数据时代还需要数据治理吗?

    第一个提出大数据时代到来的是全球知名咨询公司麦肯锡,现如今大数据广泛存在于政府,军事,金融,企业,医疗,制造业,电力等行业,备受关注。……查看详情

    发布时间:2019.08.15来源:知乎浏览量:139次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议