数据质量对区块链的重要性

发布时间:2019.02.20来源:亿信华辰浏览量:181次标签:数据治理


区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数据。需要通过识别所有者,他们拥有的对象的标识以及所有者和对象之间的映射来建立所有权。

区块链提供的优势包括能够提供完整的交易审计跟踪,并验证符合数据质量确认维度中定义的数据质量改进的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和代表。

迈尔斯借鉴了区块链如何改善与汽车相关的交易的理论范例。将重新设想的业务流程的多个步骤与数据质量维度相辅相成:纸质标题可以以数字方式分发,在这种情况下,区块链将现实世界与数字标题连接起来,同时具有可打印和数字标题; 并且对数据质量的改进以所有权的表示形式和对区块链的验证形式进行。或者使用区块链的私人汽车销售保护家庭和邮寄地址的隐私,同时提供实体和销售权限的验证,从而实现数据质量改进,以确保销售价格的准确性和进行商业交易的各方的完整性。   

区块链背景 - 数据质量维度

在对等的分类账系统中运行,区块链是存储的网络节点,并使用由协商有序和连接数据块的信息内容以及密码和安全技术的算法组成的软件单元。“从架构的角度来看,你将所有这些都推到了一个合理的解决方案中,以实现并保持其完整性,”迈尔斯说。

例如,Blockchain与加密相关,存在用于管理身份和私钥以进行授权的公钥,这对于数据质量很重要。独特个体之间的交易采取以其公钥识别个人的形式,并使用与其私钥相关的签名来记录每笔交易的协议和批准。他说:“你进行交易,并通过增加一个密封交易信封的钥匙来封闭或同意交易。” “真正的关键是独特的个人识别。”

由于它涉及客户端 - 服务器和分布式分类帐架构,因此整个区块链的副本存储在每个节点上的分布式上下文中。每个参与者维护,计算并将新条目添加到他们自己的分类帐中,并与所有其他分类帐同步。“分布式共识用于确保所有节点得出相同的结论,”他说。

由于它涉及完整性 - 一种不可变的数据结构 - 他使用了书的类比,其页面是连续的。“如果你正在阅读并阅读一些涉及另一件事的东西,那么你需要书的完整性 - 它的序列 - 所以你要读那页,”他说。但如果页面被删除,读者就会知道完整性已被破坏。

由于它涉及数据结构中的完整性和事务散列值,因此创建块创建包含第一条数据的第一个块的散列或数字签名。第二个事务创建第二条数据和来自先前事务的散列的散列,从而连接两者。因此,每个数据块都是通过每个哈希唯一标识的,这很不可能重复。利用这些唯一密钥,可以链接或加入其他“离线”数据结构,确保链中事务与其他地方存储的其他数据之间的参照完整性。 

一致性和完整性是数据质量的最重要的两个维度,最适用于区块链。“分布式数据的等效性或冗余性是衡量代表相同概念的其他数据来源的相似性的指标,”他说 - 即一致性。回到汽车的例子,买方知道卖方已经卖掉了汽车,但是其他人不会在分配的分类账被同步之前并且在所需的人数之间达成协议以确保交易的一致性。如数据质量一致维度中所定义的完整性对于区块链的目的是稳健的,因为它测量数据集的结构或关系质量。

要回答的问题,需要解决的问题

迈尔斯认为,围绕链接到脱链数据结构的唯一密钥存在问题。他问道,如何能够处理离线存储的数据质量,因为人们会想要将大量数据泵入区块链?“由于性能原因和分布式分类账的影响,你通常不会在区块链中放入大量数据,”他说。“首席执行官可能会说'让我们取下数据仓库,然后将所有内容放入区块链中,以便全部协调,并且没有数据质量问题。' 这不是解决问题的方法,“他说。

 “你在区块链中放入了多少数据,这是人们现在想要解决的一个重大架构问题,”他说。

还存在数据质量问题,因为数据完整性与数据准确性不同。可能会将错误的数据正确输入系统,“但这并不能准确地代表现实世界,”他指出。 

迈尔斯建议企业在进行区块链时考虑以下因素:   

  • 了解什么是“拥有”以及供应商是谁,并了解您的业务的数据质量需求。
  • 了解区块链的组件以及您真正需要的组件。
  • 研究替代架构/方法,看看是否有类似的收益,减少炒作和风险/成本。
  • 使用区块链/分布式分类帐技术向前推进,睁大眼睛。
  • 并确定是否所有东西都必须在链条上以及为什么。 

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 数据治理困难,即数据治理之“困”。

    数据治理困难,即数据治理之“困”。

    当前,以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透。以数据为核心的数字化转型已是大势所趋。金融业是数据密集……查看详情

    发布时间:2020.01.03来源:知乎浏览量:145次

  • 数据质量和数据治理之间有什么区别?

    数据质量和数据治理之间有什么区别?

    跟上无穷无尽的技术术语可能是一项艰巨的任务。松散定义的术语和行业特定的白话使水更加泥泞。特别是在数据管理方面,似乎许多单词也可以互换使用……查看详情

    发布时间:2019.07.04来源:知乎浏览量:192次

  • 数据治理需要转变

    数据治理需要转变

    环境数据治理是一种策略和方法,它不仅可以扩展您的数据治理工作,还可以作为解决方案,以满足我们为新用例,法规和新出现的数字功能扩展数据时存……查看详情

    发布时间:2019.02.15来源:Michele Goetz浏览量:150次

  • 金融行业数据治理与安全防护解决方案

    金融行业数据治理与安全防护解决方案

    在金融业各类涉及商业秘密和敏感数据的信息在处理、共享和使用过程中面临违规越权使用或被用于非法用途等数据泄漏的安全风险。一方面,数据处理过……查看详情

    发布时间:2019.09.30来源:CSDN浏览量:211次

  • 最终有人把数据治理的元数据、主数据等概念讲明白了

    最终有人把数据治理的元数据、主数据等概念讲明白了

    数据治理就是以服务组织战略目标为基本原则,通过组织成员的协同努力,流程制度的制定,以及数据资产的梳理、采集清洗、结构化存储、可视化管理和……查看详情

    发布时间:2022.06.24来源:小亿浏览量:418次

  • 构建有效的数据科学团队

    构建有效的数据科学团队

    随着数据科学和人工智能几乎进入阳光下的每个行业,建立一个能够建立成功的AI项目的团队的挑战也是如此。对统计学家,程序员和沟通者完美融合的……查看详情

    发布时间:2019.03.15来源:亿信华辰浏览量:228次

  • 数字健康治理:21世纪数字经济的管理与战略

    数字健康治理:21世纪数字经济的管理与战略

    数字化健康技术,解决方案和决策方法正在改变医疗保健的提供,重塑患者(和健康消费者)的期望,并为健康计划,卫生系统,信息公司和其他利益相关……查看详情

    发布时间:2018.11.21来源:数字健康治理浏览量:204次

  • 读懂工业大数据 这篇文章不得不看

    读懂工业大数据 这篇文章不得不看

    工业大数据是互联网、大数据和工业产业结合的产物,是中国制造2025、工业互联网、工业4.0等国家战略在企业的落脚点。……查看详情

    发布时间:2019.03.27来源:亿信华辰浏览量:165次

  • 企业数据治理所面临的挑战

    企业数据治理所面临的挑战

    每年随着数据量的增长,大数据平台需要投资扩容,但大量的存量应用依赖的数据也在同步增长,因此也需要扩容,当然这份冗余的数据会越来越大……查看详情

    发布时间:2019.10.31来源:知乎浏览量:192次

  • 一文搞懂数据质量问题及对应的解决办法

    一文搞懂数据质量问题及对应的解决办法

    通过数据分析、数据评估、数据清洗、数据监控、错误预警等内容,解决数据质量问题,使数据的质量得以改善,使其满足数据需求方对数据质量的规则要……查看详情

    发布时间:2019.11.05来源:知乎浏览量:1572次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议