数据质量对区块链的重要性

发布时间:2019.02.20来源:亿信华辰浏览量:177次标签:数据治理


区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数据。需要通过识别所有者,他们拥有的对象的标识以及所有者和对象之间的映射来建立所有权。

区块链提供的优势包括能够提供完整的交易审计跟踪,并验证符合数据质量确认维度中定义的数据质量改进的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和代表。

迈尔斯借鉴了区块链如何改善与汽车相关的交易的理论范例。将重新设想的业务流程的多个步骤与数据质量维度相辅相成:纸质标题可以以数字方式分发,在这种情况下,区块链将现实世界与数字标题连接起来,同时具有可打印和数字标题; 并且对数据质量的改进以所有权的表示形式和对区块链的验证形式进行。或者使用区块链的私人汽车销售保护家庭和邮寄地址的隐私,同时提供实体和销售权限的验证,从而实现数据质量改进,以确保销售价格的准确性和进行商业交易的各方的完整性。   

区块链背景 - 数据质量维度

在对等的分类账系统中运行,区块链是存储的网络节点,并使用由协商有序和连接数据块的信息内容以及密码和安全技术的算法组成的软件单元。“从架构的角度来看,你将所有这些都推到了一个合理的解决方案中,以实现并保持其完整性,”迈尔斯说。

例如,Blockchain与加密相关,存在用于管理身份和私钥以进行授权的公钥,这对于数据质量很重要。独特个体之间的交易采取以其公钥识别个人的形式,并使用与其私钥相关的签名来记录每笔交易的协议和批准。他说:“你进行交易,并通过增加一个密封交易信封的钥匙来封闭或同意交易。” “真正的关键是独特的个人识别。”

由于它涉及客户端 - 服务器和分布式分类帐架构,因此整个区块链的副本存储在每个节点上的分布式上下文中。每个参与者维护,计算并将新条目添加到他们自己的分类帐中,并与所有其他分类帐同步。“分布式共识用于确保所有节点得出相同的结论,”他说。

由于它涉及完整性 - 一种不可变的数据结构 - 他使用了书的类比,其页面是连续的。“如果你正在阅读并阅读一些涉及另一件事的东西,那么你需要书的完整性 - 它的序列 - 所以你要读那页,”他说。但如果页面被删除,读者就会知道完整性已被破坏。

由于它涉及数据结构中的完整性和事务散列值,因此创建块创建包含第一条数据的第一个块的散列或数字签名。第二个事务创建第二条数据和来自先前事务的散列的散列,从而连接两者。因此,每个数据块都是通过每个哈希唯一标识的,这很不可能重复。利用这些唯一密钥,可以链接或加入其他“离线”数据结构,确保链中事务与其他地方存储的其他数据之间的参照完整性。 

一致性和完整性是数据质量的最重要的两个维度,最适用于区块链。“分布式数据的等效性或冗余性是衡量代表相同概念的其他数据来源的相似性的指标,”他说 - 即一致性。回到汽车的例子,买方知道卖方已经卖掉了汽车,但是其他人不会在分配的分类账被同步之前并且在所需的人数之间达成协议以确保交易的一致性。如数据质量一致维度中所定义的完整性对于区块链的目的是稳健的,因为它测量数据集的结构或关系质量。

要回答的问题,需要解决的问题

迈尔斯认为,围绕链接到脱链数据结构的唯一密钥存在问题。他问道,如何能够处理离线存储的数据质量,因为人们会想要将大量数据泵入区块链?“由于性能原因和分布式分类账的影响,你通常不会在区块链中放入大量数据,”他说。“首席执行官可能会说'让我们取下数据仓库,然后将所有内容放入区块链中,以便全部协调,并且没有数据质量问题。' 这不是解决问题的方法,“他说。

 “你在区块链中放入了多少数据,这是人们现在想要解决的一个重大架构问题,”他说。

还存在数据质量问题,因为数据完整性与数据准确性不同。可能会将错误的数据正确输入系统,“但这并不能准确地代表现实世界,”他指出。 

迈尔斯建议企业在进行区块链时考虑以下因素:   

  • 了解什么是“拥有”以及供应商是谁,并了解您的业务的数据质量需求。
  • 了解区块链的组件以及您真正需要的组件。
  • 研究替代架构/方法,看看是否有类似的收益,减少炒作和风险/成本。
  • 使用区块链/分布式分类帐技术向前推进,睁大眼睛。
  • 并确定是否所有东西都必须在链条上以及为什么。 

(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 2025年大数据分析发展的预测

    2025年大数据分析发展的预测

    全球每天的互联网搜索、点击、分享、喜欢和刷卡都会产生大约2 5艾字节的数据。这仅仅是由于物联网推动的。IDC公司预测,到2025年数据量……查看详情

    发布时间:2019.03.07来源:亿信华辰浏览量:157次

  • 数据质量分析主要包括那些内容?

    数据质量分析主要包括那些内容?

    数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情

    发布时间:2019.11.13来源:知乎浏览量:279次

  • 如何开展企业ERP(SAP)数据治理工作?

    如何开展企业ERP(SAP)数据治理工作?

    在企业ERP数据治理这个范畴上,我们应该首先解决的是企业对其数据的了解和认知。由于IT系统数据模型反映了应用关系型数据库在数据存储及数据……查看详情

    发布时间:2019.01.07来源:飞鱼浏览量:200次

  • 数据质量衡量标准有几个属性

    数据质量衡量标准有几个属性

    数据分析和数据挖掘都离不开数据的质量,做过数据产品的人都知道,质量高的数据对于产品的意义有多大,如果说数据是不具备完整性、规范性以及一致……查看详情

    发布时间:2022.03.28来源:小亿浏览量:472次

  • 数据治理:将数据从源头进行清洗

    数据治理:将数据从源头进行清洗

    数据一切都与技术的集中化有关。数据安全地存储在企业大型机上,只有具备导航预处理数据库技能的程序员才能访问它。差不多四十年后,所有这些都与……查看详情

    发布时间:2019.06.20来源:简书浏览量:251次

  • 数据治理-理数据,现状分析

    数据治理-理数据,现状分析

    针对企业数据治理所处的内外部环境,从组织、人员、流程、数据四个方面入手,进行数据治理现状的分析。……查看详情

    发布时间:2020.07.17来源:知乎浏览量:233次

  • 数据治理包括哪几个方面

    数据治理包括哪几个方面

    大数据时代的到来,让政府、企业看到了数据资产的价值,快速开始探索应用场景和商业模式、建设技术平台。这无可厚非。但是,如果在大数据拼图中遗……查看详情

    发布时间:2022.05.10来源:小亿浏览量:2134次

  • 用于指导金融行业开展大数据基础平台建设技术类标准

    用于指导金融行业开展大数据基础平台建设技术类标准

    技术类标准用于指导金融行业开展大数据基础平台建设。大数据技术本身涉及内容广泛,既包含大数据平台本身的基础软件和各类功能组件,又包括基于业……查看详情

    发布时间:2019.12.27来源:CSDN浏览量:233次

  • 大数据元数据管理系统有哪些功能

    大数据元数据管理系统有哪些功能

    1、元数据模型的建立,定义元数据模型,清晰展现元数据需求。2、采集:指从各种工具中,把各种类型的元数据采集进来,采集是元数据管理第一步。……查看详情

    发布时间:2021.08.17来源:亿信数据治理知识库浏览量:315次

  • 建立成功的数据治理战略

    建立成功的数据治理战略

    组织当前正在努力解决的数据分析的核心要素之一是数据治理。如果组织没有花时间构建和实施治理策略,那么组织可以做正确的事情并且仍然想知道为什……查看详情

    发布时间:2018.12.14来源:数据治理浏览量:160次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议