数据质量对区块链的重要性
发布时间:2019.02.20来源:亿信华辰浏览量:110次标签:数据治理
区块链应该显着提高数据质量。所有这些都与所有权有关,他指出 - 无论是金钱,房地产还是其他任何东西 - 以及它的转移,以及如何记录这些数据。需要通过识别所有者,他们拥有的对象的标识以及所有者和对象之间的映射来建立所有权。
区块链提供的优势包括能够提供完整的交易审计跟踪,并验证符合数据质量确认维度中定义的数据质量改进的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和代表。
迈尔斯借鉴了区块链如何改善与汽车相关的交易的理论范例。将重新设想的业务流程的多个步骤与数据质量维度相辅相成:纸质标题可以以数字方式分发,在这种情况下,区块链将现实世界与数字标题连接起来,同时具有可打印和数字标题; 并且对数据质量的改进以所有权的表示形式和对区块链的验证形式进行。或者使用区块链的私人汽车销售保护家庭和邮寄地址的隐私,同时提供实体和销售权限的验证,从而实现数据质量改进,以确保销售价格的准确性和进行商业交易的各方的完整性。
区块链背景 - 数据质量维度
在对等的分类账系统中运行,区块链是存储的网络节点,并使用由协商有序和连接数据块的信息内容以及密码和安全技术的算法组成的软件单元。“从架构的角度来看,你将所有这些都推到了一个合理的解决方案中,以实现并保持其完整性,”迈尔斯说。
例如,Blockchain与加密相关,存在用于管理身份和私钥以进行授权的公钥,这对于数据质量很重要。独特个体之间的交易采取以其公钥识别个人的形式,并使用与其私钥相关的签名来记录每笔交易的协议和批准。他说:“你进行交易,并通过增加一个密封交易信封的钥匙来封闭或同意交易。” “真正的关键是独特的个人识别。”
由于它涉及客户端 - 服务器和分布式分类帐架构,因此整个区块链的副本存储在每个节点上的分布式上下文中。每个参与者维护,计算并将新条目添加到他们自己的分类帐中,并与所有其他分类帐同步。“分布式共识用于确保所有节点得出相同的结论,”他说。
由于它涉及完整性 - 一种不可变的数据结构 - 他使用了书的类比,其页面是连续的。“如果你正在阅读并阅读一些涉及另一件事的东西,那么你需要书的完整性 - 它的序列 - 所以你要读那页,”他说。但如果页面被删除,读者就会知道完整性已被破坏。
由于它涉及数据结构中的完整性和事务散列值,因此创建块创建包含第一条数据的第一个块的散列或数字签名。第二个事务创建第二条数据和来自先前事务的散列的散列,从而连接两者。因此,每个数据块都是通过每个哈希唯一标识的,这很不可能重复。利用这些唯一密钥,可以链接或加入其他“离线”数据结构,确保链中事务与其他地方存储的其他数据之间的参照完整性。
一致性和完整性是数据质量的最重要的两个维度,最适用于区块链。“分布式数据的等效性或冗余性是衡量代表相同概念的其他数据来源的相似性的指标,”他说 - 即一致性。回到汽车的例子,买方知道卖方已经卖掉了汽车,但是其他人不会在分配的分类账被同步之前并且在所需的人数之间达成协议以确保交易的一致性。如数据质量的一致维度中所定义的完整性对于区块链的目的是稳健的,因为它测量数据集的结构或关系质量。
要回答的问题,需要解决的问题
迈尔斯认为,围绕链接到脱链数据结构的唯一密钥存在问题。他问道,如何能够处理离线存储的数据质量,因为人们会想要将大量数据泵入区块链?“由于性能原因和分布式分类账的影响,你通常不会在区块链中放入大量数据,”他说。“首席执行官可能会说'让我们取下数据仓库,然后将所有内容放入区块链中,以便全部协调,并且没有数据质量问题。' 这不是解决问题的方法,“他说。
“你在区块链中放入了多少数据,这是人们现在想要解决的一个重大架构问题,”他说。
还存在数据质量问题,因为数据完整性与数据准确性不同。可能会将错误的数据正确输入系统,“但这并不能准确地代表现实世界,”他指出。
迈尔斯建议企业在进行区块链时考虑以下因素:
- 了解什么是“拥有”以及供应商是谁,并了解您的业务的数据质量需求。
- 了解区块链的组件以及您真正需要的组件。
- 研究替代架构/方法,看看是否有类似的收益,减少炒作和风险/成本。
- 使用区块链/分布式分类帐技术向前推进,睁大眼睛。
- 并确定是否所有东西都必须在链条上以及为什么。
-
以数据中台为切入点,场景/应用驱动源头数据治理
数据中台通常是应用驱动构建,所处理的数据是业务关心和使用的数据。在数据中台开发与运营服务的过程中,面临很多源头数据的问题,比如不同系统的……查看详情发布时间:2020.04.01来源:知乎浏览量:104次
-
数据质量包括那些方面
数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。……查看详情发布时间:2020.04.09来源:百度浏览量:138次
-
如何正确理解数据治理
我们经常会谈到关于大数据、数据质量、主数据、元数据方面的一些问题,不可避免的会提到数据治理,那么什么是数据治理呢?……查看详情发布时间:2020.07.15来源:知乎浏览量:97次
-
企业如何成功的实现数据治理?
当下是一个大数据的时代,如果一个企业没有数据,那么在做决策时就缺乏数据的支持,但是如果企业有了数据,不对数据进行治理,那么就无法充分有效……查看详情发布时间:2019.07.18来源:知乎浏览量:84次
-
微软收购BlueTalon以支持数据治理产品
微软今天宣布收购BlueTalon,这是一家总部位于加利福尼亚州雷德伍德市的跨平台数据访问控制解决方案提供商,收购金额不详。Azure ……查看详情发布时间:2019.08.02来源:知乎浏览量:82次
-
银行自身要提升数据治理能力
数字经济对金融服务的模式也提出了新的要求,银行必须依托科技支撑,加快和深化数字化转型,带动风控模式的改革创新。银行还需要着力于构建其自身……查看详情发布时间:2019.10.29来源:知乎浏览量:132次
-
数据科学趋势在2019年
在谈到2019年要关注的主要数据科学趋势时,Kaggle的联合创始人兼首席执行官Anthony Goldbloom 预测,很快数据中心将……查看详情发布时间:2019.01.04来源:数据治理浏览量:74次
-
医疗保健委员会治理的最佳实践是什么?
治理这个词源于拉丁语gubernare,意思是指导或统治。医疗保健委员会的治理正在发展,因为技术使医院和其他医疗机构能够访问越来越多的数……查看详情发布时间:2019.03.14来源:亿信华辰浏览量:96次
-
什么是敏捷数据管理?敏捷数据管理的技术原则
在大数据的时代,大家都在重视数据存储和大数据相关技术的同时,都开始注重建设数据管理能力。在海量复杂数据的场景下,如果没有有效的管理,那么……查看详情发布时间:2022.03.03来源:小亿浏览量:183次
-
常见的主数据管理问题
主数据管理,包括不仅仅是硬件和软件,还是将数据作为重要资产管理的思想和办法,是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保……查看详情发布时间:2020.12.05来源:知乎浏览量:298次