数据交换服务组件介绍

发布时间:2020.08.12来源:知乎浏览量:2次标签:数据治理

数据交换服务组件,在遵循一定的交换策略条件下进行数据交换及消息传递,支持数据资源在不同单位、不同区域的快速交换和共享,提供配置工具生成交换节点,此外在数据传输过程中应保证数据完整性、安全性、可靠性和传输性能。

数据交换服务组件

基于统一的数据服务配置出不同的数据交换方式
数据交换服务组件:支持全量、批量、实时的数据交换;支持大数据量的数据交换;支持复杂网络环境下的可靠数据交换;支持跨网段、跨单位的数据交换;支持基于通道、文件的加密传输;支持多种数据接口和传输协议;提供数据交换日志;支持断点续传功能。

(1)异构、异地的数据交换
提供基于流加工技术的数据交换和共享,在一个服务内实现数据库、文件、JSON、XML、传输队列、适配器等之间的相互交换。具有以下交换功能:

支持数据库:Oracle、SQL Server、DB2、Sybase ASE、Sybase IQ、Informix、My SQL、FoxPro、Access等;国产数据库:达梦、人大金仓、神州数据库等。
支持SQL语句作为数据源。
No SQL的交换:支持与MongoDB的交换,支持与Hive的交换,支持与HBASE的交换,支持与Elastic Search的交换。
支持文件:文本文件(分隔符、定长等)、Excel文件、DBF文件、MDB文件等。分隔符文件要支持组合分隔符。能可视化配置文件与异构系统的交换。
支持XML, XML可以是文件,也可以是来源消息队列、API、 Web URL等。能可视化配置XML与异构系统的交换。
支持JSON, JSON可以是文件,也可以是来源消息队列、API、 Web URL等。能可视化配置JSON与异构系统的交换。
提供内存对象映射满足API、传输队列数据抽取。可视化定义内存表与异构系统的交换;可视化配置数据采集结果可输出到通道中,实现数据传输服务的绑定。

跨网段的数据交换能力。跨网段是指数据源和数据目标位于不同的网段,每个网段不能访问跨网段的数据库。能配置跨网段的数据交换服务;能实现跨网段的实时联动的数据交换;支持CLob字段、blob字段等。

(2)数据交换过程中的数据加工
数据交换过程中的数据加工,实现如下加工能力:
多种数据转换方法:包括字符串转换、字段赋值、时间类转换、数据比对与翻译、数学运算、身份证格式转换等。
交换过程中的数据质量检查,根据数据逻辑判断规则,将干净的数据装载到目标中,将判断有问题的数据路由到数据库表或者数据文件中。
多种逻辑处理,包括:格式匹配检查(如日期格式、数据格式、身份证格式、自定义格式等)、字符串逻辑检查(包含、以结束、以开始、在列表中、等于等)、内容为空检查、重复记录检查、范围内检查(如在列表内、字典或代码表内、包含、等于)、表表外键关联检查、逻辑检查(=、>、>=、<、<=、为空、非空、<And<、<=And<、<And<=、<=And<=、为真、为假等)、复合逻辑检查(以上逻辑的and、or组合)、自定义逻辑检查等。并能可视化配置。

多种路由策略,路由条件可以是逻辑判断,也可以是等于、不等于、小于、小于等于、大于、大于等于、大于且小于、大于等于且小于、大于且小于等于、大于等于且小于等于、规则表达、是空、非空、在列表中、包含、开始为、结束为、为真、为假等方法。数据路由也可以是条件的组合,可以是and 也可以是Or。

(3)保证交换的可靠性、性能、实时性
支持断点续传。在数据交换任务运行过程中由于各种不确定原因造成网络中断,网络恢复后重新运行服务后保证数据一致。
支持实时交换。实现通过字符串报文、XML、JSON等格式实时交换数据。
支持通过分析日志捕捉变化数据的实时交换。支持数据库CDC技术,能捕捉指定表的变化数据,增量抽取变化数据,经过转换等处理后按照条件路由到多个数据目标中。
支持数据分组分块平行加工。在一个数据交换服务中实现数据分块及数据并行加工处理,保证加工性能。

(4)提供批量文件交换
提供文件传输服务功能。保证文件的可靠传输,主要实现如下功能:
支持对文件、文件夹、文件夹下指定文件等的传输。
提供变化文件传输功能,实现对文件夹含子文件夹的文件增量传输。
提供文件筛选功能,实现满足条件的文件传输。
提供多节点间文件接力传输功能,实现多节点间文件传输的联动。
实现文件传输过程加密、压缩、断点续传等功能。
支持一对一、一对多,支持同步、异步传输方式。
提供和外部FTP、SFTP的传输服务,方便给外部的FTP/SFTP文件服务器交换文件。
提供FTP文件传输服务,包括文件的上传和下载,支持文件和文件夹传输,支持变化文件传输、删除已传输文件等处理 。
提供SFTP文件传输服务,包括文件的上传和下载,支持文件和文件夹传输。
提供文件清理功能,方便整理文件存储空间主要实现如下功能:能压缩备份给定天数之前的文件,能删除给定天数之前的的文件。
(部分内容来源网络,如有侵权请联系删除)
立即免费申请产品试用 免费试用
相关文章推荐
  • 不治理就破产—谈大数据时代的数据治理

    不治理就破产—谈大数据时代的数据治理

    随着Hadoop技术的提升,数据如何进来,如何整合,开展什么样的应用都已经有了成熟的案例,可是,同传统数仓时代一样,垃圾进垃圾出,如何破……查看详情

    发布时间:2019.02.21来源:知乎浏览量:1次

  • 浅谈银行的数据治理有哪些问题

    浅谈银行的数据治理有哪些问题

    企业数据治理的实践来看,目前在数据标准化这块落地也存在很大的困难,虽然现在有些企业在数据标准整理上已经基本上有了一个完整的标准,也存在标……查看详情

    发布时间:2020.02.21来源:知乎浏览量:2次

  • 亿信华辰&东芝|拥抱智能制造,实现生产数据实时采集

    亿信华辰&东芝|拥抱智能制造,实现生产数据实时采集

    在《中国制造2025》战略实施后,“制造业数字化、网络化、智能化”被定义为新工业革命的核心技术。离开生产数据采集,生产管理部门不能及时、……查看详情

    发布时间:2019.05.10来源:亿信华辰浏览量:0次

  • 数据治理:它是什么以及它为什么重要?

    数据治理:它是什么以及它为什么重要?

    数据治理:它是什么以及它为什么重要?……查看详情

    发布时间:2018.12.26来源:亿信华辰浏览量:2次

  • 持续的业务改进取决于数据治理

    持续的业务改进取决于数据治理

    当我们认为有价值的东西时,我们需要确定我们如何以及何时使用它以及保护它。我们通过建立标准,政策和流程来定义如何利用和保护此资产。……查看详情

    发布时间:2019.01.26来源:亿信华辰浏览量:2次

  • 数据科学的下一个「超能力」:模型可解释性

    数据科学的下一个「超能力」:模型可解释性

    很多人重视重视模型的预测能力,却忽略了模型可解释性的重要性,只知其然而不知其所以然。为什么说模型的可解释性这么重要呢?作者就 5 个方面……查看详情

    发布时间:2019.03.28来源:亿信华辰浏览量:1次

  • 浅析银行业如何做数据治理

    浅析银行业如何做数据治理

    2018年5月,银保监会发布《银行业金融机构数据治理指引》,从数据治理架构、数据管理、数据质量控制、数据价值实现、监督管理等方面规范银行……查看详情

    发布时间:2019.06.14来源:亿信华辰浏览量:3次

  • 敏捷/精益数据治理最佳实践

    敏捷/精益数据治理最佳实践

    数据治理 的目标 是确保组织内的质量,可用性,完整性,安全性和可用性。你对此的看法取决于你。许多传统的数据治理方法似乎在实践中都很困难,……查看详情

    发布时间:2018.11.20来源:数据治理浏览量:1次

  • 为什么数据治理?

    为什么数据治理?

    数据治理曾经是一件好事,但由于数据和分析的重点和重要性日益增加,它已成为帮助推动整个企业数据管理的必要条件。……查看详情

    发布时间:2018.12.21来源:亿信华辰浏览量:1次

  • 大数据治理 [Big Data Governance an Emerging Imperative]

    大数据治理 [Big Data Governance an Emerging Imperative]

    《大数据治理》是一个信息治理专家奉献的鸿篇巨制,作者以极其实用和通俗易懂的风格,倾心向读者解读大数据治理这一复杂主题。作为一家大公司的资……查看详情

    发布时间:2018.11.29来源:数据治理浏览量:2次

相关主题
您点击 “提交”,表明您已理解并同意接受本网站隐私政策和用户协议