说明:最全电力标准
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211017289.9 (22)申请日 2022.08.24 (71)申请人 南威软件股份有限公司 地址 362018 福建省泉州市丰泽区丰海路 南威大厦2号楼 (72)发明人 吴志雄 陈泽辉 (74)专利代理 机构 福州元创专利商标代理有限 公司 35100 专利代理师 丘鸿超 蔡学俊 (51)Int.Cl. G06F 16/27(2019.01) G06F 16/28(2019.01) G06F 16/22(2019.01) G06F 16/23(2019.01) G06F 9/54(2006.01) (54)发明名称 数据异构同步系统 (57)摘要 本发明提出一种数据异构同步系统, 包括源 端数据库和目标端数据库; 对于源端数据库系统 数据获取, 基于canal开源组件进行, canal伪装 成mysql的从库, 从而 监听到mysql主数据库中的 binlog日志, 作为数据同步的源头; 采用kafka消 息中间件, 作为数据缓存、 削峰的工具; 配置开启 canal监听数据库binlog, 将获取后binlog日志 信息解析后以Json格式同步写入到kafka消息队 列集群中, 下一步的数据同步采用集群的方式对 kafka中的数据进行分布式消费, 以提高数据同 步的效率和稳定性、 容错性; 消费kafka中的数据 同步到一种或多种目标端数据库中。 权利要求书2页 说明书5页 附图1页 CN 115438122 A 2022.12.06 CN 115438122 A 1.一种数据异构同步系统, 其特征在于: 包括源端数据库和目标端数据库; 对于源端数 据库系统数据获取, 基于canal开源组件进行, canal伪装成mysql的从库, 从而监听到mysql 主数据库中的binlog日志, 作为数据同步的源头; 采用kafka消息中间件, 作为数据缓存、 削 峰的工具; 配置开启canal监听数据库binlog, 将获取后binlog日志信息解析后以Json格式 同步写入到kafka消息队列集群中, 下一步的数据同步采用集群的方式对kafka中的数据进 行分布式消费, 以提高数据同步的效率和稳定性、 容错性; 消费kafka中的数据同步到一种 或多种目标端数据库中。 2.根据权利要求1所述的数据异构同步系统, 其特征在于: 所述目标端数据库为 elasticsearc h、 redis、 mysql、 pgsql中的一种或多种。 3.根据权利要求1所述的数据异构同步系 统, 其特征在于: 在消费kafka中的数据同步 到一种或多种目标端 数据库中之后, 基于kafka的消息队列数量及消费情况, 核对源数据库 和目标库中数据量, 并针对未成功消费的数据进行 数据补偿同步。 4.根据权利要求1所述的数据异构同步系统, 其特 征在于: 其工作过程包括以下步骤: 步骤S1: 采用canal作为采集源数据的工具, 基于主从复制的协议从mysql主节点中获 取binlog日志数据, canal模拟mysql的slave节点; 步骤S2: 配置canal相关信息, 包括源数据库信息、 需同步源表信息、 写入的kafka数据 源信息、 kafka主题, 并开启canal监听程序, 将数据库表变更信息以json格式写入到kafka 中; 步骤S3: 根据kafka的主题topic, 声明一个监听类用于接收相应topic的kafka消息数 据; 步骤S4: 解析kafka消息中的JSON数据; 步骤S5: 配置同步目标 数据库的信息, 对应写入的目标 数据的类型; 步骤S6: 根据不同的目标数据库, 设配不同数据库的处理和写入或更新程序, 用于生成 更新语句、 更新逻辑, 为数据更新做准备; 步骤S7: 连接配置的目标数据库, 构建执行器, 将生成更新语句、 更新逻辑进行执行, 达 到目标数据库同步的效果; 步骤S8: 对同步的数据进行 数据对账, 以校验 源数据和目标 数据库的数据量是否一 致。 5.根据权利要求4所述的数据异构同步系统, 其特征在于: 在步骤S2中, 若需同时同步 多个表, 将同一个库中的多个表数据同步到同一个kafka的topic中; 并在步骤S4中通过表 名进行区分, 便 于做多表合并时的处 理。 6.根据权利要求 4所述的数据异构同步系统, 其特 征在于: 在步骤S4中, JSON数据中包括的信息有: 1) 变更类型type, 包括: 新增、 修改和删除; 2) 源库、 表信息, 包括: 源表的数据字段类型、 长度的修改表结构信息; 3) 变更数据集, 以k ‑v的形式存 储的表数据内容, 数据主键, 变更 前的数据内容。 7.根据权利要求4所述的数据异构同步系统, 其特征在于: 步骤S5中对每个表配置源表 和目标表的映射关系。 8.根据权利要求4所述的数据异构同步系统, 其特征在于: 步骤S7中基于步骤S6生成的 可执行的sql或者请求, 在数据批量或密集关系的场景下, 将以分批的形式将数据进行归权 利 要 求 书 1/2 页 2 CN 115438122 A 2集, 并以固定的频次调用执 行器, 以避免频繁调用执 行器导致的目标 数据库并发压力。 9.根据权利 要求4所述的数据异构同步系统, 其特征在于: 在步骤S8中, 基于kafka的消 息队列数量及消费情况, 核对源数据库和目标库中数据量, 并针对未成功消费的数据进行 数据补偿同步。 10.根据权利要求4所述的数据异构同步系统, 其特征在于: 所述数据补偿同步以设定 的时间频率进行数据校验, 如发现数据校验问题, 则根据情况判断是否执行补偿机制进行 数据修复; 若补偿机制无法满足或存在数据缺失问题, 则通知进行 人工处理。权 利 要 求 书 2/2 页 3 CN 115438122 A 3
专利 数据异构同步系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-07 12:42:57
上传分享
举报
下载
原文档
(346.2 KB)
分享
友情链接
DB3212-T 1126—2022 救助管理机构管理绩效评估规范 泰州市.pdf
NB-T 10178-2019 煤矿在用继电保护装置电气试验规范.pdf
深信服 aTrust零信任技术白皮书V1.4 2022.pdf
GB-T 32776-2016 农药密度测定方法.pdf
T-SHDZ 001—2023 浅层地下水环境监测井建设技术标准.pdf
DB42-T 2040.1-2023 大球盖菇生产技术系列规程 第1部分:桑枝大球盖菇 湖北省.pdf
GB-T 42888-2023 信息安全技术 机器学习算法安全评估规范.pdf
T-CNPHARS 0001—2023 个体化用药遗传咨询指南.pdf
ISO 21434 Road vehicles Cybersecurity engineering 英文版.pdf
GB-Z 41358-2022 土壤健康综合表征的生物测试方法.pdf
DL-T 1987-2019 六氟化硫气体泄漏在线监测报警装置技术条件.pdf
GB-T 33130-2016 高标准农田建设评价规范.pdf
专利 一种水循环温控系统.PDF
DB31-T 444-2022 排水管道电视和声呐检测评估技术规程 上海市.pdf
GB51415—2020 有色金属冶炼废气治理技术标准.pdf
DB51-T 2621-2019 机关事务信息化建设指南 四川省.pdf
GB 19079.11-2005 体育场所开放条件与技术要求 第11部分漂流场所.pdf
GB-T 35973-2018 集装箱环保技术要求.pdf
GB 16897-2022 制动软管的结构、性能要求及试验方法.pdf
DB52-T 1041-2015 贵州省红粘土和高液限土路基设计与施工技术规范 贵州省.pdf
1
/
9
评价文档
赞助2.5元 点击下载(346.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。