(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211125471.6
(22)申请日 2022.09.16
(65)同一申请的已公布的文献号
申请公布号 CN 115203177 A
(43)申请公布日 2022.10.18
(73)专利权人 北京智阅网络科技有限公司
地址 100020 北京市朝阳区四惠桥 南侧甲
一号伊莎文化中心主楼五层A15
(72)发明人 王云
(74)专利代理 机构 深圳汉林汇融知识产权代理
事务所(普通 合伙) 44850
专利代理师 刘临利
(51)Int.Cl.
G06F 16/21(2019.01)
G06F 16/27(2019.01)H04L 67/1004(2022.01)
H04L 67/563(2022.01)
(56)对比文件
CN 110377430 A,2019.10.25
CN 113821340 A,2021.12.21
CN 105227645 A,2016.01.0 6
WO 2021180056 A1,2021.09.16
WO 2021073 083 A1,2021.04.2 2
审查员 王莹
(54)发明名称
一种分布式数据存 储系统及存 储方法
(57)摘要
本发明公开了一种分布式数据存储系统及
存储方法, 包括存储节点, 内部设置有处理器和
存储器, 所述存储节点之间通过网络互相连接;
监视模块, 监控并记录各个所述存储节点的容量
占用率和资源利用率; 计算模块, 针对每一所述
存储节点, 基于所述历史资源利用率计算每个所
述存储节点的迁移时间段; 评估模块, 根据所述
计算模块提供的数据和所述容量占用率, 对所述
存储节点进行筛选, 确定需要迁入迁出的存储节
点; 迁移模块, 用于迁移存储数据; 本发 明通过检
测各个存储节 点的数据存储量并进行数据迁移,
从而可以自动调节各个存储节点的容量占用率
和资源利用率, 从而实现存 储系统的负载均衡 。
权利要求书2页 说明书7页 附图2页
CN 115203177 B
2022.12.06
CN 115203177 B
1.一种分布式数据存 储方法, 其特 征在于, 包括:
步骤S1: 获取各个存储节点的容量占用率, 定义所述容量占用率超过第一阈值的存储
节点为高占用率节点, 所述容量占用率低于第二阈值的存储节点为低占用率节点, 所述第
二阈值小于所述第一阈值;
步骤S2: 基于历史资源利用率数据 预测所述高占用率节点资源利用率低于预设资源利
用率的空闲时间段, 若多个所述高占用率节点的所述空闲时间段位于同一时间段, 执行步
骤S3, 否则执 行步骤S4;
步骤S3: 通过第一公式计算各个所述高占用率节点的压力值, 选取压力值最大的所述
高占用率节点进行数据迁移, 所述第一公式为:
, 其中,
为所述容量占用率,
为所述高占用率节点在过去24小时内的读取频次,
为所述高占
用率节点需要迁移的数据量,
分别为加权系数;
步骤S4: 确定所述高占用率节点需要迁移的数据量;
步骤S5: 筛选剩余存储容量满足第二公式的所述低占用率节点, 所述第二公式为:
, 其中,
为所述第二阈值,
为所述低占用率节点当前的存储数据
量,
为所述高占用率节点需要迁移的数据量,
为所述低占用率节点的总容 量;
步骤S6: 从满足所述第 二公式的所述低占用率节点中选取与所述高占用率节点最适配
的存储节点, 将所述高占用率节点的存 储数据迁移至所述低占用率节点中;
步骤S7: 重 复步骤S2至步骤S6, 直至存储系统内不再存在所述 高占用率节点, 或所有所
述低占用率节点均不再适 合迁入新的存 储数据;
所述步骤S6中, 选取与所述高占用率节点 最适配的存 储节点包括以下步骤:
步骤S61: 将所述高占用率节点和所述低占用率节点对应时间点的历史资源利用率相
加, 获得所述低占 用率节点被转移存储数据后, 各个时间点的预测资源利用率
其中,
和
分别代表所述高占用率节点和所述低占用率节点过去第j
天第i个时间点的所述资源利用率;
步骤S62: 基于第三公式获取所述预测资源利用率的平均值
, 所述第三公式为:
, 其中m代 表共获取 过去m天, n代 表每天获取n个时间点;
步骤S63: 设置资源利用率阈值, 以时间为X轴, 以所述资源利用率为Y轴建立直角坐标
系, 将所述资源利用率阈值和所述预测资源利用率绘制 于所述直角坐标系 上, 基于曲线拟
合法拟合所述预测资源利用率的各个坐标点, 得出曲线函数f(x), 基于第四公式计算所述
曲线函数与X轴围成面积中超过 所述资源使用率阈值与X轴围成的面积S, 所述第四公式为:权 利 要 求 书 1/2 页
2
CN 115203177 B
2其中,
为所述曲线函数与所述资源利用率阈值的交点,
为所述资源利用率
阈值,
是返回
和
中数值较大的参数;
步骤S64: 基于第五公式计算各个所述低占用率节点的抵触分, 所述抵触分最低的所述
低占用率节点为最佳适配存储节点, 所述第五公式为:
, 其中
分别
为加权系数。
2.根据权利要求1所述的一种分布式数据存储方法, 其特征在于, 在进行所述步骤S61
之前, 还包括以下步骤:
步骤S061: 基于当前网络状态、 存储数据大小、 存储节点硬件配置和存储节点所述资源
利用率预测存储数据迁移速度, 剔除所述迁移速度低于预设迁移速度的所述低占用率节
点。
3.根据权利要求2所述的一种分布式数据存储方法, 其特征在于, 所述步骤S61之后, 还
包括以下步骤:
步骤S611: 存在所述预测资源利用率超过所述低占用率节点的所述资源利用率上限
时, 剔除所述低占用率节点。
4.根据权利要求1所述的一种分布式数据存储方法, 其特征在于, 存储数据迁移过程
中, 若所述高占用率节点和所述低占用率节点的所述资源利用率大于所述预设资源利用率
阈值时, 降低存 储数据的迁移速率。
5.根据权利要求1所述的一种分布式数据存储方法, 其特征在于, 未进行数据迁移时,
每隔第一时间获取所述高占用率节点和所述低占用率节点的所述资源利用率, 进 行数据迁
移时, 每隔第二时间获取所述高占用率节点和所述低占用率节点的所述资源利用率, 所述
第二时间小于所述第一时间。
6.根据权利要求1所述的一种分布式数据存储方法, 其特征在于, 设定迁移数值上限,
禁止对数据量大于所述迁移数值上限的存 储数据进行 数据迁移。
7.根据权利要求1所述的一种分布式数据存储方法, 其特征在于, 所述曲线拟合法为最
小二乘法。
8.一种分布式数据存储系统, 用于实现权利要求1 ‑7任一项所述的一种分布式数据存
储方法, 其特 征在于, 包括
存储节点, 内部设置有处 理器和存 储器, 所述存 储节点之间通过网络互相连接;
监视模块, 监控并记录各个所述存 储节点的容 量占用率和资源利用率;
计算模块, 基于历史资源利用率计算每 个存储节点的空 闲时间段;
评估模块, 根据 所述计算模块提供的数据和所述容量占用率, 对存储节点进行筛选, 确
定需要进行数据迁入迁出的存 储节点;
迁移模块, 用于 迁移存储数据。权 利 要 求 书 2/2 页
3
CN 115203177 B
3
专利 一种分布式数据存储系统及存储方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:48:24上传分享