当前位置: 首页 > news >正文

分库分表实战

为什么

分表:解决单表数据量过大,查询性能下降,ddl困难问题

分库:解决单库连接数不足,写并发高,通过分摊压力提高吞吐量,单机瓶颈。

问题

引入了分布式复杂性

方式

垂直分库分表

按照业务模块拆分库

按列拆分表

水平分库分表

按行拆分,解决单表过大问题,应对大数据量核心手段

分片键

怎么选?

查询频率高的

路由算法

范围分片

按照id或时间分。扩容,查询方便

缺点,容易数据倾斜

哈希取模

分片键哈希取模,数据分布均匀

缺点,扩容困难,需要迁移数据

一致性哈希

解决扩容问题,节点变化前只需迁移少量数据。

缺点,实现复杂,存在哈希倾斜风险

分库分表数量为什么是2的幂次方

和hashMap是一个道理。

  • 位运算优化:hash % 8 等价于 hash & (8-1),性能更高。
  • 均匀分配:便于将表均匀分配到多个库中。
  • 易于扩容:从N张表扩容到2N张表时,只需迁移一半数据。利用了“高位运算”:因为容量永远是 2 的幂,扩容时只需看 hash 值新增的那一位高位是 0 还是 1。是 0 就留在原索引(低位),是 1 就迁移到 原索引 + 旧容量(高位)。

分布式ID

雪花算法,redis自增(挂了怎么办?)

跨库JOIN

  • 常用字段冗余
  • 全局表:每个库存一份变动少基础表(配置)。本地join
  • 应用层组装,查好数据在内存中组装
  • 相关联的数据,强制放在一个节点。比如订单和订单详情,相同的订单,数据要放在同一个节点。

分布式事务如何处理?

比如强一致性的二阶段提交。但是不建议使用,因为性能差。

最终一致性,比如tcc和saga。 Tcc比较复杂,每种事务都要实现三个方法 Try ,confirm和cancel。本地消息表加重试,或者rocket mq事务消息。

非分片键如何查询?

一,建立映射表,非分片键和分片键,建立映射表

二,异构索引,根据另一个维度,再建立一套分库分表。

三,基因法,将分片信息植入到id中。比如订单表和用户id。订单号包含用户id分片信息。

生成订单号的时候,可以将用户id生成二进制,然后放到订单号的尾部。查询的时候解析出来即可。

或者是生成雪花id的时候,专门划分几位,保存库表编号。

基因法的一个优点就是不用去查映射表,也不用去配置中心拉取路由规则,计算路由。速度会很快,就是单纯的位运算。那他的一个缺点也很明显,就是灵活性很差,比如说我一个节点挂了,或者发生数据倾斜,或者是要扩容,迁移数据的时候,就没有办法使用。

这里一个解决方案就是可以兜底,使用映射覆盖,就是在中间件层设置一个优先级更高的热迁移配置。如果有设置配置,那么就去读取配置强制使用配置中的路由,否则就使用id中的路由。

如何设计?

当查询遇到分页怎么办?

先查出来,然后再在内存中聚合。但是性能比较差。尽量能不分页就不分页,或者使用es。

如何设计动态扩容方案

一,停机扩容,但是不推荐,数量大的时候会很慢。

二,一次性规划好,预分配。一次性就设计好,32个库,每个库32张表,一共是1024张表。够用好久,避免扩容迁移数据。

http://www.cnnetsun.cn/news/3054459.html

相关文章:

  • SQLModel零基础教程(五)- 工程化封装 迁移工具
  • FluxDown:替代IDM的免费下载器
  • PCB 新手 18 类常见错误汇总
  • OpenGL学习笔记-04-着色器-基础说明
  • SQL注入漏洞实战:从手工注入到参数化查询修复
  • TI TPIC7710EVM评估模块:汽车EPB系统ASIC驱动与电机控制实战解析
  • EtherCAT重学之二: EtherCAT 系统硬件架构
  • 从零到一:如何用免费开源Verilog工具链打造专业数字电路
  • 从让AI写代码,到让AI管流程
  • Burp Suite实战:验证码场景下的自动化渗透测试与绕过技术
  • 权威测评:2026年实力出众的专业AI论文工具
  • 关于我的第十次web作业
  • 3步搞定Navicat无限试用:Mac用户的终极解决方案 [特殊字符]
  • DICOM图像核心参数实战指南:从像素到诊断的精准度量
  • 无需编程,快速打造专属物联网APP——ThingsCloud平台实战指南
  • 煤矿通信 “侦察兵”:光缆普查仪 CM-K60 助力井下光缆快速识别
  • MATLAB双目相机标定:从工具箱实战到参数解析
  • 企业AI化转型核心:打造分工协作的多Agent团队,小白也能看懂!
  • League Akari终极指南:8个秘诀掌握英雄联盟自动秒选黑科技
  • 【独家首发】ChatGPT API调用诊断工具包(含12个自检函数+实时token追踪+异常归因热力图)
  • 深入解析TL16C552:双串一并通信控制器的硬件设计与软件驱动
  • 【R语言实战】解锁Wind与iFinD金融数据:从零到一的API调用与避坑指南
  • 如何用League Akari实现英雄联盟自动秒选:终极配置指南
  • 计算机毕业设计之基于SSM礼服租赁系统的设计与实现
  • RePKG使用指南:轻松提取Wallpaper Engine资源包和转换TEX图片格式
  • 评测:国内主流S2B2C系统服务商全方位横评(2026版)
  • 如何在1分钟内为Windows安装苹果USB网络共享驱动:完整解决方案
  • 突然报 “关键字 WITH 附近有语法错误“?一篇避坑指南
  • Feign 远程调用:调用的是对方项目的 Controller,不是 Service
  • Windows风扇控制终极指南:用Fan Control彻底告别噪音烦恼