数据库如何分库？

访客性能优化 2026-06-06 12:08:36 3

从理论到实践的深度指南

目录导读

什么是数据库分库？核心概念与适用场景
为什么需要分库？垂直分库与水平分库的对比分析
分库的五大核心实现方案（含代码示例）
分库后常见问题：分布式事务、跨库查询与数据一致性
实战问答：解决分库中的6个高频疑问
分库最佳实践与避坑指南

什么是数据库分库？核心概念与适用场景

数据库分库（Database Sharding）是指将原本存储在一个数据库中的数据，按照某种规则拆分到多个独立的数据库实例中，这是解决单库性能瓶颈（如连接数不足、磁盘I/O饱和、查询响应缓慢）的核心手段。

适用场景：

单表数据量超过500万行且持续增长
数据库写入QPS超过2000/s
单一数据库的存储空间接近上限（如2TB）

为什么需要分库？垂直分库与水平分库的对比分析

1 垂直分库（Vertical Sharding）

将不同业务模块的表拆分到不同数据库，用户库、订单库、商品库独立部署。

优点：

业务隔离，故障影响范围小
可针对不同业务选择不同存储引擎（如订单库用InnoDB,日志库用MyISAM）

缺点：

跨库JOIN查询困难
单个业务库内的大表问题未解决

2 水平分库（Horizontal Sharding）

将同一张表的数据按算法分片到多个数据库,用户表按用户ID哈希分库。

优点：

单库数据量线性降低
写入吞吐量成倍增加

缺点：

分布式事务复杂
扩容时需要迁移数据

分库的五大核心实现方案

基于哈希取模（常见于用户ID）

-- 分库规则：user_id % 4
-- 数据入库示例
INSERT INTO db_{hash(user_id)}.user_table (id, name) VALUES (?, ?);

优点：数据均匀分布
缺点：扩容时需迁移大量数据（如从4库→8库）

基于时间范围（常见于日志表）

# 按月分库：log_202501, log_202502 ...
if month <= 6:
    db_name = "log_half1"
else:
    db_name = "log_half2"

优点：方便历史数据归档与删除
缺点：热点数据集中在近期库

使用中间件（如ShardingSphere、MyCat）

# ShardingSphere配置示例
rules:
- !SHARDING
  tables:
    t_order:
      actualDataNodes: ds${0..3}.t_order_${0..15}
      databaseStrategy:
        standard:
          shardingColumn: user_id
          shardingAlgorithmName: db_hash

优点：对业务透明，无需改代码
缺点：增加运维复杂度

自研分库路由（适用于简单业务）

// 基于一致性哈希的数据库路由
public String getDBName(Long userId) {
    TreeMap<Long, String> hashRing = buildRing();
    long hash = hashFunction.hash(userId);
    return hashRing.ceilingEntry(hash).getValue();
}