如何提升吞吐量？

访客性能优化 2026-06-06 13:31:00 2

本文目录导读：

核心思想：找到瓶颈是第一步
提升吞吐量的七大策略（按优先级排序）
一个提升吞吐量的思考框架

提升系统吞吐量是一个系统工程,涉及硬件、软件架构、代码优化和数据库等多个层面，没有“一招鲜”的解决方案，需要根据具体的瓶颈点（CPU、内存、IO、网络）来对症下药。

下面我将从宏观策略到微观技巧，为你整理一个系统性的提升思路。

核心思想：找到瓶颈是第一步

在动手优化前,必须通过监控和压测工具（如 Prometheus + Grafana, JMeter, Arthas, Profiling 工具）定位系统的瓶颈点，常见的瓶颈有：

CPU 密集型： 计算、加密、压缩、复杂逻辑。
IO 密集型： 磁盘读写（数据库、文件）、网络 IO（RPC、HTTP）、内存操作。
锁竞争： 数据库锁、分布式锁、编程语言层面的锁（如 synchronized， Mutex）。

提升吞吐量的七大策略（按优先级排序）

水平扩展（最根本、最有效的策略）

单机性能有物理极限,横向扩展是突破极限的最佳方式。

无状态服务： 将服务设计成无状态（Session 存储在 Redis 等外部存储中），轻松通过增加机器实例来提升吞吐量，前面放负载均衡（Nginx、HAProxy、云原生 SLB）。
数据库/缓存分片： 对数据库进行分库分表（Sharding）；使用一致性哈希算法扩展 Redis 集群。
消息队列解耦（削峰填谷）： 如果上游请求激增，消息队列（Kafka, RabbitMQ, Pulsar）可以作为缓冲区，服务端按自身处理能力消费，避免被突发流量冲垮，同时提升整体系统的处理上限。

缓存（性价比最高的策略）

将计算或访问代价高昂的数据放入高速缓存,减少对慢速后端（如数据库、磁盘、远程服务）的请求。

本地缓存（内存）： Guava Cache, Caffeine，适合数据量小、一致性要求不高的热点数据，速度极快。
分布式缓存（远程）： Redis, Memcached，适合共享数据、跨实例缓存，注意缓存穿透、缓存雪崩、缓存击穿问题。
CDN： 针对静态资源（图片、CSS、JS）的缓存，卸载服务端的请求压力。

并发与异步化（榨干单机资源）

让计算机在等待 IO 时不空闲。

线程池/协程： 使用合适的线程池（Java ThreadPoolExecutor， Go goroutine）管理并发任务。注意： 线程不是越多越好，过多会导致上下文切换开销剧增，IO 密集型任务线程数可适当多于 CPU 核心数；CPU 密集型任务线程数建议等于核心数。
异步模型： 使用非阻塞 IO（NIO / Netty / Node.js / Go Goroutine + Channel）或事件驱动模型，当一个请求需要调用多个外部服务时，使用 CompletableFuture（Java）、async/await（Python、JavaScript）、Future（Go）并行发起调用，而非串行等待。
消息驱动： 不需要立即返回结果的操作（如发邮件、做统计），丢到 MQ 里后台异步处理，快速返回响应给客户端。

优化 IO（从协议到硬件）

绝大多数系统的瓶颈是 IO。

网络 IO：
- 序列化/压缩： 使用高效的序列化协议（Protobuf 优于 JSON，JSON 优于 XML），对传输数据使用 Gzip / Snappy / Zstd 压缩。
- 连接池： 复用 TCP/HTTP 连接（如 HttpClient 连接池，数据库连接池，Redis 连接池），避免频繁三次握手和四次挥手。
- 协议升级： HTTP/1.1 -> HTTP/2（多路复用） -> HTTP/3（QUIC，基于 UDP 减少 TCP 队头阻塞）。
磁盘 IO：
- 顺序读写： 尽量将随机 IO 转化为顺序 IO（如日志的 Append，WAL，LSM-Tree）。
- Page Cache 调优： 操作系统层面调整脏页回写策略（vm.dirty_ratio），利用好 Page Cache。
- 使用 SSD： 相比机械硬盘，随机 IO 性能提升百倍以上。

数据结构和算法优化（从代码层面）

选择合适的数据结构： 对于频繁的查找，用 HashMap 替代 List；对于快速计数，用 LongAdder 替代 AtomicLong（在高并发下）。
减少对象创建： 在热路径中避免不断 new 对象（导致 GC 压力），使用对象池（如连接池、字节缓冲池）。
避免锁竞争： 使用无锁数据结构（ConcurrentHashMap， CopyOnWriteArrayList）、CAS（Compare and Swap）、乐观锁（数据库版本号）、读写锁（ReentrantReadWriteLock，适合读多写少）、细粒度锁（减小锁的范围，比如分段锁）。
零拷贝： 在文件传输等场景使用 OS 原生 sendfile（Java FileChannel.transferTo），避免数据在内核态和用户态多次拷贝。

数据库优化（瓶颈高发区）

索引： 建立合适的索引（联合索引最左匹配、覆盖索引避免回表、索引下推）。
SQL 优化： 避免 SELECT *，只查需要的字段；避免大表 JOIN / 子查询；分页优化（用 WHERE id > ? LIMIT 10 替代 LIMIT offset, 10）。
连接池： 设置合适的连接池大小（HikariCP， Druid），过小等待排队，过大耗尽数据库连接资源。
读写分离： 主库写，从库读；从库可水平扩展。
冷热数据分离： 历史归档（使用 TiDB 或分表），减少单表数据量。

系统/架构层面的其他优化

连接数限制： Nginx 的 worker_connections，Tomcat 的 max-threads 等，设置合理上限，防止系统在极端压力下崩溃。
熔断降级： 使用 Hystrix / Sentinel / Resilience4j，当下游服务变慢/不可用时，快速失败而不是阻塞（这会导致线程资源被耗光，吞吐量急剧下降）。保护系统本身。
服务化拆分（微服务）： 将单体应用拆分成多个独立部署的小服务，每个服务可以独立水平扩展，不同服务可以使用不同技术栈（比如计算密集型的用 Go/C++， IO 密集型的用 Java/Python）。

一个提升吞吐量的思考框架

观察： 真的需要提升吗？瓶颈在哪？（CPU？IO？锁？）
扩展： 能不能加机器？（水平扩展是最省钱、最有效的方法）
缓存： 能不能不计算/不查库？（缓存）
异步： 能不能不等？（消息队列 / 异步 IO）
并行： 能不能同时做？（异步编排 / 线程池）
算法： 有没有更好的算法？（数据结构 / 锁优化）
IO： 能不能减少 IO 量？（压缩 / 批量 / 索引）
硬件： 是不是硬件瓶颈？（换 SSD / 加内存 / 升级 CPU）

核心要诀： 先找瓶颈，再想方案；先做扩展，再做优化；先看 IO，再看 CPU；先做架构，再扣代码。

标签：并发处理

本文地址： https://www.dfhcn.com/post/903.html

文章来源：访客

版权声明：除非特别标注，否则均为本站原创文章，转载时请以链接形式注明文章出处。

上一篇怎样降低延迟？

下一篇性能瓶颈怎么找？

抱歉，评论功能暂时关闭!