当前位置：首页 > news >正文

10｜Netty native epoll 与零拷贝：从 Java NIO 再往下看一层![

news 2026/6/8 1:13:31

10｜Netty native epoll 与零拷贝：从 Java NIO 再往下看一层

前面我们一直用NioEventLoopGroup、NioSocketChannel来讲 Netty。

这是 Netty 最常见、最跨平台的使用方式：

EventLoopGroupbossGroup=newNioEventLoopGroup(1);EventLoopGroupworkerGroup=newNioEventLoopGroup();newServerBootstrap().group(bossGroup,workerGroup).channel(NioServerSocketChannel.class).childHandler(...);

这里的Nio指的是：

Java NIO

底层依赖的是：

Selector
ServerSocketChannel
SocketChannel

但如果你看一些高性能服务，尤其是 Linux 生产环境，会看到另一类配置：

EventLoopGroupbossGroup=newEpollEventLoopGroup(1);EventLoopGroupworkerGroup=newEpollEventLoopGroup();newServerBootstrap().group(bossGroup,workerGroup).channel(EpollServerSocketChannel.class).childHandler(...);

这就是 Netty 的 native epoll transport。

这一篇回答几个问题：

Netty 已经有 Java NIO，为什么还要 native epoll？
NioEventLoopGroup 和 EpollEventLoopGroup 有什么区别？
native epoll 一定比 Java NIO 快吗？
Netty 里的零拷贝体现在哪里？
FileRegion 和 sendfile 是什么关系？

如果把它放到真实业务系统里，epoll 和零拷贝不是两个孤立的底层名词，而是两类很具体的工程压力：大量连接怎么等，海量数据怎么搬。

比如云边系统里，边缘侧可能要上传日志、图片、视频片段或业务结果到对象存储；云端网关要转发 Web、App、开放 API 或内部服务请求；媒体链路要处理 RTSP、RTMP、WebRTC、HLS、GB28181 等不同协议下的持续数据流。这里的压力不只是“业务逻辑复杂”，而是连接多、数据大、传输持续、慢客户端多、网络质量不稳定。

这时候就会自然追到几个问题：

一个线程能不能管理很多连接？
等待网络事件时，线程到底在做什么？
文件从磁盘发到网络，是否一定要先完整读进 JVM？
大文件、媒体流、普通接口请求能不能混在同一条资源通道里？
底层优化能解决多少问题，哪些问题仍然是架构设计问题？

这就是这篇文章的业务入口：epoll 优化的是“等事件”，零拷贝优化的是“搬数据”，但系统是否稳定，还取决于我们如何划分链路、隔离资源和控制背压。

先给结论：

Java NIO 是跨平台的非阻塞 IO 抽象；
Netty native epoll 是 Linux 下更贴近操作系统能力的实现；
FileRegion / transferTo 则用于 file -> socket 场景，减少数据拷贝。

一、Java NIO 和 Linux epoll 的关系

Java NIO 提供了一组跨平台 API：

Selector
SelectableChannel
SelectionKey
SocketChannel
ServerSocketChannel

应用层写的是：

selector.select();

但在 Linux 上，JDK 的 Selector 底层通常会使用操作系统提供的 IO 多路复用能力。

可能是：

epoll

也就是说：

Java NIO Selector 是 Java 层抽象；
Linux epoll 是操作系统底层机制。

Netty 的NioEventLoop是基于 Java NIO Selector 来实现事件循环。

主线类似：

这种方式的优势是：

跨平台
JDK 标准 API
使用简单
兼容性好

但它也有一层 Java NIO 抽象。

Netty native epoll 则是绕过 JDK NIO 的部分抽象，直接使用 Linux epoll 相关 native 能力。

二、Netty native transport 是什么？

Netty 提供了多种 transport。

常见包括：

NIO transport
Epoll transport
KQueue transport
IOUring transport

大致对应：

NIO：
Java 标准 NIO，跨平台。
Epoll：
Linux native epoll。
KQueue：
macOS / BSD native kqueue。
IOUring：
Linux io_uring，更新的异步 IO 能力。

本文重点看 epoll。

如果使用 native epoll，代码会从：

NioEventLoopGroupNioServerSocketChannelNioSocketChannel

变成：

EpollEventLoopGroupEpollServerSocketChannelEpollSocketChannel

它们的上层模型仍然是 Netty 的：

EventLoop
Channel
Pipeline
ByteBuf

也就是说：

换 transport，不等于换编程模型。

你写 Handler、Pipeline、ByteBuf 的方式基本不变。

变化发生在底层 IO 实现。

三、为什么要用 native epoll？

native epoll 的价值不是“让业务代码自动飞起来”。

它主要带来几个方面的优势。

第一，更贴近 Linux 网络栈。

Netty native epoll 可以暴露更多 Linux 特有能力。

例如：

TCP_CORK
SO_REUSEPORT
EPOLLET 边缘触发
更细的 socket option

这些能力在 Java 标准 NIO 抽象里不一定完整暴露。

第二，减少 JDK Selector 层的一些限制和历史问题。

Java NIO Selector 是跨平台抽象，兼容性很好，但也会带来一些额外层次。

native transport 可以针对 Linux 做更专门的优化。

第三，在某些高连接、高吞吐场景下，性能可能更好。

但这里要谨慎：

native epoll 不保证所有场景都比 NIO 快。

如果系统瓶颈在：

业务逻辑
数据库
下游服务
序列化
TLS
带宽
磁盘

换 epoll transport 不一定有明显收益。

它更适合底层网络开销已经变成重要因素的场景。

四、NioEventLoop 和 EpollEventLoop 的相同点

不管是 NIO 还是 epoll，Netty 的上层模型基本一致。

都是：

核心原则也一样：

一个 Channel 通常绑定一个 EventLoop。
不要阻塞 EventLoop。
writeAndFlush 走出站 Pipeline。
写不完的数据进入 ChannelOutboundBuffer。
ByteBuf 需要正确释放。

所以如果你已经理解了：

NioEventLoop
ChannelPipeline
ByteBuf
ChannelOutboundBuffer

再看 epoll transport，不需要重学 Netty。

只是把底层等待事件的机制换成了更贴近 Linux 的实现。

五、NioEventLoop 和 EpollEventLoop 的不同点

不同点主要在底层 IO。

NioEventLoop依赖：

java.nio.channels.Selector

而EpollEventLoop依赖 Netty native 提供的 epoll 封装。

可以粗略理解为：

NioEventLoop：
通过 JDK Selector 等待事件。
EpollEventLoop：
通过 native epoll 等待事件。

对应的 Channel 也不同。

NIO：

NioServerSocketChannel
NioSocketChannel

Epoll：

EpollServerSocketChannel
EpollSocketChannel

但这些 Channel 仍然会接入同样的 Pipeline 机制。

所以业务 Handler 感知不到太多差异。

六、epoll edge-triggered 和 level-triggered

Linux epoll 有两种常见触发模式：

水平触发 level-triggered
边缘触发 edge-triggered

水平触发可以理解为：

只要 fd 还有数据可读，epoll 就会持续通知。

边缘触发可以理解为：

只有状态发生变化时通知一次。

边缘触发通常要求：

使用非阻塞 fd
一次事件里尽量把数据读到 EAGAIN

否则可能漏读。

Netty native epoll 可以使用更贴近 Linux epoll 的能力。

但普通使用者通常不需要直接操作这些细节。

Netty 会把底层复杂性封装在 Channel 和 EventLoop 中。

你需要记住的是：

无论底层 NIO 还是 epoll，Channel 上的读写都不能阻塞。

七、SO_REUSEPORT 有什么用？

Linux 下SO_REUSEPORT允许多个 socket 绑定同一个 IP 和端口。

这对多进程或多 EventLoop 接收连接可能有帮助。

它可以让内核在多个监听 socket 之间分配新连接。

Nginx 也有类似能力：

reuseport

在 Netty native epoll 中，也可以使用相关选项。

它解决的问题是：

多监听者之间如何更好地分摊 accept 压力。

但它不是所有服务都必须开启。

是否使用要结合：

连接数
CPU 核数
负载模型
内核版本
压测结果

八、Netty 零拷贝的几个层次

Netty 里谈零拷贝，要分层。

第一层：CompositeByteBuf。

多个 ByteBuf 组合成一个逻辑 ByteBuf，
避免拼接时复制数据。

第二层：slice / duplicate。

创建 ByteBuf 视图，
共享底层内存，
避免复制数据。

第三层：FileRegion。

文件区域直接写到 Channel，
底层可能使用 FileChannel.transferTo。

第四层：操作系统 sendfile。

file -> socket，
尽量减少用户态和内核态之间的数据拷贝。

这些都可以叫“零拷贝思想”，但层次不同。

所以不能笼统说：

Netty 零拷贝 = sendfile。

更准确是：

Netty 在应用层 buffer 组合、内存视图、文件传输等多个层次减少数据复制。

九、FileRegion 是什么？

Netty 中和系统级零拷贝最相关的是：

FileRegion

常见实现：

DefaultFileRegion

它表示文件中的一段区域。

典型使用场景：

把本地文件发送到网络连接。

示意代码：

FileChannelfileChannel=FileChannel.open(path,StandardOpenOption.READ);DefaultFileRegionregion=newDefaultFileRegion(fileChannel,0,fileChannel.size());ctx.writeAndFlush(region);

底层写出时，Netty 可以走：

FileChannel.transferTo(…)

在 Linux 上条件合适时，可能进一步走：

sendfile

这和我们前面零拷贝文章里的路径一致：

用户态只发指令，不搬大块数据。

十、FileRegion 的边界

FileRegion 适合：

本地文件原样发送到 socket。

例如：

静态文件服务器
大文件下载
视频文件分发
日志文件传输

但它不适合所有场景。

如果数据需要：

压缩
加密
内容改写
动态生成
协议重组
业务解析

就很难保持严格 file -> socket 零拷贝。

尤其是 TLS 场景。

如果 TLS 加密在用户态完成，文件内容通常需要进入用户态进行加密处理。

这会破坏传统 sendfile 路径。

所以：

FileRegion 不是万能加速器。

它适合非常明确的 file -> socket 场景。

十一、DefaultFileRegion 和 ChunkedFile 怎么选？

Netty 中发送文件时，除了 FileRegion，还可能看到：

ChunkedFile
ChunkedWriteHandler

二者思路不同。

DefaultFileRegion更偏向：

零拷贝 file -> socket。

ChunkedFile更偏向：

分块读取文件，再逐块写出。

什么时候用 ChunkedFile？

常见是：

TLS 场景
需要经过用户态处理
不能使用 sendfile 的场景

所以可以简单记：

明文文件直发：
优先考虑 FileRegion。
需要 TLS 或用户态处理：
通常走 ChunkedFile / ChunkedWriteHandler。

十二、native epoll 和零拷贝是同一件事吗？

不是。

这是两个不同层面的优化。

native epoll 优化的是：

等待和事件通知。

也就是：

大量连接哪些可读、哪些可写。

零拷贝优化的是：

数据搬运。

也就是：

大块数据如何少经过用户态、少占 CPU 拷贝。

可以这样对比：

epoll：
管连接事件。
sendfile / FileRegion：
管文件数据发送。
ByteBuf slice / composite：
管应用层 buffer 复制。

它们都属于高性能 IO 的组成部分，但解决的问题不同。

十三、native epoll 是否一定要用？

不一定。

如果你的系统是普通业务服务，瓶颈在：

数据库
缓存
下游 HTTP
业务逻辑
序列化

切 native epoll 可能没有明显收益。

如果你的系统是：

网关
长连接服务
IM
游戏网关
高吞吐文件传输
大量连接的代理服务

并且运行在 Linux 上，那么 native epoll 更值得考虑。

但是否使用，最好通过压测验证。

不要把它当成：

打开就一定翻倍。

更现实的收益是：

更贴近 Linux 网络能力
更多 socket option
某些场景下更低开销
更好的高连接支持

十四、如何选择 NIO 和 epoll？

可以按这个思路判断。

优先使用 NIO 的情况：

需要跨平台
对 Linux 特有优化不敏感
业务瓶颈不在网络层
部署简单优先

考虑 epoll 的情况：

只部署 Linux
连接数很高
网络事件非常密集
需要 Linux 特有 socket option
追求更低网络层开销
已经通过压测证明网络层是瓶颈

在 Spring Cloud Gateway / Reactor Netty 场景里，也可以通过依赖和配置让底层使用 native transport。

但仍然要记住：

native transport 只是底层优化，
不会修复阻塞 Filter、慢下游、连接池耗尽、写队列堆积这些架构问题。

十五、从 Netty 再看 Nginx

学到这里，可以把 Netty 和 Nginx 再对照一下。

Nginx：

worker 进程
epoll 事件驱动
sendfile 静态文件
配置驱动
反向代理

Netty：

EventLoop 线程
NIO / epoll transport
FileRegion 文件传输
Pipeline 可编程扩展
自定义协议

两者定位不同。

Nginx 是成品服务器。

Netty 是网络编程框架。

但底层思想高度相似：

少量执行单元管理大量连接；
非阻塞 IO 等待事件；
数据能不拷贝就少拷贝；
慢连接不能阻塞主循环。

这也是为什么前面先学 epoll、零拷贝、Nginx，再学 Netty，会更容易形成整体认知。

十六、结论

Netty 的 NIO transport 和 native epoll transport，本质上都是为了实现：

少量 EventLoop 管理大量连接事件。

区别在于：

NIO：
基于 Java 标准 Selector，跨平台。
native epoll：
基于 Linux epoll native 能力，更贴近 Linux 网络栈。

Netty 的零拷贝也要分层理解：

slice / duplicate：
减少 ByteBuf 数据复制。
CompositeByteBuf：
组合多个 ByteBuf，减少拼接复制。
FileRegion：
表示文件区域，支持 file -> socket 高效传输。
sendfile：
操作系统层面减少用户态/内核态数据搬运。

所以这一篇可以用两句话收束：

native epoll 优化的是事件等待；
FileRegion / sendfile 优化的是文件数据搬运。

它们不是 Netty 的全部，但它们让 Netty 能更贴近操作系统能力，支撑更高性能的网络系统。

对我的架构判断有什么用？

这篇文章真正有价值的地方，是把“高性能”拆成两个更可判断的问题：连接事件如何被管理，数据搬运如何被减少。

对边缘侧、云端、媒体链路、大文件上传这类系统来说，不能只问“用不用 epoll”“有没有零拷贝”。更应该先判断流量类型：

场景	主要压力	更关键的判断
普通 HTTP 接口	请求响应、下游调用、连接池	是否阻塞 EventLoop，超时和限流是否清晰
MQTT 消息链路	高频小消息、持续连接、消息风暴	消费速度、反回环、队列边界、主题治理
大文件上传	磁盘/网络搬运、失败恢复	是否和普通接口隔离，是否支持分片/续传/限速
媒体流链路	持续带宽、弱网、编码兼容、慢客户端	是否区分主画面/预览流，是否能降级和限流
静态文件/下载	file -> socket 搬运	是否适合 sendfile / FileRegion，是否受 TLS 影响