【Netty源码解读和权威指南】第34篇:Netty Selector优化——为什么比JDK NIO快这么多
上一篇【第33篇】Netty连接管理与心跳检测——工业级断连处理方案
下一篇【第35篇】Netty时间轮HashedWheelTimer源码解析——百万定时任务的秘密
一、优化一:替换JDK SelectedKeySet
JDK Selector的selectedKeys()返回HashSet,遍历时需要Iterator,有大量装箱/拆箱开销。
Netty的做法:用SelectedSelectionKeySet(基于数组)替换HashSet。
// 反射替换底层SetfinalclassSelectedSelectionKeySetextendsAbstractSet<SelectionKey>{SelectionKey[]keys=newSelectionKey[1024];intsize;publicbooleanadd(SelectionKeykey){if(size==keys.length)returnfalse;keys[size++]=key;// O(1)追加,不需要hash计算returntrue;}publicvoidreset(){size=0;// O(1)清空,不需要逐个removeArrays.fill(keys,null);// 帮助GC}}// 遍历时直接for循环访问数组,比Iterator快很多for(inti=0;i<selectedKeys.size;i++){SelectionKeyk=selectedKeys.keys[i];// 处理...}性能对比:10万连接,Netty遍历selectedKeys比JDK快3-5倍。
二、优化二:解决epoll空轮询Bug
JDK在Linux下存在epoll空轮询Bug:Selector.select()没有事件却返回,导致CPU 100%。
Netty的检测与修复:
// NioEventLoop中检测空轮询if(SELECTOR_AUTO_REBUILD_THRESHOLD>0){longselectTime=System.nanoTime()-time;if(selectTime<1000000000/10){// 小于100ms就算空轮询emptyPollingCount++;if(emptyPollingCount>512){// 连续512次空轮询rebuildSelector();// 重建Selector!emptyPollingCount=0;}}else{emptyPollingCount=0;}}// rebuildSelector:创建新Selector,将旧Channel重新注册publicvoidrebuildSelector(){SelectornewSelector=SelectorProvider.provider().openSelector();for(SelectionKeykey:oldSelector.keys()){Channelch=(Channel)key.attachment();ch.register(newSelector,key.interestOps(),ch);}oldSelector.close();this.selector=newSelector;}三、优化三:批量处理任务
// runAllTasks可以一次处理多个任务,减少线程切换protectedbooleanrunAllTasks(longtimeoutNanos){fetchFromScheduledTaskQueue();Runnabletask=pollTask();if(task==null)returnfalse;longdeadline=System.nanoTime()+timeoutNanos;longrunTasks=0;for(;;){safeExecute(task);runTasks++;task=pollTask();if(task==null||System.nanoTime()>=deadline)break;}returntrue;}四、其他优化
| 优化 | 说明 | 效果 |
|---|---|---|
| 直接内存优先 | I/O使用DirectBuffer | 减少GC |
| 内存池 | PooledByteBufAllocator | 减少分配开销 |
| TCP_NODELAY | 禁用Nagle算法 | 降低延迟 |
| SO_REUSEADDR | 端口快速复用 | 避免TIME_WAIT |
五、总结
| 优化 | 技术 |
|---|---|
| SelectedKeySet替换 | 数组替代HashSet |
| epoll空轮询修复 | rebuildSelector |
| 批量任务处理 | 一次循环执行多个任务 |
| 关键原则 | 减少GC、减少锁、减少系统调用 |
上一篇【第33篇】Netty连接管理与心跳检测——工业级断连处理方案
下一篇【第35篇】Netty时间轮HashedWheelTimer源码解析——百万定时任务的秘密
