1 模拟单机连接瓶颈
我们知道,通常启动一个服务端会绑定一个端口,例如8000端口,当然客户端连接端口是有限制的,除去最大端口65535和默认的1024端口及以下的端口,就只剩下1 024~65 535个,再扣除一些常用端口,实际可用端口只有6万个左右。那么,我们如何实现单机百万连接呢? 假设在服务端启动[8 000,8 100)这100个端口,100×6万就可以实现600万左右的连接,这是TCP的一个基础知识,虽然对于客户端来说是同一个端口号,但是对于服务端来说是不同的端口号,由于TCP是一个私源组概念,也就是说它是由源IP地址、源端口号、目的IP地址和目的端口号确定的,当源IP地址和源端口号是一样的,但是目的端口号不一样,那么最终系统底层会把它当作两条TCP连接来处理,所以这里取巧给服务端开启了100个端口号,这就是单机百万连接的准备工作,如下图所示。
单机1024及以下的端口只能给ROOT保留使用,客户端端口范围为1 02565 535,接下来用代码实现单机百万连接的模拟场景。先看服务端类,循环开启[8 0008 100)这100个监听端口,等待客户端连接。下面已Netty为例编写代码如下。
package com.;
import io.ne;
import io.ne;
import io.neListener;
import io.ne;
import io.ne;
import io.ne;
import io.ne;
/**
* @author Tom
*/
public final class Server {
public static final int BEGIN_PORT = 8000;
public static final int N_PORT = 8100;
public static void main(String[] args) {
new Server().star, Server.N_PORT);
}
public void start(int beginPort, int nPort) {
Sy("服务端启动中...");
EventLoopGroup bossGroup = new NioEventLoopGroup();
EventLoopGroup workerGroup = new NioEventLoopGroup();
ServerBootstrap bootstrap = new ServerBootstrap();
boo(bossGroup, workerGroup);
boo);
boo, true);
boo(new ConnectionCountHandler());
for (int i = 0; i <= (nPort - beginPort); i++) {
final int port = beginPort + i;
boo(port).addListener(new ChannelFutureListener() {
public void operationComplete(ChannelFuture channelFuture) throws Exception {
Sy("成功绑定监听端口: " + port);
}
});
}
Sy("服务端已启动!");
}
}
然后看ConnectionCountHandler类的实现逻辑,主要用来统计单位时间内的请求数,每接入一个连接则自增一个数字,每2s统计一次,代码如下。
package com.;
import io.ne;
import io.neContext;
import io.ne;
import java.u;
import java.u;
import java.u;
/**
* Created by Tom.
*/
@C
public class ConnectionCountHandler extends ChannelInboundHandlerAdapter {
private AtomicInteger nConnection = new AtomicInteger();
public ConnectionCountHandler() {
Execu().scheduleAtFixedRate(new Runnable() {
public void run() {
Sy("当前客户端连接数: " + nConnec());
}
},0, 2, TimeUnit.SECONDS);
}
@Override
public void channelActive(ChannelHandlerContext ctx) {
nConnec();
}
@Override
public void channelInactive(ChannelHandlerContext ctx) {
nConnec();
}
}
再看客户端类代码,主要功能是循环依次往服务端开启的100个端口发起请求,直到服务端无响应、线程挂起为止,代码如下。
package com.;
import io.ne;
import io.ne.*;
import io.ne;
import io.ne.socket.SocketChannel;
import io.ne.socket.nio.NioSocketChannel;
/**
* Created by Tom.
*/
public class Client {
private static final String SERVER_HOST = "127.0.0.1";
public static void main(String[] args) {
new Client().star, Server.N_PORT);
}
public void start(final int beginPort, int nPort) {
Sy("客户端已启动...");
EventLoopGroup eventLoopGroup = new NioEventLoopGroup();
final Bootstrap bootstrap = new Bootstrap();
boo(eventLoopGroup);
boo);
boo, true);
boo(new ChannelInitializer<SocketChannel>() {
@Override
protected void initChannel(SocketChannel ch) {
}
});
int index = 0;
int port;
while (!T()) {
port = beginPort + index;
try {
ChannelFuture channelFuture = boo(SERVER_HOST, port);
c(new ChannelFutureListener() {
public void operationComplete(ChannelFuture future) throws Exception {
if (!()) {
Sy("连接失败,程序关闭!");
Sy(0);
}
}
});
c();
} catch (Exception e) {
}
if (port == nPort) { index = 0; }else { index ++; }
}
}
}
最后,将服务端程序打包发布到Linux服务器上,同样将客户端程序打包发布到另一台Linux服务器上。接下来分别启动服务端和客户端程序。运行一段时间之后,会发现服务端监听的连接数定格在一个值不再变化,如下所示。
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
当前客户端连接数: 870
...
并且抛出如下异常。
Exception in thread "nioEventLoopGroup-2-1" java.lang.InternalError: java.io.FileNotFoundException: /usr/java (Too many open files)
at $JarLoader.getResource(URLClassPath.java:1040)
at .getResource(URLClassPath.java:239)
at java.net.URLClassLoader$1.run(URLClassLoader.java:365)
at java.net.URLClassLoader$1.run(URLClassLoader.java:362)
at java.(Native Method)
at java.net.URLCla(URLClassLoader.java:361)
at java.lang.Cla(ClassLoader.java:424)
at java.lang.Cla(ClassLoader.java:411)
at $AppCla(Launcher.java:331)
at java.lang.Cla(ClassLoader.java:357)
at java.u$RBCla(ResourceBundle.java:503)
at java.u$Con(ResourceBundle.java:2640)
at java.u.loadBundle(ResourceBundle.java:1501)
at java.u.findBundle(ResourceBundle.java:1465)
at java.u.findBundle(ResourceBundle.java:1419)
at java.u.getBundleImpl(ResourceBundle.java:1361)
at java.u.getBundle(ResourceBundle.java:845)
at java.u(Level.java:265)
at java.u(Level.java:324)
at java.u(SimpleFormatter.java:165)
at java.u(StreamHandler.java:211)
at java.u(ConsoleHandler.java:116)
at java.u(Logger.java:738)
at io.ne(JdkLogger.java:606)
at io.ne(JdkLogger.java:482)
at io.ne$5.run (SingleThreadEventExecutor.java:876)
at io.ne$De (DefaultThreadFactory.java:144)
at java.lang.T(Thread.java:745)
这个时候,我们就应该要知道,这已经是服务器所能接受客户端连接数量的瓶颈值,也就是服务端最大支持870个连接。接下来要做的事情是想办法突破这个瓶颈,让单台服务器也能支持100万连接,这是一件多么激动人心的事情。
2 单机百万连接调优解决思路
2.1 突破局部文件句柄限制
首先在服务端输入命令,看一下单个进程所能支持的最大句柄数。
ulimit -n
输入命令后,会出现1 024的数字,表示Linux系统中一个进程能够打开的最大文件数,由于开启一个TCP连接就会在Linux系统中对应创建一个文件,所以就是受这个文件的最大文件数限制。那为什么前面演示的服务端连接数最终定格在870,比1 024小呢?其实是因为除了连接数,还有JVM打开的文件Class类也算作进程内打开的文件,所以,1 024减去JVM打开的文件数剩下的就是TCP所能支持的连接数。 接下来想办法突破这个限制,首先在服务器命令行输入以下命令,打开/etc/security文件。
sudo vi /etc/security
然后在这个文件末尾加上下面两行代码。
* hard nofile 1000000
* soft nofile 1000000
前面的*表示当前用户,hard和soft分别表示限制和警告限制,nofile表示最大的文件数标识,后面的数字1 000 000表示任何用户都能打开100万个文件,这也是操作系统所能支持的最大值,如下图所示。
接下来,输入以下命令。
ulimit -n
这时候,我们发现还是1 024,没变,重启服务器。将服务端程序和客户端程序分别重新运行,这时候只需静静地观察连接数的变化,最终连接数停留在137 920,同时抛出了异常,如下所示。
当前客户端连接数: 137920
当前客户端连接数: 137920
当前客户端连接数: 137920
当前客户端连接数: 137920
当前客户端连接数: 137920
Exception in thread "nioEventLoopGroup-2-1" java.lang.InternalError: java.io.FileNotFoundException: /usr/java (Too many open files)
...
这又是为什么呢?肯定还有地方限制了连接数,想要突破这个限制,就需要突破全局文件句柄数的限制。
2.2 突破全局文件句柄限制
首先在Linux命令行输入以下命令,可以查看Linux系统所有用户进程所能打开的文件数。
cat /proc/sys/fs/file-max
通过上面这个命令可以看到全局的限制,发现得到的结果是10 000。可想而知,局部文件句柄数不能大于全局的文件句柄数。所以,必须将全局的文件句柄数限制调大,突破这个限制。首先切换为ROOT用户,不然没有权限。
sudo -s
echo 2000> /proc/sys/fs/file-max
exit
我们改成20 000来测试一下,继续试验。分别启动服务端程序和客户端程序,发现连接数已经超出了20 000的限制。 前面使用echo来配置/proc/sys/fs/file-max的话,重启服务器就会失效,还会变回原来的10 000,因此,直接用vi命令修改,输入以下命令行。
sodu vi /etc
在/etc文件末尾加上下面的内容。
结果如下图所示。
接下来重启 Linux服务器,再启动服务端程序和客户端程序。
当前客户端连接数: 9812451
当前客户端连接数: 9812462
当前客户端连接数: 9812489
当前客户端连接数: 9812501
当前客户端连接数: 9812503
...
最终连接数定格在 98万左右。我们发现主要受限于本机本身的性能。用htop命令查看一下,发现CPU都接近100%,如下图所示。
以上是操作系统层面的调优和性能提升,下面主要介绍基于Netty应用层面的调优。
3 Netty应用级别的性能调优
3.1 Netty应用级别的性能瓶颈复现
首先来看一下应用场景,下面是一段标准的服务端应用程序代码。
package com.;
import io.ne;
import io.ne.*;
import io.ne;
import io.ne.socket.SocketChannel;
import io.ne;
import io.ne;
/**
* Created by Tom.
*/
public class Server {
private static final int port = 8000;
public static void main(String[] args) {
EventLoopGroup bossGroup = new NioEventLoopGroup();
EventLoopGroup workerGroup = new NioEventLoopGroup();
final EventLoopGroup businessGroup = new NioEventLoopGroup(1000);
ServerBootstrap bootstrap = new ServerBootstrap();
boo(bossGroup, workerGroup)
.channel)
.childOption, true);
boo(new ChannelInitializer<SocketChannel>() {
@Override
protected void initChannel(SocketChannel ch) {
//自定义长度的解码,每次发送一个long类型的长度数据
//每次传递一个系统的时间戳
ch.pipeline().addLast(new FixedLengthFrameDecoder));
ch.pipeline().addLast(businessGroup, ServerHandler.INSTANCE);
}
});
ChannelFuture channelFuture = boo(port).addListener(new ChannelFutureListener() {
public void operationComplete(ChannelFuture channelFuture) throws Exception {
Sy("服务端启动成功,绑定端口为: " + port);
}
});
}
}
我们重点关注服务端的逻辑处理ServerHandler类。
package com.;
import io.ne;
import io.ne;
import io.ne;
import io.neContext;
import io.ne.SimpleChannelInboundHandler;
import java.u;
/**
* Created by Tom.
*/
@C
public class ServerHandler extends SimpleChannelInboundHandler<ByteBuf> {
public static final ChannelHandler INSTANCE = new ServerHandler();
//channelread0是主线程
@Override
protected void channelRead0(ChannelHandlerContext ctx, ByteBuf msg) {
ByteBuf data = Un();
//从客户端读一个时间戳
da(msg);
//模拟一次业务处理,有可能是数据库操作,也有可能是逻辑处理
Object result = getResult(data);
//重新写回给客户端
c().writeAndFlush(result);
}
//模拟去数据库获取一个结果
protected Object getResult(ByteBuf data) {
int level = T().nextInt(1, 1000);
//计算出每次响应需要的时间,用来作为QPS的参考数据
//90.0% == 1ms 1000 100 > 1ms
int time;
if (level <= 900) {
time = 1;
//95.0% == 10ms 1000 50 > 10ms
} else if (level <= 950) {
time = 10;
//99.0% == 100ms 1000 10 > 100ms
} else if (level <= 990) {
time = 100;
//99.9% == 1000ms 1000 1 > 1000ms
} else {
time = 1000;
}
try {
T(time);
} catch (InterruptedException e) {
}
return data;
}
}
上面代码中有一个getResult()方法。可以把getResult()方法看作是在数据库中查询数据的一个方法,把每次查询的结果返回给客户端。实际上,为了模拟查询数据性能,getResult()传入的参数是由客户端传过来的时间戳,最终返回的还是客户端传过来的值。只不过返回之前做了一次随机的线程休眠处理,以模拟真实的业务处理性能。如下表所示是模拟场景的性能参数。
数据处理的业务接口占比 | 处理所耗的时间 |
90% | 1ms |
95% | 10ms |
99% | 100ms |
99.9% | 1000ms |
下面来看客户端,也是一段标准的代码。
package com.;
import io.ne;
import io.ne.ChannelInitializer;
import io.ne;
import io.ne;
import io.ne;
import io.ne.socket.SocketChannel;
import io.ne.socket.nio.NioSocketChannel;
import io.ne;
/**
* Created by Tom.
*/
public class Client {
private static final String SERVER_HOST = "127.0.0.1";
public static void main(String[] args) throws Exception {
new Client().start(8000);
}
public void start(int port) throws Exception {
EventLoopGroup eventLoopGroup = new NioEventLoopGroup();
final Bootstrap bootstrap = new Bootstrap();
boo(eventLoopGroup)
.channel)
.option, true)
.handler(new ChannelInitializer<SocketChannel>() {
@Override
protected void initChannel(SocketChannel ch) {
ch.pipeline().addLast(new FixedLengthFrameDecoder));
ch.pipeline().addLa);
}
});
//客户端每秒钟向服务端发起1 000次请求
for (int i = 0; i < 1000; i++) {
boo(SERVER_HOST, port).get();
}
}
}
从上面代码中看到,客户端会向服务端发起1 000次请求。重点来看客户端逻辑处理ClientHandler类。
package com.;
import io.ne;
import io.ne;
import io.neContext;
import io.ne.SimpleChannelInboundHandler;
import java.u;
import java.u;
import java.u;
/**
* Created by Tom.
*/
@C
public class ClientHandler extends SimpleChannelInboundHandler<ByteBuf> {
public static final ChannelHandler INSTANCE = new ClientHandler();
private static AtomicLong beginTime = new AtomicLong(0);
//总响应时间
private static AtomicLong totalResponseTime = new AtomicLong(0);
//总请求数
private static AtomicInteger totalRequest = new AtomicInteger(0);
public static final Thread THREAD = new Thread(){
@Override
public void run() {
try {
while (true) {
long duration = Sy() - beginTime.get();
if (duration != 0) {
Sy("QPS: " + 1000 * () / duration + ", " + "平均响应时间: " + ((float) ()) / () + "ms.");
T(2000);
}
}
} catch (InterruptedException ignored) {
}
}
};
@Override
public void channelActive(final ChannelHandlerContext ctx) {
c().scheduleAtFixedRate(new Runnable() {
public void run() {
ByteBuf byteBuf = c().ioBuffer();
//将当前系统时间发送到服务端
by(Sy());
c().writeAndFlush(byteBuf);
}
}, 0, 1, TimeUnit.SECONDS);
}
@Override
protected void channelRead0(ChannelHandlerContext ctx, ByteBuf msg) {
//获取一个响应时间差,本次请求的响应时间
(Sy() - m());
//每次自增
();
if (0, Sy())) {
THREAD.start();
}
}
}
上面代码主要模拟了Netty真实业务环境下的处理耗时情况,QPS大概在1 000次,每2s统计一次。接下来,启动服务端和客户端查看控制台日志。首先运行服务端,看到控制台日志如下图所示。
然后运行客户端,看到控制台日志如下图所示,一段时间之后,发现QPS保持在1 000次以内,平均响应时间越来越长。
回到服务端ServerHander的getResul()方法,在getResult()方法中有线程休眠导致阻塞,不难发现,它最终会阻塞主线程,导致所有的请求挤压在一个线程中。如果把下面的代码放入线程池中,效果将完全不同。
Object result =getResult(data);
c().wrteAndFlush(result);
把这两行代码放到业务线程池里,不断在后台运行,运行完成后即时返回结果。
3.2 Netty应用级别的性能调优方案
下面来改造一下代码,在服务端的代码中新建一个ServerThreadPoolHander类。
package com.;
import io.ne;
import io.ne;
import io.ne;
import io.neContext;
import java.u;
import java.u;
/**
* Created by Tom.
*/
@C
public class ServerThreadPoolHandler extends ServerHandler {
public static final ChannelHandler INSTANCE = new ServerThreadPoolHandler();
private static ExecutorService threadPool = Execu(1000);
@Override
protected void channelRead0(final ChannelHandlerContext ctx, ByteBuf msg) {
final ByteBuf data = Un();
da(msg);
(new Runnable() {
public void run() {
Object result = getResult(data);
c().writeAndFlush(result);
}
});
}
}
然后在服务端的Handler处理注册为ServerThreadPoolHander,删除原来的ServerHandler,代码如下。
ch.pipeline().addLa);
随后,启动服务端和客户端程序,查看控制台日志,如下图所示。
最终耗时稳定在15ms左右,QPS也超过了1 000次。实际上这个结果还不是最优的状态,继续调整。将ServerThreadPoolHander的线程个数调整到20,代码如下。
public static final ChannelHandler INSTANCE = new ServerThreadPoolHandler();
private static ExecutorService threadPool = Execu(20);
然后启动程序,发现平均响应时间相差也不是太多,如下图所示。
由此得出的结论是:具体的线程数需要在真实的环境下不断地调整、测试,才能确定最合适的数值。本章旨在告诉大家优化的方法,而不是结果。
本文为“Tom弹架构”原创,转载请注明出处。技术在于分享,我分享我快乐!
如果本文对您有帮助,欢迎关注和点赞;如果您有任何建议也可留言评论或私信,您的支持是我坚持创作的动力。关注微信公众号『 Tom弹架构 』可获取更多技术干货!
1.文章《我的世界服务端怎么用,我的世界服务端怎么关闭!》援引自互联网,为网友投稿收集整理,仅供学习和研究使用,内容仅代表作者本人观点,与本网站无关,侵删请点击页脚联系方式。
2.文章《我的世界服务端怎么用,我的世界服务端怎么关闭!》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
相关推荐
- . 现代买票为什么带上携程保险
- . 潮阳怎么去广州南站
- . 湖南马拉河怎么样
- . 烧纸为什么到三岔路口
- . 百色为什么这么热
- . 神州租车怎么样
- . 芜湖方特哪个适合儿童
- . 护肤品保养液是什么类目
- . 早晚的护肤保养有哪些项目
- . 女孩护肤品怎么保养的最好