系统吞吐量
吞吐量指单位时间内系统处理的请求数量,体现系统的整体处理能力。对于网站,可以用"请求数/秒"或是"页面数/秒"来衡量,也可以用"访问人数/天"或是"处理的业务数/小时"等来衡量。
TPS(每秒事务数)是吞吐量的一个常用量化指标,此外还有HPS(每秒HTTP请求数)、QPS(每秒查询数)等。
系统吞吐量几个重要参数:QPS(TPS)、并发数、响应时间
QPS(TPS):每秒钟request/事务 数量
并发数: 系统同时处理的request/事务数
响应时间: 一般取平均响应时间
在系统并发数由小逐渐增大的过程中(这个过程也伴随着服务器系统资源消耗逐渐增大),系统吞吐量先是逐渐增加,达到一个极限后,随着并发数的增加反而下降,达到系统崩溃点后,系统资源耗尽,吞吐量为零。
(1)并发数
指系统能够同时处理请求的数目,这个数字也反映了系统的负载特性。
对于网站而言,并发数即网站并发用户数,指同时提交请求的用户数目。
(2)QPS和TPS
TPS(transaction per second),每秒钟系统能够处理的交易或者事务的数量,它是衡量系统处理能力的重要指标。
QPS(TPS)= 并发数/平均响应时间,或者,
并发数 = QPS*平均响应时间
一个系统吞吐量通常由QPS(TPS)、并发数两个因素决定,
每套系统这两个值都有一个相对极限值,在应用场景访问压力下,只要某一项达到系统最高值,系统的吞吐量就上不去了,
如果压力继续增大,系统的吞吐量反而会下降,原因是系统超负荷工作,上下文切换、内存等等其它消耗导致系统性能下降。
(3)用户平均请求等待时间
请求响应时间指的是从客户端发起的一个请求开始,到客户端接收到从服务器端返回的响应结束,这个过程所耗费的时间,
在某些工具中,响应通常会称为“TTLB”,即"time to last byte",意思是从发起一个请求开始,到客户端接收到最后一个字节的响应所耗费的时间,响应时间的单位一般为“秒”或者“毫秒”。
一个公式可以表示:响应时间=网络响应时间+应用程序响应时间。