进阶-第50__深入聚合数据分析_percentiles rank以及网站访问时延SLA统计

2023-12-27 12:54:15

SLA定义

Sla:就是你提供的服务的标准

我们的网站的提供的访问延时的SLA，确保所有的请求100%，都必须在200ms以内，大公司内，一般都是要求100%在200ms以内

如果超过1s，则需要升级到A级故障，代表网站的访问性能和用户体验急剧下降

需求

需求：在200ms以内的，有百分之多少，在1000毫秒以内的有百分之多少，percentile ranks metric

这个percentile ranks，其实比pencentile还要常用

按照品牌分组，计算，电视机，售价在1000占比，2000占比，3000占比

搜索测试

GET /website/logs/_search

{

"size": 0,

"aggs": {

"group_by_province": {

"terms": {

"field": "province"

"aggs": {

"latency_percentile_ranks": {

"percentile_ranks": {

"field": "latency",

"values": [

200,

1000

]

}

结果

{

"took": 28,

"timed_out": false,

"_shards": {

"total": 5,

"successful": 5,

"failed": 0

"hits": {

"total": 12,

"max_score": 0,

"hits": []

"aggregations": {

"group_by_province": {

"doc_count_error_upper_bound": 0,

"sum_other_doc_count": 0,

"buckets": [

{

"key": "*",

"doc_count": 6,

"latency_percentile_rank": {

"values": {

"200.0": 29.40613026819923,

"1000.0": 100

}

{

"key": "江苏",

"doc_count": 6,

"latency_percentile_rank": {

"values": {

"200.0": 100,

"1000.0": 100

}

]

}

说明：*200ms以内的占有：29.40613026819923%，1000以内的100%；

percentile的优化

TDigest算法，用很多节点来执行百分比的计算，近似估计，有误差，节点越多，越精准

compression

限制节点数量最多 compression * 20 = 2000个node去计算

默认100

越大，占用内存越多，越精准，性能越差

一个节点占用32字节，100 * 20 * 32 = 64KB

如果你想要percentile算法越精准，compression可以设置的越大

码农公寓

SLA定义

需求

搜索测试

结果

percentile的优化

相关文章