如何灵活使用OSS监控数据动态调整OSS服务参数

如题,本文的目的是为了提供一种使用OSS监控服务的数据灵活控制OSS服务形态的例子,以方便大家能够举一反三,实现更多的通用方法解决多样的需求。


        其实OSS监控服务已经提供了报警功能,能够方便用户对OSS已经提供的metric指标进行监控报警,及时发现问题并进行处理。但是这种报警也只是做到了通知用户,通过邮件、旺旺、短信的方式,然而接下来如何行动,还是要靠用户自己了。另外,监控项的监控,仅仅是当前的监控情况,还没有对一段时间内的数据累计(或者求峰谷值、平均值等等)情况进行监控的功能。


        虽然如此,别忘了OSS监控服务提供了数据访问的Open API,还有多种语言的SDK,方便你处理你的数据。如果能够用好这些监控数据,联结各种产品的提供的接口,可以解决很多特制的需求。


        这里我举个使用的场景吧。之前在论坛上看到过用户吐槽OSS没有流量监控功能,后来监控服务上线之后,又有位童鞋给我留言说还是不能满足他的需求,因为他希望OSS在流量使用的“累计总值”超过他设置的阈值之后,能够自动限制对他的Bucket资源的请求情况。

下面呢,我就结合OSS监控服务的SDK和OSS的SDK,给大家演示一下,满足一下这位童鞋的需求哈。


需求分析:

在bucket的权限为public read的情况下,用户的bucket可以接受任何合法的读请求访问,获取数据,从而产品流出流量。而公网流出流量我们是会收取流量资费的。
如果用户希望控制每日的费用支出,那么可以在每天流量消耗到一定的程度,就收回bucket的public read权限,改为private。那么在流量超限之后,所有的请求将会受到“AccessDeny”错误码。
这样,你的目的就到达了,是吧。

代码示例:

这里简单写个代码示例演示一下,如何满足以上需求功能:
代码功能:
        从进程启动开始监控流量使用总量,每10分钟获取一次流量监控数据(每分钟一个值),如果总量超过设置的阈值,那么设置bucket的acl为private,退出进程。

#!/bin/env python
#-*- coding:utf-8 -*-

from aliyunsdkcore import client
from aliyunsdkcms.request.v20151020 import QueryMetricRequest

import oss2
import time
import json

# 请填好您的配置
access_id = 'your access id'
access_key = 'your access key'
bucket_name = 'your bucket'
endpoint = 'your endpoint'

# util func
def date_2_sec(s, format = '%Y-%m-%d %H:%M:%S'):
    tp = time.strptime(s, format)
    return int(time.mktime(tp))

def sec_2_date(sec, format = '%Y-%m-%d %H:%M:%S'):
    tp = time.localtime(sec)
    return time.strftime(format, tp)


def get_throughput_metric_from_cms(start_time, end_time):
    '''
    从OSS监控服务中获取公网流出流量在一点时间范围内的指标
    :param start_time: 监控数据的起始时间,格式"2016-07-23 22:59:00"
    :param end_time: 监控数据的结束时间,格式"2016-07-23 23:09:00"
    :return
    '''
    project = 'acs_oss'
    metric = 'InternetSend'
    dimensions = '{"BucketName":"%s"}' % bucket_name
    clt = client.AcsClient(access_id, access_key,'cn-hangzhou')
    request = QueryMetricRequest.QueryMetricRequest()
    request.set_accept_format('json')
    request.set_Project(project)
    request.set_Metric(metric)
    request.set_StartTime(start_time)
    request.set_EndTime(end_time)
    request.set_Dimensions(dimensions)
    request.set_Period('60')
    result = clt.do_action(request)
    result = json.loads(result)
    data_list = []
    for data in result['Datapoints']['Datapoint']:
        data_list.append(data[metric])
    print '[%s - %s]: %s' % (start_time, end_time, data_list)
    return data_list

def set_bucket_acl():
    auth = oss2.Auth(access_id, access_key)
    bucket = oss2.Bucket(auth, endpoint, bucket_name)
    bucket.put_bucket_acl(oss2.BUCKET_ACL_PRIVATE)
    print 'set bucket %s to %s' % (bucket_name, oss2.BUCKET_ACL_PRIVATE)

def limit_throughput_task(period, threshold):
    total_throughput = 0
    start_time = sec_2_date(int(time.time()))
    while True:
        time.sleep(period)
        end_time = sec_2_date(int(time.time()))
        data_list =  get_throughput_metric_from_cms(start_time, end_time)
        total_throughput += sum(data_list)
        print 'now total_throughput is %d' % total_throughput
        if total_throughput >= threshold:
            set_bucket_acl()
            break

        start_time = end_time

if __name__ == '__main__':
    # 每10分钟获取一次metric, 阈值设置为4000Byte
    limit_throughput_task(600, 4000)
    print 'task finished'

      监控指标除了公网流出流量之外,当然还有容量、可用性、请求个数等等;操作方式除了控制OSS bucket权限之外,还可以触发删除指定object、订阅MNS、导出监控数据到实时分析/离线分析系统等等。
各种组合形式,各种需求功能,就看你自己怎么用啦。

云监控SDK安装和使用参见[云监控SDK]。
OSS SDK安装和使用参见[OSS SDK]。

插播广告哈:

       存储服务是阿里云最核心的服务,我们不但支持文件/对象/表格/日志等多种形式的存储,也正在研发下一代事件驱动的serverless计算服务在这里,你的代码可能运行在几十万台服务器上,不但处理整个阿里巴巴集团最核心的数据,也会成为整个阿里云平台上万千企业云上数据的坚实基础,甚至开启下一代计算的新篇章。
        所以,我们诚聘您的加入,简历投至shuting.yst@alibaba-inc.com,在校优秀人才、社会牛人看过来哦~~    
上一篇:微软TMG 2010工作组环境独立服务器阵列配置-1


下一篇:将数据从服务器端同步到手机上, 并且需要离线工作,Couchebase Mobile 也许是目前最好的解决方案: