作者:秋光
来源:洛神云网络技术公众号
云计算通过互联网提供服务的模型
云计算的IDC机房连接到运营商的骨干网上对运营商内的用户提供服务。用户通过移动终端或固定终端接入运营商的本地网络,并通过运营商的骨干网络访问阿里云上的各种服务,包括大家熟知的淘宝,天猫,高德,钉钉等。
从上图可以看到,用户访问云上服务涉及的环节还是比较多的,包括用户的本地网络,运营商网络和阿里云网络。
本地网络的情况一般是比较复杂的,尤其是移动网络,用户的本地网络的场景可能是弱网环境,比如说地铁,公交,高铁等。也可能是比较好的网络,比如说家庭或办公室。
运营商网络和云网络是比较稳定和确定的。
理论上来讲,任何一个网络环节出问题,都会影响用户的使用体验。
云公网质量评测的两种方式
应用层云公网质量评测
如果是评测一个应用的端到端的公网质量,最好是能够对用户终端到云上应用做全流程的测试。
如图所示,这样能全流程覆盖用户本地网络,运营商网络和阿里云网络。但这种评测方法复杂度和成本比较高,需要有大量的真实的客户端进行测试才比较有效和可信,因为只有至少上千规模的客户端才能排除本地网络和用户终端自身的变化的影响。
网络层云公网质量评测
如果是评测网络层的云计算公网质量,一般情况下测试运营商骨干网络或本地网络到阿里云应用的公网质量。
从运营商本地网络和骨干网络到云网络部分的公网质量是云厂商重点关注和重点优化的环节,只要这部分的质量好,服务和应用的端到端的公网质量就不会很差,如果这部分的质量不好,那么服务和应用的端到端的体验就很难做好。此外对于用户本地网络和用户终端上的问题云厂商可以调优工作也很有限。这种网络层的公网质量是一个基础和准入的评测,另外这种测试方式相对简单高效,所以在客户上云选型时被普遍采用。
总结:两种评测方式的对比
测评方式 | 优点 | 缺点 |
---|---|---|
应用层云公网质量评测 | 更贴近真实的端到端用户公网质量 | 测试成本较高且有一定复杂度,适合已经具备一定用户规模的企业客户 |
网络层云公网质量评测 | 测试成本低,测试方法简单适合作为云厂商的横向对比测试 | 不完全反应最终的端到端的公网质量更适合做准入门槛测试 |
网络层云公网质量评测的最佳实践
最佳实践原则
- 选取TOP运营商探测点进行测试
因为TOP运营商中的用户多,所以应优先关注TOP运营商的质量情况。比如对于国内的运营商,优先选取不同省份的电信,移动,联通的公网IP探测点进行测试,如果有余力再选择其他运营商的公网IP进行探测。尽量不选择云厂商的BGP类型的服务器做探测点,因为不同的云厂商之间有可能通过IXP直接互联,流量路径和运营商到云厂商的不一样。
- 测试时长大于1天
互联网的也存在波峰波谷,闲时忙时的效应。所以测试时长要至少一天得到的数据才比较可信。
- 选择成熟的拨测平台进行测试
当前公网质量的拨测平台比较多,但也存在鱼龙混杂的问题。最好选择业界中口碑比较好的平台进行测试。
国内成熟的公网质量拨测平台包括:阿里云站点监控,听云,博睿等
海外成熟的公网质量拨测平台包括:CatchPoint
拨测平台 | 客户群 | 特点 | 网站链接 |
---|---|---|---|
阿里云站点监控 | 个人&企业 | 优势:国内各省份运营商公网IP探测点很全面,海外探测点较缺乏。劣势:报表和结果分析易用性较差 | https://cloudmonitor.console.aliyun.com/#/newSite/list/ |
听云 | 企业 | 优势:国内探测点和海外运营商探测点都有,报表和结果分析易用性好。劣势: 面向企业用户,首次服务开通流程较慢 | https://saas.tingyun.com/ |
博睿 | 企业 | 优势:国内探测点和海外运营商探测点都有,报表和结果分析易用性好。劣势: 面向企业用户,首次服务开通流程较慢 | https://www.bonree.com/ |
CatchPoint | 企业 | 优势:海外运营商探测点较多。劣势:国内运营商探测点较少。面向企业用户,首次服务开通流程较慢 | https://www.catchpoint.com/ |
国内网络层基础公网质量评测最佳实践
- 拨测平台选择
阿里云站点监控开通和使用比较简单,直接注册阿里云账号就可以使用。
- 公网探测任务类型选择
最简单的就是ICMP的ping探测,云服务器上不需要部署任何应用,只需要放通ICMP的安全组即可。
- 公网探测点选择
根据业务的需求选择具体省份和地域的运营商。一般情况下优选一线和二线城市的电信,联通,移动的探测点,因为用户相对密集。
- 结果分析
- 公网质量拨测平台对于公网质量主要提供两个指标,一个是时延,一个是丢包率。带宽这个指标一般情况都不是太大的问题,因为云上的公网带宽一般情况下都比较充足。
- 不同应用所侧重的公网质量不同,但大的原则是时延在一定范围内满足业务需求即可,重点看丢包率。
- 不同应用对时延的需求,请参考文章:https://mp.weixin.qq.com/s/jHv__zvDMS41BHzVh1YgsQ
海外网络层公网质量评测最佳实践
海外的公网质量评测相对比较复杂,国内的TOP运营商就3家,海外有很多家。我们重点关注3G/4G/5G移动运营商到云的公网质量,主要是因为其覆盖的用户数多。以亚太为例,我们整理了对应的TOP运营商列表,以及对应的3G/4G移动互联网用户数。其中用户数的数据来源于互联网大体上正确但不够精确。
亚太区域TOP运营商和运营商内部互联网用户数
欧美区域TOP运营商和运营商内部互联网用户数
当前的公网质量拨测平台中没有一个能完全覆盖上述TOP运营商的,所以海外的公网质量拨测是一个比较大的难点。
阿里云采用另外一种方式进行公网质量的拨测,通过在云上的服务器主动探测具体运营商网的公网质量,收集探测数据并分析和汇总公网质量数据。后续我们将对外逐步开放对应的统计数据供有需求的客户进行参考。