1 前言
每种测试工具都有其优点和缺点,本次测试将采用两种工具进行测试数据库部分,借助软件本身提供的方法进行测试,没有对特殊的业务进行逻辑测试。本次测试并不太关注业务表现的等待和性能问题,重点在于数据库运行在云主机所能承受的压力,以及cpu、内存、磁盘在压力期间的性能数据,业务测试返回的TPS、IOPS、RT等数据,以求对oracle运行在云主机提供参考。
2 测试工具
1、Sysbench,是一款开源的多线程性能测试工具,可以执行CPU/内存/线程/IO/数据库等方面的性能测试。数据库目前支持MySQL/Oracle/PostgreSQL。Sysbench对于绑定变量的支持存在bug,但它的脚本都是lua语言写的,完全可以自行设计和定制业务逻辑进行测试。
安装方法见《附录9.1》
2、swingbench,是Oracle UK的一个员工在一个被抛弃的项目的基础上开发的。Swingbench可 以执行4种不同的标准测试(benchmark),拥有三种前端展示方式。Swingbench的开发目的主要是用来展示RAC的负载和测试,但也可用于单实例环境。
安装方法见《附录9.2》
两种方法均在测试机上作为客户端对数据库进行压力测试。
3 测试环境
测试阿里ECS+SSD+ORACLE的运行情况。
服务器端配置
4 测试方法
Oracle redolog 建议和数据盘分开,本次测试将测试redolog和数据分开存放为主,并测试redolog和数据在同一磁盘的一组数据作为对比。因为表的数量少并发数越大,造成竞争和冲突率就大幅度上升,测试有随机性,因此数据并不能准确反映应用的具体情况,具体应用上线前建议根据业务逻辑设计LUA脚本或者Swingbench测试程序。
1、Sysbench
Sysbench数据量初始化10张表,每张表100万条数据,每次测试最大访问条目是1000万,随机进行OLTP的读写更新和删除,并发数据为50、100、200、300、400、500并发值。
2、Swingbench
Swingbench也是通过脚本建立测试数据库,相比Sysbench比较全面,从表空间、schema soe是一套订单业务逻辑,同时可以设置并发连接的登陆属性—长连接还是短连接。同样,也进行50、100、200、300、400、500并发值测试。
5 Sysbench进行OS基准测试
1、 Cpu,通过计算最大素数的方式查看cpu的计算速度
/home/oracle/sysbench-0.5/sysbench/sysbench_ora --test=cpu --cpu-max-prime=20000 run
total time: 36.4537s
2、 内存,测试内存的吞吐率
/home/oracle/sysbench-0.5/sysbench/sysbench --test=memory --num-threads=16 --memory-block-size=8192 --memory-total-size=1G run
----------------------------------------------
1024.00 MB transferred (2762.18 MB/sec)
3、 磁盘io,测试iops和吞吐率。
/u01 数据盘
/home/oracle/sysbench-0.5/sysbench/sysbench --test=fileio --num-threads=16 --init-rng=on --file-total-size=5G --file-test-mode=rndrw run
---------------------------------------------------------------------
5368709120 bytes written in 63.74 seconds (80.33 MB/sec).
Read 93.734Mb Written 62.516Mb Total transferred 156.25Mb (31.643Mb/sec)
/u02 redolog
/home/oracle/sysbench-0.5/sysbench/sysbench --test=fileio --num-threads=16 --init-rng=on --file-total-size=5G --file-test-mode=rndrw run
-------------------------------------------------------------------
5368709120 bytes written in 96.23 seconds (53.20 MB/sec).
Read 93.812Mb Written 62.438Mb Total transferred 156.25Mb (24.582Mb/sec) 1573.25 Requests/sec executed
6 测试一:Sysbench 对Oracle进行压测
6.1 准备数据
./sysbench_ora --test=/home/oracle/sysbench/tests/db/lua/oltp.lua \
--db-driver=oracle \
--oltp-table-name=sysbench \
--oltp-table-size=1000000 \ <<<每张表规格100万行
--oltp-tables-count=10 \ <<<共10张表
--oracle-db=oradb \ <<<这是TNS的配置,SLB负载的TNS是oradbslb
--oracle-user=sysbench \
--oracle-password=XXXX \
--max-time=900 \ <<<测试时长
--max-requests=10000000 \<<<最大访问1000万行
--num-threads=40 \
--report-interval=10 \
prepare
6.2 压测
--压测语法
./sysbench_ora --test=/home/oracle/sysbench/tests/db/lua/oltp.lua \
--db-driver=oracle \
--oltp-table-name=sysbench \
--oltp-table-size=1000000 \
--oltp-tables-count=10 \
--oracle-db=oradb \
--oracle-user=sysbench \
--oracle-password=XXXX \
--max-time=900 \
--max-requests=10000000 \
--num-threads=40 \
--report-interval=10 \
run
--/50并发
transactions: 204610 (227.32 per sec.)
read/write requests: 3682980 (4091.84 per sec.)
response time:
min: 24.70ms
avg: 175.88ms
max: 1070.85ms
approx. 95 percentile: 256.37ms
--/100并发
transactions: 800926 (222.47 per sec.)
read/write requests: 14416668 (4004.41 per sec.)
response time:
min: 20.03ms
avg: 359.54ms
max: 1766.33ms
approx. 95 percentile: 543.96ms
--/200并发
transactions: 115286 (192.01 per sec.)
read/write requests: 2075148 (3456.25 per sec.)
response time:
min: 84.64ms
avg: 831.56ms
max: 2552.42ms
approx. 95 percentile: 1261.25ms
--/300并发
transactions: 121441 (202.12 per sec.)
read/write requests: 2185938 (3638.24 per sec.)
response time:
min: 19.48ms
avg: 1573.34ms
max: 5466.92ms
approx. 95 percentile: 2504.40ms
--/400并发
transactions: 121441 (207.12 per sec.)
read/write requests: 2185938 (3638.24 per sec.)
response time:
min: 19.48ms
avg: 1573.34ms
max: 5466.92ms
approx. 95 percentile: 2810.40ms
--/500并发
由于oltp.lua脚本表少并发太多对象争用太明显,测试执行失败,但我们看到iops、tps数值稳定,rt跟线程多少有关。
7 测试二:Swingbench对Oracle进行压力测试
Swingbench 通过建立soe用户,模拟产品、订单业务,可以自定义数据量大小,本次测试生成10G左右的数据文件。
--/并发50
--/并发100
此时产生了大量的log file sync和log file switch (checkpoint incomplete),redolog现在是6组256m,由于commit频繁,调整为512M,9组。
--/并发200
此时测试一组redolog和数据在同一磁盘的情形
可以看到cpu的io wait 比redo分开存放时明显上升。
现在修改一下swingbench的读写权重,提高读的比例,并发依然是200
磁盘io达到27M/s,TPS达到1839
--/并发300
--/并发400
--/并发500
8 评测结果
8.1 Sysbench的测试总结
Sysbench:iops
Swingbench的测试效果要比Sysbench的好,Sysbench适合自定义业务逻辑和编辑lua脚本。但Sysbench的测试结果也有一些参考:
1、 Redolog和和数据分开存放,从磁盘io的截图可以看到reodlog所在的磁盘(dev252-16/dev/vdb1)TPS非常高,放在数据盘势必互相影响。
2、 对于批量小io的oltp业务,业务的频繁访问特性必须从业务逻辑设计上保证其性能,其次才是主机性能、数据库性能方面的优化配合。
8.2 Swingbench的测试总结
Swingbench:
同时收集了awr报告的数据
并发 逻辑读/秒
1、 iops在25000左右对于读写混合模式是一个理想值,只读时能达到50000以上。
2、 cpu成为oltp环境的瓶颈,在400并发时性能严重不足,这时应考虑添加cpu计算能力
3、 高并发环境redo和数据文件的IO都比较大,redolog同步和切换又影响数据的访问和变化,因此redolog和数据文件分开存放,而且redolod更需要快速读写的磁盘。通过swingbench的数据可以看到,磁盘IO压力全集中在一个磁盘,而且IOPS明显上升,TPS下降,响应时间增加,cpu等待也增高。
8.3 评测总结
结合以上的数据库性能表现以及云上Oracle压测数据来看,云主机的性能根据业务场景进行选择,中配可以支持300以内的并发,如图:指标折线图,随着并发的增长,iops、cpu、tps会达到一个峰值,此时就是提升性能的时候。
redolog和数据库盘建议分开,同时配置HA方案,可选ADG(Active Dataguard 实时同步并可以支持查询)通过业务指定部分查询到Dataguard的只读节点,分散压力。
建议进行实际业务模拟测试,以观察业务在云上的表现,对ECS的选型和oracle架构进行评估。
参考《附录 9.3 ECS官方性能指标》
指标折线图
9 附录
9.1 Sysbench的安装
版本:0.5
测试方法:OLTP、LUA
root用户安
$export ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1
$./autogen.sh
$./configure --with-oracle --without-mysql --without-drizzle
$make ORA_LIBS="-L$ORACLE_HOME/lib -lclntsh" ORA_CFLAGS="-I$ORACLE_HOME/rdbms/demo -I$ORACLE_HOME/rdbms/public"
$make install
9.2 Swingbench的安装
其安装介质下载地址:
http://www.dominicgiles.com/swingbench.html
安装方式:
1. 确保服务器上安装配置了JDK1.6以上
2. 下载swingbench,解压即可
9.3 ECS官方性能指标
Cpu系列 I 高配是16核64G,系列II 可以达到32核 128G。
SSD云盘4KB I/O块大小时随机读写IOPS高达12000、512KB I/O块大小时顺序读写吞吐量高达300MB。