在mycat中的conf目录下我们常用的配置文件有schema.xml、server.xml以及rule.xml,分别用于配置mycat的表相关、整体服务配置及分库分表规则配置,我们这里主要是说明下在schem.xml中常用的配置,我们先看下schema元素的配置:
属性名 | 值 | 数量限制 | 说明 |
---|---|---|---|
name | String | 1 | 逻辑数据库名 |
dataNode | String | 0..1 | 该库中未指定dataNode的表的默认存储节点 |
checkSQLschema | boolean | 1 | 是否检查SQL语句中库名(select * from TESTDB.orders;),如果设置为true,会检查;当库名与逻辑库名相同时,会去掉语句中的库名前缀。 这么做的目的避免发送到后端数据库执行时报(ERROR 1146 (42S02): Table ‘testdb.travelrecord’ doesn’t exist) |
sqlMaxLimit | int | 1 | 对于拆分库的schema,当该值设置为某个数值时,每条执行的SQL语句,如果没有加上limit 子句,MyCat 会自动加上。 例如:设置值为100,执行select * from TESTDB.travelrecord;的 效果为select * from TESTDB.travelrecord limit 100; |
看下示例如下:
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
<table name="travelrecord" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
<table name="goods" primaryKey="ID" type="global" dataNode="dn1,dn2" />
<table name="customer" primaryKey="ID" dataNode="dn1,dn2" rule="sharding-by-intfile">
<childTable name="orders" primaryKey="ID" joinKey="customer_id" parentKey="id">
<childTable name="order_items" joinKey="order_id" parentKey="id" />
</childTable>
</table>
</schema>
看下table元素的配置说明:
属性名 | 值 | 数量限制 | 说明 |
---|---|---|---|
name | String | 1 | 表名,同个schema 标签中定义的名字必须唯一。 |
dataNode |
String
|
1..n | 存放表数据的数据节点名。 很多难以罗列时,可以这样配置:dataNode=‚multipleDn$0-99,multipleDn2$100- 199‛,$0-99表示0-99 <dataNode name="multipleDn$0-99" dataHost="localhost1" database="db$0-99" ></dataNode> |
rule | String | 0..1 | 指定逻辑表要使用的分片规则名字,规则名字在rule.xml 中定义,必须与tableRule 标签中name 属性属性值一一对应。 |
ruleRequired | boolean | 0..1 | 该属性用于指定表是否绑定分片规则,如果配置为true,但没有配置具体rule 的话, 程序会报错。 |
primaryKey | String | 1 | 该逻辑表对应真实表的主键,当分片的规则是使用非主键进行分片的,那么在使用主 键查询的时候,就会发送查询语句到所有配置的DN 上,如果使用该属性配置了主键,那么MyCat 会缓存主键与具体DN 的信息,那么再次使用非主键进行查询的时候就不会 进行广播式的查询,会直接发送语句给具体的DN。 注意:尽管配置该属性,如果缓存并没有命中的话,还是会发送语句给具体的DN,来 获得数据。 |
type | String | 0..1 | 定义逻辑表的类型,目前只有'全局表‛和‛普通表‛两种。 对应的配置: 全局表:global 普通表:不指定该值为globla 的所有表 |
autoIncrement | boolean | 0..1 | 是否使用主键自增长 |
subTables | String
|
1 | 分表,subTables="t_order$1-2,t_order3"。 目前分表1.6以后开始支持,并且 dataNode 在分表条件下只能配置一个,分表条件下 不支持各种条件的 join 语句。 |
needAddLimit | boolean | 0..1 | 指定表是否需要自动的在每个语句后面加上 limit 限制。由于使用了分库分表,数据 量有时会特别巨大。这时候执行查询语句,若恰巧忘记了加上数量限制,那么想要查询 所有的数据,则需要等待一段时间。 所以,mycat 就自动的为我们加上LIMIT 100。当然,如果语句中有limit,就不会再次添加了。这个属性默认为true,你也可以设置成 false 禁用掉默认行为。 |
我们接着看下childTable元素的配置,childTable主要是用于ER表,通过标签上的属性与父表进行关联,子表的记录与所关联的父表记录存放在同一个数据分片上,从而保证数据Join不会跨库操作。
属性名 | 值 | 数量限制 | 说明 |
---|---|---|---|
name | String | 1 | 子表名 |
primaryKey | String | 0..1 | 字表的主键列名 |
joinKey | String | 1 | 字表中与父表关联的列 |
parentKey | String | 1 | 父表中关联的列 |
我们接下来看下dataHost这个元素的整体配置
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<!-- can have multi write hosts -->
<writeHost host="hostM1" url="localhost:3306" user="root" password="123456">
<!-- can have multi read hosts -->
<readHost host="hostS2" url="192.168.1.200:3306" user="root" password="xxx" />
</writeHost>
</dataHost>
dataHost定义Mycat中的数据主机,数据主机定义中定义了具体的数据库服务、读写分离配置和心跳语句。这是与物理数据库服务关联的地方。我们看下dataHost的元素配置:
属性名 | 值 | 数量限制 | 说明 |
---|---|---|---|
name | String | 1 | 数据主机名,唯一。 |
maxCon | int | 1 | 指定每个读写实例连接池的最大连接。也就是说,标签内嵌套的writeHost、readHost标签都会使用这个属性的值来实例化出连接池的最大连接数。 |
minCon | int | 1 | 指定每个读写实例连接池的最小连接,初始化连接池的大小。 |
balance | int | 1 | 负载均衡类型,目前的取值有4 种: 1. balance="0",不开启读写分离机制,所有读操作都发送到当前可用的writeHost 上。 2. balance="1",全部的readHost 与stand by writeHost 参与select 语句的负载均衡,简单的说,当双主双从模式(M1->S1,M2->S2,并且M1 与M2 互为主备),正常情况下,M2,S1,S2 都参与select 语句的负载均衡。 3. balance="2",所有读操作都随机的在writeHost、readhost 上分发。 4. balance="3" , 所有读请求随机的分发到 writeHost 对应的 readhost 执 行 ,writeHost 不负担读压力,注意balance=3 只在1.4 及其以后版本有,1.3 没有。 |
writeType | int | 1 | 1. writeType="0",所有写操作发送到配置的第一个writeHost,第一个挂了切到还生存的第二个writeHost,重新启动后已切换后的为准,切换记录在配置文件中: dnindex.properties 。 2. writeType="1",所有写操作都随机的发送到配置的writeHost(1.5 以后废弃不推荐) |
switchType | int | 1 | -1 表示不自动切换。 1 默认值,自动切换。 2 基于MySQL 主从同步的状态决定是否切换。 |
dbType | String | 1 | 指定后端连接的数据库类型,目前支持二进制的mysql 协议,还有其他使用JDBC 连接的数据库。例如:mongodb、oracle、spark 等。 |
dbDriver | String | 1 | 指定连接后端数据库使用的Driver,目前可选的值有native 和JDBC。 1. 使用native 的话,因为这个值执行的是二进制的mysql 协议,所以可以使用mysql和mariadb。从1.6 版本开始支持postgresql 的native 原始协议。 2. 使用JDBC 的话需要将符合JDBC 4 标准的驱动JAR 包放到MYCAT\lib 目录下,并检查驱动JAR 包中包括如下目录结构的文件:META-INF\services\java.sql.Driver。在这个文件内写上具体的Driver 类名,例如:com.mysql.jdbc.Driver。 |
heartbeat标签的主要作用:
1. 这个标签内指明用于和后端数据库进行心跳检查的语句 如:MYSQL 可以使用select user(),Oracle 可以使用select 1 from dual 等。 2. 这个标签还有一个connectionInitSql 属性,主要是当使用Oracle数据库时,需要执行的初始化SQL语句就放到这里。 如:alter session set nls_date_format='yyyy-mm-dd hh24:mi:ss' 1.4 主从切换的语句必须是:show slave status。 我们接下来看下writeHost和readHost的元素配置, 在一个dataHost 内可以定义多个writeHost 和readHost。但是,如果writeHost 指定的后端数据库宕机,那么这个 writeHost 绑定的所有readHost 都将不可用。另一方面,由于这个writeHost 宕机系统会自动的检测到,并切换到备用的 writeHost 上去。属性名 | 值 | 数量限制 | 说明 |
---|---|---|---|
host | String | 1 | 用于标识不同实例,一般writeHost 我们使用*M1,readHost 我们用*S1。 |
url | String | 1 | 后端实例连接地址: 若是用native 的dbDriver,则一般为address:port 这种形式。 若是用JDBC 或其他的dbDriver,则需要特殊指定。(当使用JDBC 时则可以这么写:jdbc:mysql://localhost:3306/) |
user | String | 1 | 连接后端存储实例的用户名 。 |
password | String | 1 | 密码 |
我们可以对password进行加密,但是这个加密是在1.4.1版本以后:
java -cp Mycat-server-1.4.1-dev.jar io.mycat.util.DecryptUtil 1:host:user:password
Mycat-server-1.4.1-dev.jar 为mycat download 下载目录的jar,1:host:user:password 中1 为db 端加密标志,host 为dataHost 的host 名称。