mycat分库分表

应用场景

笔者数据库中有一个表的数据量非常大，其他表的数据量不大，想要对大表进行分库存储。

mycat的下载和安装此处不再赘述，请参考百度。笔者的mycat是安装在win10下的。
说明：需要根据主库（cxs_test）建好其他三个分库（mycat_test1、mycat_test2、mycat_test3），

mycat分库分表
1、配置server.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/">
	<system>
	<property name="useSqlStat">0</property>  <!-- 1为开启实时统计、0为关闭 -->
	<property name="useGlobleTableCheck">0</property>  <!-- 1为开启全加班一致性检测、0为关闭 -->
	<property name="sequnceHandlerType">2</property>
      	<!--  <property name="useCompression">1</property>--> <!--1为开启mysql压缩协议-->
        <!--  <property name="fakeMySQLVersion">5.6.20</property>--> <!--设置模拟的MySQL版本号-->
		<!-- <property name="processorBufferChunk">40960</property> -->
		<!-- 
		<property name="processors">1</property> 
		<property name="processorExecutor">32</property> 
		 -->
		<!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena-->
		<property name="processorBufferPoolType">0</property>
		<!--默认是65535 64K 用于sql解析时最大文本长度 -->
		<!--<property name="maxStringLiteralLength">65535</property>-->
		<!--<property name="sequnceHandlerType">0</property>-->
		<!--<property name="backSocketNoDelay">1</property>-->
		<!--<property name="frontSocketNoDelay">1</property>-->
		<!--<property name="processorExecutor">16</property>-->
		<!--
			<property name="serverPort">8066</property> <property name="managerPort">9066</property> 
			<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property> 
			<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
		<!--分布式事务开关，0为不过滤分布式事务，1为过滤分布式事务（如果分布式事务内只涉及全局表，则不过滤），2为不过滤分布式事务,但是记		 录分布式事务日志-->
		<property name="handleDistributedTransactions">0</property>
		<!--
			off heap for merge/order/group/limit      1开启   0关闭
		-->
		<property name="useOffHeapForMerge">1</property>
		<!--
			单位为m
		-->
		<property name="memoryPageSize">1m</property>
		<!--
			单位为k
		-->
		<property name="spillsFileBufferSize">1k</property>
		<property name="useStreamOutput">0</property>
		<!--
			单位为m
		-->
		<property name="systemReserveMemorySize">384m</property>
		<!--是否采用zookeeper协调切换  -->
		<property name="useZKSwitch">true</property>
	</system>
	<!-- 全局SQL防火墙设置 -->
	<!-- <firewall> 
	   <whitehost>
	      <host host="127.0.0.1" user="mycatTest"/>
	      <host host="127.0.0.2" user="mycat"/>
	   </whitehost>
       <blacklist check="false">
       </blacklist>
	</firewall> -->
	<user name="root">  <!-- 注意：此处的“root”是propertis中设置jdbc.username -->
		<property name="password">123456</property>  <!-- 注意：此处是propertis中设置jdbc.password的密码 -->
		<property name="schemas">MYCATTESTDB</property>  <!-- 注意：此处的“MYCATTESTDB” 是properties中jdbc.url的数据库名 -->
	</user>
</mycat:server>

下图是properties文件的jdbc配置
mycat分库分表
2、配置schema.xml

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
	<schema name="MYCATTESTDB" checkSQLschema="false" sqlMaxLimit="100">
		<!-- 全局表 -->
		<table name="hk_bas_apk" primaryKey="apk_id" dataNode="node_db01"/>
		<table name="hk_bas_attachment" primaryKey="att_id" dataNode="node_db01"/>
		<table name="hk_bas_attachment_link" primaryKey="att_link_id" dataNode="node_db01"/>
		<!-- 分库表 -->
		<table name="hk_chk_disease_record" primaryKey="record_id" dataNode="node_db01,node_db02,node_db03,node_db04" rule="rule_hk_chk_disease_record"/>
	</schema>
	<dataNode name="node_db01" dataHost="localhost1" database="cxs_test" />
	<dataNode name="node_db02" dataHost="localhost1" database="mycat_test1" />
	<dataNode name="node_db03" dataHost="localhost1" database="mycat_test2" />
	<dataNode name="node_db04" dataHost="localhost1" database="mycat_test3" />
	<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
			  writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
		<heartbeat>select user()</heartbeat>
		<!-- can have multi write hosts -->
		<writeHost host="server1" url="127.0.0.1:3306" user="root"
				   password="123456">
		</writeHost>
	</dataHost>
</mycat:schema>

在这里我只需要将“hk_chk_disease_record”表进行分库分表储存，所以dataNode的值要和下面所有dataNode标签的name属性值保持一致。在配置中，name=“node_db01”，对应数据库“cxs_test”作为主库, 其他作为分库。全局表不需要分库分表储存，所以dataNode就只需填写node_db01。dataHost的name属性和 dataNode的dataHost属性值保持一致。需要分库的表，table的rule属性必填，其值需要和rule.xml配置中的tableRule的name属性值对应。
注意：schema.xml中的 schema name="MYCATTESTDB"要和sever.xml的 property name="schemas"标签中的值 MYCATTESTDB保持一致。需要注意的是，所有table必须要有主键，即primaryKey必须指定。

3、配置rule.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
	<tableRule name="rule1">
		<rule>
			<columns>id</columns>
			<algorithm>murmur</algorithm>
		</rule>
	</tableRule>
	<!-- 自己定义的分片规则，此处的name属性值要和上一步骤的tableRule的name属性值对应。 -->
	<tableRule name="rule_bm_chk_disease_record">
		<rule>
			<columns>record_id</columns>  <!-- 这里的“record_id” 为schema.xml中要被分库分表的数据表的主键一致 -->
			<algorithm>murmur</algorithm>
		</rule>
	</tableRule>
	<function name="murmur"
		class="io.mycat.route.function.PartitionByMurmurHash">
		<property name="seed">0</property><!-- 默认是0 -->
		<property name="count">4</property><!-- 要分片的数据库节点数量，必须指定，否则没法分片 -->
		<property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点，默认是160倍，也就是虚拟节点数是物理节点数的160倍 -->
		<!-- <property name="weightMapFile">weightMapFile</property> 节点的权重，没有指定权重的节点默认是1。以properties文件的格式填写，以从0开始到count-1的整数值也就是节点索引为key，以节点权重值为值。所有权重值必须是正整数，否则以1代替 -->
		<!-- <property name="bucketMapPath">/etc/mycat/bucketMapPath</property> 
			用于测试时观察各物理节点与虚拟节点的分布情况，如果指定了这个属性，会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件，没有默认值，如果不指定，就不会输出任何东西 -->
	</function>

	<function name="crc32slot"
			  class="io.mycat.route.function.PartitionByCRC32PreSlot">
		<property name="count">2</property><!-- 要分片的数据库节点数量，必须指定，否则没法分片 -->
	</function>
	<function name="hash-int"
		class="io.mycat.route.function.PartitionByFileMap">
		<property name="mapFile">partition-hash-int.txt</property>
	</function>
	<function name="rang-long"
		class="io.mycat.route.function.AutoPartitionByLong">
		<property name="mapFile">autopartition-long.txt</property>
	</function>
	<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
		<!-- how many data nodes -->
		<property name="count">3</property>
	</function>

	<function name="func1" class="io.mycat.route.function.PartitionByLong">
		<property name="partitionCount">4</property>
		<property name="partitionLength">256</property>
	</function>
	<function name="latestMonth"
		class="io.mycat.route.function.LatestMonthPartion">
		<property name="splitOneDay">24</property>
	</function>
	<function name="partbymonth"
		class="io.mycat.route.function.PartitionByMonth">
		<property name="dateFormat">yyyy-MM-dd</property>
		<property name="sBeginDate">2015-01-01</property>
	</function>
	
	<function name="rang-mod" class="io.mycat.route.function.PartitionByRangeMod">
        	<property name="mapFile">partition-range-mod.txt</property>
	</function>
	
	<function name="jump-consistent-hash" class="io.mycat.route.function.PartitionByJumpConsistentHash">
		<property name="totalBuckets">3</property>
	</function>
</mycat:rule>

注意：tableRule 中的“record_id” 为schema.xml中要被分库分表的数据表的主键一致。

至此mycat的主要配置基本结束。如有不正确的地方，请各位读者批判指出，互相学习。
双击startup_nowrap.bat，
mycat分库分表
如果出现下图，则配置启动成功。

应用场景

相关推荐