公司MYSQL集群安装环境为Red hat 5或Client OS6.8

MSQL集群软件版本为7.2.8(http://www.mysql.com/downloads/cluster/)

MYSQL集群安装

a)         节点配置

1.Wget MYSQL软件包至 /software下

2.对MYSQL软件包进行解压

Tar –zxvf mysql-cluster-gpl-7.2.8-linux2.6-x86_64.tar.gz

3.将目录移至/usr/local,并重命名为mysql

Mv mysql-cluster-gpl-7.2.8-linux2.6-x86_64.tar.gz mysql

Cd /usr/local/mysql

4.新建mysql用户组及用户

Groupadd mysql

Useradd –g mysql mysql

5.初始

Sciprts/mysql_install_db –user=mysql

6.对 mysql用户修改权限

Chown –R root .

Chown –R mysql data

Chgrp –R mysql .

7.将mysql.server放为init.d中

Cp support-files/mysql.server /etc/rc.d/init.d/mysqld

8.权限

Chmod +x /etc/rc.d/init.d/mysqld

Chkconfig ---add mysqld

(*此时不要启动Mysql)

b) 管理节点配置

1.将mysql软件包wget下来并解压

2.将有关管理工具移至bin目录

Tar –zxvf mysql-cluster-gpl-7.2.8-linux2.6-x86_64.tar.gz

Rm mysql-cluster-gpl-7.2.8-linux2.6-x86_64.tar.gz

Mkdir /usr/src/mysql-mgm

Cd /usr/src/mysql-mgm

   Mv mysql-cluster-gpl-7.2.8-linux2.6-x86_64/bin/ndb_mgm .

   Mv mysql-cluster-gpl-7.2.8-linux2.6-x86_64/bin/ndb_mgmd .

   Chmod +x ndb_mg*

   Mv  ndb_mg* /usr/bin

   Cd

   Rm –rf /usr/src/mysql-mgm

         C) 配置配置文件

   1.在管理节点上配置config.ini文件

   Mkdir /var/lib/mysql-cluster

   Cd /var/lib/mysql-cluster

         Vi config.ini

    在config.ini中添加如下内容:

[NDBD DEFAULT]

NoOfReplicas=2

[MYSQLD DEFAULT]

[NDB_MGMD DEFAULT]

[TCP DEFAULT]

# Managment Server

[NDB_MGMD]

HostName=192.168.0.3 #管理节点服务器Server3的IP地址

# Storage Engines

[NDBD]

HostName=192.168.0.1 #MySQL集群Server1的IP地址

DataDir= /var/lib/mysql-cluster

[NDBD]

HostName=192.168.0.2 #MySQL集群Server2的IP地址

DataDir=/var/lib/mysql-cluster

[MYSQLD]

2.在节点机子上配置

# vi /etc/my.cnf

[mysqld]

ndbcluster

ndb-connectstring=192.168.0.3 #Server3的IP地址

[mysql_cluster]

ndb-connectstring=192.168.0.3 #Server3的IP地址

 

mkdir /var/lib/mysql-cluster

 

3、MYSQL集群管理

   1.MYSQL集群启动

   MYSQL集群启动顺序为:

                   启动管理节点

        bin/ndb_mgmd -f /var/lib/mysql-cluster/config.ini –initial

bin/ndb_mgm –e show(查看状态)

- NDB Cluster -- Management Client --

ndb_mgm> show

Connected to Management Server at: localhost:1186

Cluster Configuration

---------------------

[ndbd(NDB)]     2 node(s)

id=2    @192.168.0.1  (Version: 4.1.9, Nodegroup: 0, Master)

id=3    @192.168.0.2  (Version: 4.1.9, Nodegroup: 0)

[ndb_mgmd(MGM)] 1 node(s)

id=1    @192.168.0.3  (Version: 4.1.9)

[mysqld(API)]   2 node(s)

id=4   (Version: 4.1.9)

id=5   (Version: 4.1.9)

ndb_mgm>

                   将节点连接至管理节点

        # /usr/local/mysql/bin/ndbd –initial(第一启动用—initial 启动用start)

                   启动MYSQL节点

# /etc/rc.d/init.d/mysqld start

                 (*注意第一次启动是需要initial)

MySQL集群问题排除

在安装和使用mysql cluster集群的过程中,遇到了很多问题,现在把那些问题列出来,并复上解决方法,希望大家在以后的使用中能少花时间少走弯路

 

1、  导入数据的时候遇到如下报错:

ERROR 1005 (HY000) at line 25: Can't create table 'tuge.pangolin_fnc_accountverification' (errno: 140)

Error | 1296 | Got error 738 'Record too big' from NDB    

分析原因:表但行数据太大

解决办法:需要更改表结构,使最大单行数据的大小小于8KB!

 

2、  导入大量数据的时候遇到如下报错

Error 1297: Got temporary error 'REDO' log overloaded.       

ERROR : Got temporary error 1204 'Temporary failure, distribution changed' from NDBCLUSTER

ERROR : Got temporary error 1234 'REDO log files overloaded (increase disk hardware)' from NDBCLUSTER

分析原因:遇到这个错误,是表示redo log用完了,需要增加

解决办法:修改config.ini文件,更改或添加如下参数:

FragmentLogFileSize=256M

NoOfFragmentLogFiles=16

NoOfFragmentLogFiles这个参数可以更改到更大,但是初始化的时候会慢一点

 

3、  在导入大量数据的时候,出现如下报错:

ERROR 1114 (HY000) at line 54: The table 'gps_led_sendadverthistory' is full

分析原因:你分配的内存或者硬盘空间已经用完(如果你采用磁盘表的话),需要通过ndb管理节点客户端和登录mysql查看具体的原因,通过ndb_mgm登录,执行命令:

All report memory看下分配的内存是否使用完,如果采用磁盘表的,还需要登录mysqld节点,然后执行如下查询,来确定是否是磁盘不足:

SELECT TABLESPACE_NAME, FILE_NAME, EXTENT_SIZE*TOTAL_EXTENTS/1024/1024 AS TOTAL_MB, EXTENT_SIZE*FREE_EXTENTS/1024/1024 AS FREE_MB, EXTRA FROM information_schema.FILES WHERE FILE_TYPE="DATAFILE";

解决办法:如果是数据内存不足的情况,直接更改文件config.ini中[NDBD DEFAULT]下的

DataMemory=11480M

IndexMemory=1024M

根据实际情况加大

如果是采用磁盘表,磁盘文件空间不足的情况,就需要添加磁盘文件,格式如下:

ALTER TABLESPACE ts_1

ADD DATAFILE 'data_4.dat'

INITIAL_SIZE 10240M

ENGINE NDBCLUSTER;  

4、  在还原的时候遇到如下报错:

Configuration error: Error : Could not alloc node id at 192.168.100.223 port 1186: Id 12 configured as ndbd(NDB), connect attempted as mysqld(API).

Unable to connect to management server.

分析原因:因为还原的时候会去连接mysqld,而在配置ndb的时候没有添加空的mysqld节点,因此出现这个报错

解决办法:在config.ini添加几个空的mysqld节点,语法如下:

[MYSQLD]

[MYSQLD]

[MYSQLD]

[MYSQLD]

 

5、  导入大量数据的时候或者执行大量的insert或者update操作的时候,经常会出现如下报错:

ERROR 1297 (HY000) at line 1: Got temporary error 1218 'Send Buffers overloaded in NDB kernel' from NDBCLUSTER

这个报错的原因有几个,第一、是参数SendBufferMemory设置过小,第二、和mysqld的二进制日志有关系,第三、和网络环境有关系

解决办法:查看网络环境是否OK ,是否出现双工模式部队,是否都是千兆网或者百兆网,加大SendBufferMemory的设置,一般2M就够了,设置TotalSendBufferMemory = 256M,最后如果还是出现如此报错,建议关闭mysql的二进制日志,在my.cnf中注释掉相关的参数就可以了,比如:

#log-bin=mysql-bin

 

6、  错误日志

Status: Temporary error, restart node

Message: System error, node killed during node restart by other node (Internal error, programming error or missing error message, please report a bug)

Error: 2303

Error data: Node 12 killed this node because GCP stop was detected

Error object: NDBCNTR (Line: 273) 0x00000006

分析原因:这个问题是因为undo日志文件空间用完了!

解决办法:增加undo日志空间文件,语法如下:

ALTER LOGFILE GROUP lg_1

ADD UNDOFILE 'undo_2.log'

INITIAL_SIZE 2048M

ENGINE NDBCLUSTER;

 

7、  还原的时候出现如下报错:

Temporary error: 266: Time-out in NDB, probably caused by deadlock

分析原因:出现这个问题是锁定超过1.2s

解决办法:在config.ini中加入:TransactionDeadLockDetectionTimeOut=10000 默认是1200

 

8、  创建日志文件组的时候,出现如下报错:

Error CODE : 1528 Failed TO CREATE LOGFILE GROUP

用SHOW WARNINGS;       查看详细报错如下:

    Got error 1504 'Out of logbuffer memory' FROM NDB

Failed TO CREATE LOGFILE GROUP

分析原因:是因为SharedGlobalMemory的值比UNDO_BUFFER_SIZE小导致错误

解决办法:把SharedGlobalMemory调大,原来我的UNDO_BUFFER_SIZE为128,但是我的SharedGlobalMemory为80,将SharedGlobalMemory设置成384M解决问题