linux cluster配置安装(简化)

首先先介绍一下服务器配置:

两台hp ProLiant DL360 G6 ,配置均一样

两颗四核Intel(R) Xeon(R) CPU E5504 @ 2.00GHz

内存:24G

硬盘:三块146G本地硬盘

安装clucster,这一步在安装系统的时候已经选中了cluster组件,如果没有安装,那么安装必要的RPM包

利用chkconfig –list查看服务,chkconfig –level 35 service off关闭没有必要的服务,节省资源,提高启动速度

配置集群

两台服务器都已经安装redhat5.5

下面是进行一些配置文件的修改

首先修改/etc/hosts文件

这个文件要求两台机器上均一样

192.168.29.54 pgbouncer-192-168-29-54.sky-mobi.com.hz pgbouncer-192-168-29-54

192.168.29.55 pgbouncer-192-168-29-55.sky-mobi.com.hz pgbouncer-192-168-29-55

192.168.27.8 pgbouncer-192-168-29-55_fence.sky-mobi.com.hz pgbouncer-192-168-29-55_fence

192.168.27.9 pgbouncer-192-168-29-54_fence.sky-mobi.com.hz pgbouncer-192-168-29-54_fence

修改内核参数,不同的硬件配置可以根据具体情况进行配置,以下是我加的/etc/sysctl.conf

net.ipv4.ip_local_port_range = 1024 65000

net.core.rmem_default = 1048576

net.core.rmem_max = 1048576

net.core.wmem_default = 262144

net.core.wmem_max = 262144

net.ipv4.tcp_tw_recycle=1

net.ipv4.tcp_max_syn_backlog=4096

net.core.netdev_max_backlog=10000

vm.overcommit_memory=0

net.ipv4.ip_conntrack_max=655360

配置/etc/security/limits.conf,加入

1
2
3
4
5
6
7
8
*  soft    nofile  131072
* hard nofile 131072
* soft nproc 131072
* hard nproc 131072
* soft core unlimited
* hard core unlimited
* soft memlock 50000000
* hard memlock 50000000

配置/etc/pam.d/login,加入

session required pam_limits.so

配置/etc/ssh/sshd_config,加入

修改UseDNS no

配置/etc/sysconfig/ntpd,同步改为

SYNC_HWCLOCK=yes

配置/etc/rc.local,加入

/sbin/sysctl -w net.ipv4.ip_conntrack_max=655360

配置/etc/cluster/cluster.conf,截图有点大,大家凑合着看吧,这里其实就是利用system-config-cluster图形配置完成后生成的集群配置文件,这里直接创建并修改这个文件即可,下面简单说明下这个配置:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Alias这里是集群的名称,大家可以自定义,不过切记在局域网内保证名字唯一性

后面config_version是版本,这个大家修改一次,可以加1,两台服务器要一致,name可以和alias一样。

接下来就是配置node

Name是主机名,device name是fence名称

<fencedevice agent="fence_ilo" hostname="pgbouncer-192-168-29-54_fence" login="cqzx" name="pgbouncer-192-168-29-54_fence" passwd="Fj6Ci0xSKbJ

"/>这一行是配置fence,这里是用ilo做fence,填入用户名和密码以及名称即可

<failoverdomain name="pgbouncer_failover" ordered="0" restricted="1">

<failoverdomainnode name="pgbouncer-192-168-29-54" priority="1"/>

<failoverdomainnode name="pgbouncer-192-168-29-55" priority="1"/>

这里是失效域的配置,failoverdomain name自定义,failoverdomainnode name写入fence设备的名称

<ip address="10.0.0.100" monitor_link="1"/>

<script file="/etc/init.d/nfs" name="nfs"/>这里配置资源,这里我是NFS服务

<script ref="nfs"/>这里的名称要与上面name的名称一致

Alt text

加入crontab

Crontab –e

/2 /usr/sbin/ntpdate asia.pool.ntp.org && /sbin/hwclock –systohc

定时同步时间

启动集群服务

Service cman start

Service rgmanager start

通过clustat查看状态。

你活着,证明了什么?