Skip to main content

 路由器设置 > 路由器问答 >

一名网管初入机房学习的心得

2012-06-23 16:03 浏览:

前天去客户现场配合进行服务器的电源改造。由于以前对该系统不熟悉,有没有对其熟悉的人介绍情况,所以提前了解了一下情况。只知道有四台机器,跑着我们的两个业务。

准备阶段:

第一次到机房,对了机架上的标牌看了半天。作为电信行业的机房,虽然管理上不是很完善,但标注信息还是比较清楚的。机架上按照顺序列出了各个服务器和网络设备的名称。观察服务器状态,其中一个的黄色警告灯是亮的,证明有一定问题。但客户的管理员称不影响升级。

windows的双机系统,在群集管理器中根据机器名称确认了拓扑关系:其中两台是一个双机系统,一台跑着另外一个应用,剩下的一台是个摆设。磁阵挂载服务器A上,但群集有问题,心跳是通的,但对外IP有故障。

备份了应用程序,拷贝到移动硬盘上。(听说有的服务器插上USB设备会告警,这个确实需要注意)网络工程师帮忙将路由器和交换机的配置导出来,拷贝就算结束了。

与客户叙述了一遍测试方法,并写好语句放在服务器上。

再将拓扑图搞定,准备完毕。

操作阶段:

首先检查应用的使用情况,确认一切正常后关闭了通讯程序,然后关掉页面程序,关闭群集中未挂载磁阵的服务器B,挂载磁阵的服务器A,关闭KVM,关闭磁阵,关闭网络设备。

进行电源线的梳理和改造。

启动顺序与关闭相反:将网络设备启动,将磁盘阵列打开,将KVM打开,将未挂载磁阵的服务器B打开,挂载磁阵的服务器A打开。

这时候发现数据库正常启动了,然后启动页面程序和通讯程序。

业务测试开始,但发现数据库无法对外服务。检查原因,发现磁阵挂载在服务器B上,而且群集管理器打不开。

重新看了一下操作顺序,发现启动顺序有些问题,应该是先将A服务器打开才能保证磁阵挂载A上。而当时不知道KVM如何切换,这可真是急啊。下一步的操作如何进行,需要做出决策了。但客户似乎并不想承担,至少向领导请示,按照自己的想法来了:重启服务器B。未操作时,偶然发现KVM只需要连按两次大小写锁定键就可以实现屏幕切换。这个一定要记住了!

两台服务器A和B 的IP还是有问题,又与其他的服务器比较了一下,发现IP根本就有问题,将网段更改,然后打开群集能够看到两个节点了,虽然还有故障的标记,但至少是个进步。

将节点B脱离出去,使磁阵自动切换到节点A,然后再将其切换回来,一切正常了。

两外一台服务器也启动后,打开应用程序和数据库,进行业务测试。

总结一下经验和教训:

首先,对于服务器的操作一定要对步骤慎重,再慎重。即使是经过评审了,最后实施的是谁,还是要对其有可以接受的把握--毕竟在现场需要承受更大的压力,大半夜的实施,没几个人可以真正帮得上你。

其次,还是要多学,像KVM这些辅助设备,也是需要有更多的了解的;服务器的指示灯,有时候也能帮助我们进行判断。

最后,群集操作,还是得有更多的实践。windows和类unix系统其实操作原理上还是很像的,得触类旁通。

能实践,还是很令人兴奋的,而且最终的问题都被解决了,不错。

出处:http://889900883300.blog.51cto.com/2344736/906144