说到运维,无非是通过技术、制度、流程和文档等手段,对企业已经建立好的IT运行环境(如软硬件环境、网络环境等)、IT业务系统和 IT 运维人员进行综合的管理的统称而已,其核心围绕安全、质量、效率、成本的标准化流程及解决方案。
企业初期对应运维需求从监控和评估系统好坏为基础运维指标。了解系统架构,评估运维上是否合理,如接口调用数据,用户访问速度等等,提出对应需求,开发在设计时实现,方便上线后运维采集这些数据做系统评估。
IT业务系统运维阶段,企业运维管理内容又可细分为六项:
-
设备管理:对网络设备、服务器设备、操作系统运行状况进行监控;
-
应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;
-
数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;
-
目录/内容管理:对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;
-
资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;
-
信息安全管理:如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。
明确运维管理内容细节,有利于企业针对具体内容制定关键流程,因为已经明确了每个关键流程对企业有什么影响和意义,所以设置运维流程时按内容优先级次序进行处理。同时建立故障和事件处理跟踪流程,利用表格等工具来记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。
随着企业业务运维环境和工具的能力提升,功能完善、体验优化,开发技术人员将逐步退出,日常管理将针对IT运维和业务运维需求、过程、结果进行管理管控:通过实现针对应用变化的记录和跟踪、针对地域不同的变更和跟踪、预测环境和应用的风险和防范管理等,对内容繁杂、持续变化、支持不同的业务需求,以及对整个管理信息系统运行状态的管控。
运维需要安全,只有安全才能实现高效稳定。针对软硬件、数据、文档等做好相应的安全措施中,服务器和网络设备等密码复杂度是基础也是重点,其次对数据库深入防御。对敏感关键信息加密存储、避免使用默认端口、对数据库的连接进行IP限制、审计追踪控制都是必要的条件。从数据库中提取或者存入数据,连接数据库时,注意完成相应操作后及时关闭数据库连接,对账户严格分级权限控制并设置好审计,防止恶意注册,手机、邮箱验证注册或图片验证码,并限制每个IP注册的数量并对备份的压缩包进行加密。
为满足不断扩展的业务部门需求,企业需要不断购置服务器,导致能耗、占地、运维等费用大幅度增加,而IT管理运维解决方案的目标,就是要把IT基础设施提升到IT运维的角度上去,以市场为导向、以客户为中心、以效益为目标,通过面向服务开通保障运维管理控制运维成本的同时,也实现了对运营维护质量、及时性、完整性和高效性的提高,从基础层面上升到服务层面,建立统一的运维展现门户,构建统一的资源配置库,采用统一的接口是实现IT标准化运维解决方案的必然方向。