很久以来,系统管理员在人们心目中就是一群艺高人胆大的独行侠客,我,就是一个资深的系统管理员。


浩如烟海的命令组合、巧夺天工的脚本逻辑、深不可测的参数调优,无数匪夷所思的疑难杂症在快捷灵巧的键盘击打中烟消云散……,这是我对自己工作成就的最好感悟。


然而,大家并不理解我们这群系统管理员们。 勤奋低调的系统管理并没有网络管理那样的时尚,不断有机会尝试着新的网络产品、设备、新的网络链路、新的安全过滤机制。系统追求稳定和可靠,不能如此日新月异;系统管理也没有应用开发那么自由自在,各种美观的界面元素、多样的中间件的选择、甚至应用的展示结果可以用花枝招展的各类报表图形来妆点。系统管理是和机器的对话,那些图形和选择不属于我们系统管理员。大多数情况下,我们面对的是SSH/Telnet的字符界面和光标闪动,或者是千篇一律的缺乏审美情操的工业革-命时代的图形管理界面风格,进行着日复一日的重复检查和审视。枯燥的重复意味着可靠的运行,尽管不那么令人享受,但静静地看着那些数以十计的庞然大物在我们的管理之下发出低沉的吼声,默默地执行着各自的使命,这种情形却也使人安心、愉悦。


但系统管理并不简单,平时我们要建立长程的运营状态报告,以便让各个团队和组织领导理解系统的运行健康度;有时,我们需要配合应用开发部门,去进行一些非常罕见的系统参数设置,以便整个应用可以达到新的水平;偶尔,一些奇怪的问题往往消耗大量的时间,甚至一个意外的重启后的莫名错误就会消耗我们整个晚上的时间。


可别人如何能理解系统管理的难度有多少呢?我们何尝又不想把我们的高深系统的参悟造诣能够更好地为团队贡献、为组织、公司的业务发展提供更有力、直接的支援呢?


在这个业务快速发展的时代里,系统管理需要尽快从过去的“静默运维”升级到“智能运维”的范畴之中。系统管理可以通过建立从数据检索、日常监控和告警体系、性能衡量与评估到业务视图的深入流程体系。我们可以把日常的运维工作和公司的业务营运目标精密结合起来。大量的系统日志、IT数据可以成为我们智能运维的基础,在此之上,进一步的挖掘、整理和呈现是表达我们思想的有力手段。


也是因为在系统管理上最近爱上了Splunk,有感而发。无论是Windows, Linux, AIX, Solaris, HPUX等各类系统,或者是NetAPP, EMC等存储设备,以及Citrix, Vmware等各类虚拟机系统,各类的系统、设备都有丰富的IT数据产生,例如日志、运行状态数据、甚至是脚本运行的结果输出;通过收集这些IT数据,并进行Google式的快速搜索定位,各类问题的关联解决和快速诊断得到了有力的保障;而进一步利用这些问题故障的搜索可以演变成动态的报表和自动告警,形成了自动化系统管理的快捷流程;把相关的报表、实时监控保存在一起则瞬间形成了面向任务、面向业务的仪表板视图。


和传统的IT运维工具不同,Splunk提供了大量的灵活定义方式和脚本语言引擎可供我们发挥自己的想象力。系统管理历史上积累的脚本知识、正则表达式定义能力与简便的图形化操作结合,成为我们可以自己不断发扬完善的系统运维平台,完全不受到厂商、供应商的能力限制。有非常多的用户自己甚至把定义的结果组合成开源的Splunk App上传到Splunk.cn供大家参考使用。


系统管理员一定要保持一颗不停尝试新软件和新思路的习惯,只有这样,才能不断改进自己在系统管理上的流程习惯,成为一个优秀的系统管理员。


在信息时代的今天,一个高级的系统管理员执行着一个公司的核心任务,是平台运作的基础,你,准备好了吗?