跨平台批量调度的实现及其与业务连续性的关系
来源:保捱科技网
研究・技术应用 栏目编辑.梁春丽E-mail:lianglizi505@l 63 com !F ■ ■中国银监会信息中心张金棋 一一一 二、技术实现 (一)实验系统架构 。本文从技术实施的角度 业务连续性之间的关系。 、背量 随着我国金融服务行业的蓬勃发展,银行规模不 断扩大,数据集中程度不断提高,数据中心承载了更大 根据实践经验,大型数据中心的核心系统通常运 行在Z/OS主机平台上,外围系统运行在各类Unix/b型机 平台和Windows/]E务器上。基于TWS的跨平台批量调度 系统以主机平台为核心,由主机平台上的TWST_具集中 调度主机平台以及其它外围平台上的所有批量作业,实 验系统的架构如图1所示。 系统在逻辑上由两级域构成,分别是主控域 (Master Domain)和子域(Domain A,Domain B)。包 括了三类功能单元:主控域管理器(Master Domain Manager),集中管理所有需要调度的批量作业,部署在 的运行维护压力,后台批量处理的可靠性将直接影响 数据中心的业务连续性管理水平。 目前,数据中心在批量处理方面需要应对较多难 题。首先,联机交易量的井喷式增长引发了巨大的数据 吞吐,批量处理的压力日益增大,时间窗口显著缩短, 批量处理对联机交易的倒逼压力逐渐形成。其次,批 量处理的流程日益复杂,操作人员需要维护的批量作 业规模不断扩大,操作风险逐渐显现。再次,业务种类 不断创新,业务流程日益精细,批量处理的关联关系愈 发复杂,分散式的管理方式容易诱发各类潜在风险,实 现批量的集中统一调度刻不容缓。最后,业务需求和 技术架构日益复杂,传统的后台环境融合了大量新兴的 系统平台,形成了包括Z/OS,Unix,AS/400,Windows, Linux在内的多种平台共存的局面,仅从某个应用或平 台的角度出发很难管理全部业务流程,批量处理的跨 平台问题El益突出。 主机Z/OS平台上;域管理器(Domain Manager),把主控 域管理器生成的批量计划文件下发到需要控制的所有 系统平台;容错探针(Fault-Tolerant Agent,FTA),指需 要运行批量作业的各系统平台。 (二)实验环境配置 实验环境由三大类系统平台组成,一是主机平台, 用作主控域管理器,硬件可选择IBM Z系列主机,建 为了解决上述问题,数据中心正在积极寻求技术途 径,实现批量作业的跨平台统一调度。目前业界正在推 广的技术解决方案主要基于IBM TWS(Tivoli Workload Scheduler)以及BMC CONTROL—M等工具。本文从技术 议采用业界常用的并行耦合体(Parallel Sysplex)部署 结构,安装Tws For Z/OS 8.2或更高版本的工具软件; 二是开放平台,包括两个域管理器和两个容错探针, 硬件可选择IBM,H趿SUNzb型机,全部安装Tws For UNIX;三是Windows平台,包括两个容错探针,硬件可 实施的角度介绍如何利用IBM Tws实现跨平台的批量调 度,并分析跨平台批量调度和业务连续性之间的关系。 选择IBM PC ̄JE务器,安装TWS orF Windows。 86』201 1年・第i期欢迎登录www.jrdn.cn ———一一一一一一一一一 r一一一一一一一一——I PaParralleelSysplexJ{ 【部稽结构 l AIXJ ̄放 P台WindowsJ] ̄务器 I Windows ̄务器SUN开放甲台 I FTA-1 FTA.2 I FTA.3 FTA-4 L-………… ………一一 图1跨平台批量调度系统架构 此外,在一台PC服务器上安装TWS JSC(Job Scheduling Console),与主控域管理器连接,为用户提 供基于Windows的可视化的操作界面。 (三)系统客户化 在实验系统的客户化方面,主要有以下一些实施 要点。 1.配置通信参数 在主机平台上配置TCP/IP和IPSEC等参数,为各个 平台分配统一的网络端口,在路由控制上保证各平台间 的网络双向联通。在主机平台上配置用以兼容Unix的 OMVS环境,保证主机平台和开放平台之间TWSI具通 信正常。 2.配置域拓扑结构 在主机平台上配置各个域的拓扑结构,如系统名、 操作系统版本、IP地址、网络端口等,以便主控域管理 器定位所有的域管理器及容错探针。 3.设置用户权限 主控域管理器在调度各个容错探针上的批量作 技术应用・研究 栏目编辑梁春丽E maiMianglizi505@l 63 corn 业时,会附带一个处理批量作业的用户,此用户权限 应按照“最小授权”原则,能且仅能处理权限以内的 批量作业。 4.实现系统高可用性 主控域管理器部署在主机平台上,采用动态分 配虚拟IP地址等技术,同时依托主机平台的Parallel Sysplex结构,保证主控域管理器具备高可用性。两个域 管理器部署在开放平台上,采用HA技术,保证域管理 器具备高可用性。 (四)批量作业调整 为保证批量作业在功能逻辑上符合跨平台集中调 度的要求,需要对批量作业进行一定的调整,调整的原 则是“顺序分拆,功能明确,信息量化,纠错统一”。 具体的将原先较为复杂的批量作业按照流程顺序 分拆成若干功能明确的子批量作业,子批量作业以数字 返回码的方式向所在平台上的TwS工具反馈作业执行 结果,最后由用户在主控域管理器按照统一的标准进 行纠错控制。 (五)实验测试流程 设计一个比较典型的跨平台批量作业测试流程, 共有7个批量作业,其中主机平台2个作业,开放平台3个 作业,Windows平台2个作业。 在没有实施跨平台调度之前,批量处理顺序如图2 所示。流程中存在7个手工中断点,在图2中用数字圆圈 标注,每个中断点均需要操作人员人工判断作业执行 情况。 为实施跨平台批量调度,对部分批量作业进行了 分拆调整,调整后批量作业数量增加为10个,人丁干预 点从7个减少为零个,批量处理流程如图3所示。 (六)实验效果 在实现跨平台批量调度之前,操作人员无法集中 调度各个平台的批量作业,批量处理中需要大量的人工 干预,时间延迟较长,出现操作风险的几率也较大。在 实施跨平台批量调度后,批量处理不再需要人工分散 干预,用户完全通过Tws工具实现批量的自动化处理 和集中控制,并通过运行在Pc服务器上的JSC实现更为 良好的可视化操作。 基于TWS的跨平台批量调度系统还可提供一些附 加功能。例如,与主流报警平台无缝对接,提供异常事 件的实时报警;监测批量处理压力及时间窗口,实现早 期预警;提供较为完善的报表功能,实现批量处理的统 201 1年・第1期欢迎登录w .jrdn.on 『87 研究・技术应用 栏目编辑粱春丽E-mail:lianglizi505@l63 corn 图2调整前的批量测试流程 图3调整后的批量测试流程 计、分析和审计等。 理流程,解决以往因平台不同和技术不兼容而导致的 流程异构和制度繁杂等问题,改变以往分散管理的被 三、跨平台批量调度与业务连续性的关系 在大型数据中心的工作实践中,跨平台批量调度 有更为广泛的现实意义,对于提高数据中心的业务连 续性管理水平有重要意义。 (一)规范操作流程,提升运行维护自动化水平和 动局面,实现操作流程的规范化和标准化。 在跨平台批量调度系统中,批量作业以自动化调度 处理为主,人工干预和信息判断的环节大大减少,避免 了因误操作和处理不当等人为因素诱发的系统异常,提 升了运行维护流程的自动化水平和安全等级,降低了操 作风险。 降低操作风险 通过实施跨平台批量调度,可以在统一的技术框 (二)优化资源配置,提高运行维护可靠性和增强 整体控制能力 通过实施跨平台批量调度,可以减少操作人员的 架下,实现对不同系统平台下批量处理的标准化管理, 按照统一的技术标准制定覆盖所有平台的运行维护管 88 f 201 1年・第l期欢迎登录wⅣw.jrdn.cn 手丁操作数量,降低工作复杂度,为进一步优化人力资 源配置和提高人员技术水平提供了条件: 利用跨平台批量调度系统提供的实时监控和报表 分析等功能,可以解决以往存在的批量监控手段贫乏 和批量故障响应不及时等问题,实现对事前、事中和事 后等所有环节的全面控制,提高运行维护工作的可靠 性。利用丰富的系统资源,深入开展对批量处理的流程 审计T作,及时发现流程中存在的各类风险隐患,制定 并完善相应的应急预案和业务连续性计划,增强信息 系统的整体控制能力。 (三三)实现技术创新,完善准人制度 通过深入研究跨平台的批量调度技术,探索技术 转化的有益途径,可以不断创新运行维护的技术手段, 逐步建立起跨平台的各类运行维护标准。 在此基础上,可以有效梳理批量处理和联机应 用的关联关系,将两者视为一个有机联系整体统筹 考虑,在应用系统J:线投产前提出具有针对性的批 量处理要求,完善应用系统的准入制度,解决由于批 量流程设计不完善而引发的各类投产问题,提高新上 线业务系统的连续服务能力,增强信息系统的整体管 理水平。 (四)满足监管要求,健全管理机制和提升核心竞 争力 跨平台的批量调度系统可以帮助数据中心更好地 提升工作水平,以满足监管部门的相关要求。 在中同银监会2010年下发的《商业银行数据中心 监管指引》第四章“运营维护管理”中对于运行维护 操作有明确的要求,即“应统一调度各项运维任务,协 调解决各项运维任务冲突”。通过引入跨平台的批量 调度技术,可以帮助数据中心建立起更为先进的运行 维护管理理念,健全管理机制,全面实现运行维护工 作的统一调度,切实降低各项运行维护任务发生冲突 的可能性:实施跨平台的批量调度,不仅可以提升数据 中心的运行维护水平,而且可以有效提升联机应用系统 的后台支持水平,增强业务连续性管理水平,从根本上 提升核心竞争力。 在巾同银监会2009年下发的《商业银行信息科技 风险管理指引》第七章“业务连续性管理”中规定“商 业银行应根据自身业务的性质、规模和复杂程度,制定 适当的业务连续性规划,以确保在出现无法预见的中 断时,系统仍能持续运行并提供服务”:在实施跨平台 技术应用・研究 栏目编辑粱春丽E—maii:lianglizi505@1 63 COrn 批量调度后,相应的运行维护规范和流程将发生较大 变化,批量处理的安全等级将大幅提升。数据中心可以 在新tg ̄lt量处理架构 梳理和修订业务连续性计划, 丰富演练场景和演练内容,重新评估数据中心的业务 连续性管理水平,更好地适应业务发展的需要,提升数 据中心的核心竞争力。 四、结论 跨平台的批量调度技术不仅可以帮助数据中心 适应复杂平台下的运行维护要求,而且可以帮助数 据中心在制度规范和维护流程等方面实现标准化管 理,在制度创新和满足监管要求等方面提升T作水 平。跨平台的批量调度为数据中心提高业务连续性 管理水平提供了一条行之有效的途径,将在未来得到 更为广泛的应用,为数据中心提升核心竞争力提供有 力的支撑。 参考文献: [1]顾大伟,郭建兵,黄伟.数据中心建设与管理指 南[M].北京:电子工业出版社,2 01 0. [2]MI1 ind Goveka r.MagiC quadrant for job schedu 1 ing,gar tner RAS core research[DB/OL]. htt P://WWW.ga rtne r.com/t echnol ogY/medi a— Product S/reprint S/bmc/a rtiCle1/a rtiCle1.htm1. 2 009. [3]Va Sfi Gucer,Mi chael A.LowrY.Fi Fin Ba St rup Knudsen.End—tO-End Scheduling wi th IBM t iVOl i WOrk1oad Scheduler V8.2[DB/OL]. ftp://www.redbookS.ibm.com/redbookS/SG24 6 624, 20O4. [4]Va Sfi 6ucer,Satoko Egawa,David 0swald, et a1.High availabilitY Scena rios with IBM t i vOl i WOrk1 Oad SChedu1 e r and IBM t i vO1 i f ramewo rk[DB/OL].ftp://www.redbook S.ibm. com/redbook s/sc24 66 32.2 004. [5]吴跃.加强信息科技监管,不断提高我国银行业 信息化建设水平[J].中国金融电脑 2 01 0. [6]骆絮飞.银行业IT治理与信息科技监管….华 南金融电脑,2 01 O. 2011年・第1期欢迎髓录wwwjrdn.cn I 89