服务等级协定(SLA,Service Level Agreement)是信息技术和服务管理领域的一个核心概念。随着社会和技术的发展,电信用户对电信服务质量(QoS)的要求也越来越高。为了管理具有QoS的电信业务,服务等级协定(SLA)被国际电信联盟(ITU)和电信管理论坛(TMF)提出来,解决用户和服务提供商之间有关保证服务质量的问题。SLA是服务提供商和用户双方之间的协商协定,是存在于服务提供商和用户之间的一个合约(或者合约的一部分),是在服务品质、优先权和责任义务等方面达成的协议,是一种电信服务评估标准。
欲具体了解电信服务介绍的请进入。
一、引述
1、SLA的起源
服务等级协定(SLA)起源于电信服务,SLA的诞生,是市场对电信服务质量进行规范化管理的必然结果。早在上世纪八十年代,随着当时的电信运营商之间竞争的加剧,以及客户(包括企业客户)对通信线路稳定性的要求越来越高,电信运营商开始通过正式的文件向客户承诺服务质量,例如线路的可用时长和故障修复时间等,以此建立市场信任和差异化优势。到了90年代,随着电信运营商将IT基础设施和支持的服务大规模外包,客户迫切需要一份具有法律约束力的文件,来明确什么是好的服务,以及如果服务不达标怎么办。于是SLA真正开始扮演其核心角色。
2、SLA的定义
在ITU-T的建议书E.800《有关服务质量的术语定义》和E.860《服务等级协定(SLA)框架》中给出了服务等级协定(SLA)的定义,具体详见下表1-2中,两者的具体表述虽有不同,但可从不同视角加深对SLA的理解。
表 1-2:ITU-T对SLA的定义
3、SLA的标准化
于是,根据ITU的要求,电信管理论坛(TMF),当时叫网络管理联盟(NMF)制定了服务等级协定(SLA)的相关标准,最直接的是指TMF 701《Performance Reporting Concepts and Definitions(绩效报告概念与定义)》和TMF GB 917《Service Level Agreement(SLA)Management Handbook(SLA管理手册)》,旨在统一SLA参数框架与生命周期管理方法,支撑运营商与客户间的服务质量承诺。它们已经历了多个版本的更新,就GB 917已形成多卷(Volume),其中GB 917《SLA管理手册,第2卷:概念与原则( 2.5版)》旨在实现的目标可见下表1-3-1所述。
表 1-3-1:TMF GB 917标准旨在实现的目标
TMF 701和TMF GB 917是SLA最基本的标准,TMF通过一系列核心文档定义了SLA管理的具体规范,具体详见下表1-3-2的介绍。由该表可以理解TMF的SLA标准体系框架,如下图1-3所示。TMF对SLA的标准化工作贯穿其“新一代运营支撑系统(NGOSS)”及演进后的Frameworx体系,核心思路是:将SLA管理嵌入到电信运营商完整的业务流程、数据模型和系统集成框架中,使其可测量、可执行。总的来说。其特征表现请详见下表1-3-3所述。
表 1-3-2:TMF的SLA管理具体规范系列核心文档介绍
图 1-3:TMF的SLA标准体系框架
表 1-3-3:TMF关于 SLA标准的特征
欲具体了电信管理支撑系统(NGOSS、eTOM等)介绍的请进入。
另外,ITU-T Rec E.860《服务等级协定(SLA)框架》描述了SLA的通用结构,采用独立于具体服务类型和技术的通用方法。国际标准化组织(ISO)从2016年开始发布ISO/IEC 19086系列标准《信息技术-云计算-SLA框架》,其专门针对发展迅猛的云计算服务,提供了一个统一、清晰的框架。
欲详细了解这两个标准内容介绍的请进入:SLA的通用结构;云服务等级协定(CSLA)
二、SLA的内容简介
下述依据电信管理论坛(TMF)制定的服务等级协定(SLA)的相关标准,对SLA的关键内容给予简介。
1、SLA的管理需求
服务等级协定(SLA)的目地是营造网络运营健康发展的生态环境,让用户享受到的不仅仅是一种口头承诺的服务,而是受到法规约束,权益获得有效保障的服务。成熟的电信运营商通过SLA可以建立忠实稳定的大用户;而新兴的电信运营商则可以借此来吸引用户,赢得竞争优势。为了能够准确定位SLA的管理内容和SLA管理的重要意义,需要深入理解和分析SLA的管理需求。SLA的管理需求分为下表2-1所述的4个方面,其中,前3个方面遵循增强的电信管理运营图(eTOM)商务处理模型,分别涵盖业务实现阶段、业务保障阶段和用户接口管理,第4个方面是其它一些管理需求。
表 2-1:SLA的管理需求
2、SLA的核心构成框架
根据TMF的相关标准文档, SLA的基本内容包括了SLA参数的定义和计算、SLA表示方法、SLA管理方法等等。总的来说,通用的SLA通常由下图2-2所示的五大核心模块构成,形成从范围界定到责任闭环的完整逻辑;下表2-2给出了五大模块的说明。
图 2-2:SLA核心模块构成框架
表 2-2:SLA核心构成模块说明
3、SLA的服务等级目标(SLO)
服务等级目标(SLO,Service Level Objective)是SLA的核心目标,也是SLA中最核心的技术内容,它将服务质量抽象为可量化的指标。常见的SLO可以分为以下几类:可用性、性能、可靠性、支持质量、数据完整性等,具体详见下表2-3的描述。优秀的SLO遵循 SMART原则,即:具体的(specific)、可测量的(measurable)、可达到的(achievable)、与服务价值相关的(relevant to service value)、有时限的(time-bound)。
表 2-3:SLO分类的描述
4、SLA的关键参数的计算和测量
SLA仅仅列出指标是不够的,SLA必须明确定义每个指标的测量方法、统计口径、排除条件,否则会为争议埋下隐患。譬如,可用性是SLA中最常见的参数,但其计算方式存在差异,必须在协议中明确其计算维度及要求,详见下表2-4-1的所述。再如,在涉及技术支持质量指标中的响应时间,通常需要明确定义故障等级,即P1(紧急)~P4(轻微)四个等级,其等级划分详见下表2-4-2。
表 2-4-1:可用性的计算要求
表 2-4-2:响应时间的故障等级划分
还有,对于性能指标,行业上标准做法是使用百分位数而非平均值,因为它能更真实反映用户体验。平均值的缺陷是一个极端慢的请求会拉高平均值,掩盖大多数用户的良好体验。百分位数的优势是第95百分位数(P95)表示95%的请求都在该时间内完成,能有效剔除极端情况,反映主流体验。例如:某API的SLO约定“P95延迟 ≤ 300ms”,意味着在统计周期内,95%的API调用响应时间都不超过300毫秒。
5、SLA的补偿机制
SLA的补偿机制(SLA Credit)是约定服务未达标时的赔偿方式,SLA的最终保障是补偿机制,其设计通常遵循下表2-5中的原则。
表 2-5:SLA补偿机制的设计原则
综上,一份严谨的SLA,其内容构成可以概括为下表2-n所述的4个层面,这四个层面的有机结合,才能让SLA从一纸文件(合约),真正成为驱动服务质量持续改进的管理工具。
表 2-n:SLA内容构成的层面
三、关于SLA、 QoS与网络性能(NP)的关系
1、概述
服务等级协定(SLA)、服务质量(QoS)和网络性能(NP)是网络服务领域中三个紧密关联但又层次分明的概念(在表1-2中已列出了ITU对三个术语的定义,下表3-1列出了三者的概念解读)。理解它们之间的关系,有助于厘清从技术实现到商业承诺的完整链路。
表 3-1:服务等级协定(SLA)、服务质量(QoS)和网络性能(NP)的概念解读
欲更多了解NP与QoS介绍的请进入:网络性能(NP);服务质量(QoS)
2、三者关系
直观来说,三者可以概括为:NP是基础,QoS是手段,SLA是目标与契约。下表3-2从技术实现层次和应用实现层次分别阐述了三者的关系。三者构成了一个从物理基础到技术实现再到商业承诺的完整闭环。没有良好的NP作为基础,QoS就成了无米之炊;没有QoS机制的有力支撑,SLA中的承诺就难以真正落地;而没有SLA的商业约束,对NP和QoS的建立也可能缺乏明确的目标与衡量标准。
表 3-2:从技术实现层次和应用层次阐述的三者关系
欲进一步了解我国电信服务规范的请进入。