群发消息类业务的广泛应用,不仅为用户提供了大量的有用信息,为政府部门提供了便利的宣传渠道;同时也为商家拓展了便捷的广告手段,为消息业务服务提供商带来了巨额的经济效益。但不可否认,目前群发消息通常没有确定的发送目标,而多采取广播式的发送方式,在很大程度上给用户形成严重的骚扰。然而,用户也没有适合的方式来选择需要的消息,只能被动盲目地接收消息。为使用户可以有选择地接收自己希望得到的消息,而不是被迫接收消息,我国特制定了YD/T 1902-2009《消息类业务内容分类技术要求》的通信行业标准,目的是在群发消息发出之前,就在消息中加入消息类业务内容分类代码,进而用户在接收时可以选择接收需要的消息,同时屏蔽不需要的消息。基于消息类业务内容分类代码的实施,不仅可以规范群发消息服务提供者相关行为,提升服务水平,还可以保护用户免受垃圾消息的滋扰和侵害。同时,可以提升行业主管部门专业性监管能力,配合相关的监管策略,去莠存良,使群发消息类业务得以健康发展。
欲更多了解短消息中心设备技术要求的请进入。
YD/T 1902-2009描述了消息类业务内容分类总体技术要求,规范了消息类业务分类编码方案和分类代码表,并且对消息分类编码在消息类业务中具体实施进行了具体技术规范。主要适用于消息业务提供商提供的群发广告消息类业务,其他消息业务可参照执行。
一、总体要求
消息类业务最大的特点就是采用“主动发送,被动接收”的工作模式进行传输,用户并不知道发送者发送的是什么内容的消息,在这种情况下只有被迫接收到以后才能判断该消息是否是自己需要的。往往在这种情况下,用户己经受到垃圾消息的骚扰。为了便于用户有选择地接收需要的消息,有必要通过技术手段最大限度地解决消息识别问题。
根据消息类业务的特点,解决消息内容识别并且进行分类最有效的方法就是在消息源头使用合理有效的编码方案对要发送的消息进行分类编码,并且把相应代码添加到消息体前面作为消息内容分类依据,从而保证所有消息具备消息内容分类特征以备后期识别判定使用。在现实生活中,消息类业务内容涉及社会生活的方方面面,制定出一套合理有效的编码方案并不容易。为了确保该编码方案可以真正满足消息过滤业务的需要,制定消息类内容分类编码方案应满足下表1的原则性要求。另外,消息类业务中消息内容空间往往有一定限制,例如短消息业务内容代码空间只有140个字节。故此,消息类业务内容的分类代码要求尽量简短。同时消息类业务内容分类代码尽量使用等长代码,这样,消息过滤实体或者消息监听实体就可以在不分析消息体内容的情况下,直接按照字节位直接读取分类代码进而识别消息类别。
表1:制定消息类内容分类编码方案应满足的原则性要求
二、分类编码方案
消息类业务内容包罗万象,涉及社会经济生活的方方面面,而国民经济行业分类是对杜会经济活动进行的分类,是社会经济行业划分的基本依据。因此,基于国民经济行业的分类是最适合消息类内容分类的分类方法。在进行国民经济行业分类时候,通常采用经济活动的同质性原则进行行业类别的划分。即每一个行业类别都按照相同性质的经济活动归类,而不是单单依据行政事业编制、会计制度和部门管理归类。根据国内外经济实际情况,国民经济行业分类适合采用线分类和分层编码的方法,划分为门类、大类、中类和小类四级,其各级的含义详见下表2-1。门类分类结构成树状结构,其中,门类采用英文字母代码,大类、中类和小类采用阿拉伯数字代码。分类信息采用等长编码,代码长度总长为5,其编码规则详见下表2-2。相应编码结构如图2-1 所示,分类代码与消息内容之间以空格作为分隔符。因此,分类代码加分隔符一共占用6个字符的长度。
表2-1:行业四级分类的含义
表2-2:行业四级分类的编码规则
图2-1:行业四级分类的编码结构图
根据我国国民经济情况,国民经济生活可以分为20个门类, 97个大类, 473个中类, 1380个小类(2017版的数据)。具体分类代码表详见GB 4754第5 章,表2-3给出了门类代码表。大类、中类和小类依据其归属的上位类而各有不同。图2-2是以住宿和餐饮业(Ⅰ)为例进行的编码划分。
表2-3:门类代码表
图2-2:编码划分示意(住宿和餐饮业)
温馨提示:GB 4754《国民经济行业分类》的版本是在不断更新的,目前已经历了1984年、1994年、2002年、2011年和2017年5个版本,最新版本2017年版已于2017年10月1日实施。而YD/T 1902编制时是参照GB 4754-2002版本的数据,因此,在施行YD/T 1902时,应以GB 4754的最新版本为依据。若要详细了解2017年版GB 4754的具体内容的请查阅下附件2。
附件2:GB 4754-2017《国民经济行业分类》
三、分类编码对消息容量的影响
短消息主要传输文本消息,有三种编码方式(见ETSI GSM 03.40):7-bit编码、8-bit编码、16-bit编码。7-bit编码、8-bit编码用于发送普通的ASCII字符;而16-bit编码用于发送Unicode字符。由于短消息通常利用信令信道传输,受限于信令信道传输容量,短消息内容最多为140个字节,因此在这三种编码方式下,可以发送的最大字符数分别是160、140、70。若要发送中文,必须采用Unicode编码方式。中文短消息通常采用Unicode编码,由于分类代码加分隔符占用6个字节,故此在同一个短消息内还可以编写67个中文字符或者134个英文字符。
欲详细了解Unicode编码技术的请进入。
多媒体消息可以传输文本、声音、视频等多种媒体,通常采用SMIL格式编码。由于多媒体消息采用业务信道传输,故此传输容量较大,多媒体消息内容最多为100K个字节。但是分类代码加分隔符占用6个字节,基本上可以忽略不计。
四、分类编码实施
1、对消息业务提供商和消息业务运营商的要求
分类编码的实施,首先应对消息业务提供商和消息业务运营商提出相应的要求,具体详见下表4-1。其中业务运营商的分类代码验证示意图如下图4-1所示。
表4-1:对消息业务提供商和消息业务运营商的要求
图4-1:运营商的分类代码验证示意图
2、基于分类代码的消息过滤业务实施
消息过滤系统应可以从消息提取分类代码,并且利用该分类代码对相应消息进行基于消息类型的消息过滤。相应基于分类代码的消息过滤,既可以在前端业务接入设备(例如ISMG、WAPGW等设备)上实施;也可以在基于用户规则消息过滤平台上实施;还可以在用户终端上实施。这三种情况的实施具体详见下表4-2。同时,基于分类代码的消息过滤业务实施既可适用于公共过滤(基于公共过滤规则的消息过滤),也适用于个性过滤(基于用户规则的消息过滤)。
表4-2:基于分类代码的消息过滤业务的实施
欲详细了解基于用户设置规则的消息过滤业务的请进入。
以上简要的介绍了YD/T 1902-2009的技术要求的内容,若要详细了解该标准具体内容的请查阅下附件4。
附件4:YDT 1902-2009《消息类业务内容分类技术要求》
欲进一步了解我国消息类服务接入代码编号方案的请进入。
5.68MB
434.2KB