毋庸置疑,语音质量是公网对讲产品影响用户体验最重要的指标,早期公网对讲产品不成功的主要原因也是实际用户体验到的音质达不到可接受的范围。从模拟对讲发展到数字对讲,主要解决三个问题,提升语音质量、增强保密性和提高频谱利用率,首当其冲就是要改善语音通信质量,特别是复杂电磁环境和远距离传输时的语音通信质量。公网对讲作为“数字对讲”技术之一,其语音质量又如何呢?在4G宽带移动网络支持下,公网对讲能带给我们更好的音质体验吗?捷思锐的集群通(GQT)系统又是如何考虑这个问题的?本文将逐一为你解答。
衡量语音质量的指标
衡量通信系统语音质量主要有两个指标,一是接收端语音的MOS分;二是端到端语音延时。
MOS分(Mean Opinion Score,平均主观意见分)用于衡量经过通信系统压缩编码传输后恢复语音的“还原度”,包括可懂度、清晰度和自然度,采用5分制打分(5优,4良,3尚可,2差,1劣)。传统PSTN有线电话的语音质量一般定义为MOS 4.0分,2G无线电话的语音质量为MOS 2.5-4分之间,3G移动电话系统采用的语音编解码算法可以达到4分以上。
端到端语音延时,用于衡量通信系统的实时性,延时过大将极大影响交互沟通的用户体验。传统PSTN电话的端到端语音延时小于16ms;IP电话系统一般要求端到端语音延时小于300ms;卫星电话端到端语音延时大于500ms。通常我们在打IP电话或卫星电话时,会感觉到对方反应“迟钝”,造成沟通不畅,就是因为端到端语音延时过大造成的。基于IP网络协议的公网对讲系统,其端到端延时往往大于几百毫秒,也是影响用户体验的重要指标。
影响公网对讲语音质量的主要因素
影响公网对讲音质的主要因素
如图所示,影响公网对讲音质的主要因素分为两大部分,一部分是终端硬件因素,包括麦克风、喇叭、声腔结构和音频电路等;另一部分是平台系统设计因素,包括语音编解码算法、音频增强算法、传输策略和服务器处理机制等。本文重点介绍公网对讲平台对用户音质体验的几个因素。
1)语音编解码算法(也称为声码器),是决定公网对讲平台所能提供的语音质量的根本因素。换句话说,如果平台所采用的语音编解码算法所能提供的语音质量就很差,终端硬件的音频设计再好也无法根本性提高语音质量。现有公网对讲平台主要采用三类语音编解码器,第一类是早期支持2G CDMA网络的平台,采用EVRC变速率声码器的半速率(4Kbps)编码,其音质较差,MOS分只有 3.0分左右;第二类以支持3G 移动网络为出发点,采用3GPP AMR变速率声码器(4.75Kbps-12.2Kbps),其全速率编解码音质可 达到MOS 4.0分以上;第三类是脱胎于VoIP系统,采用ITU G.72x语音编码标准,可根据终端能力匹配来选择编解码算法。
2)语音增强,主要包括环境噪声抑制、自适应声学回声消除、自动增益控制、自适应均衡等算法。语音增强技术应用的有无或好坏,很大程度上影响了产品的用户音质体验。
3)传输策略,基于无线IP网络传输的公网对讲系统,必须面对丢包、抖动、乱序等网络传输因素对音质的影响,因此必须设计一套有效的传输策略来对抗这些网络特征对语音质量产生的负面影响。所以说,对于OTT体制的公网对讲平台,实现公网对讲业务基本功能并不难,在好的网络环境下“演示”效果也可能会表现不错,但用户真正使用的时候就会出各种各样的音质问题。因此,对公网对讲平台而言,难的是如何在不同的网络环境下提供很好的用户音质体验。
4G公网对讲的语音质量能不能大幅提升?
使用2G网络的公网对讲用户已经熟知2G公网对讲机音质差、语音延时大的问题,在2G公网对讲机向4G公网对讲机过渡的过程中,用户必然会问,4G网络带宽大,传输速度快,语音质量是不是也能大幅度提高呢?答案是“不一定”,4G公网对讲完全有条件大幅度提升语音质量,但并不是采用了4G终端就能提升语音质量,而是取决于平台的系统设计能否有效利用4G网络的带宽优势。
如前所述,公网对讲系统音质的好坏的根本因素是采用什么样的语音编解码器,如果平台只能支持低码率低质量的语音编码器,也没有根据4G网络的优势调整传输控制策略,不能充分利用4G网络的带宽优势,4G公网对讲机也就徒有虚名,并不能给用户带来大的音质体验提升。
集群通(GQT)系统的语音业务设计
集群通平台的语音业务设计充分继承了捷思锐融合通信的技术基础架构,支持多声码器互通,支持用户可配置语音编解码算法,具备充分调优的语音增强算法和自适应传输网络环境的传输控制策略。
集群通平台主声码器采用3GPP AMR多速率声码器,编码速率从4.75Kbps到12.2Kbps可根据用户或网络条件配置,该声码器的MOS分最高可达4.2分。同时,由于集群通系统架构支持多声码器互通,在4G网络条件下可以后向兼容引入新的更高质量的语音编码器,如OPUS音频编码器,达到更高的语音通信质量。
在网络传输策略上,集群通系统支持自适应的传输控制算法,端到端语音延时(实际用户体验到的时延)可以控制在200ms到500ms,大大优于目前大部分2G公网对讲平台的1000ms端到端时延指标。
综上所述,集群通平台的语音业务设计采用的是可扩展的系统架构,随着网络环境、用户需求、业务应用的演进,音频业务服务质量也可以同步不断改进。