物理描述
语言在传输过程中,混响、失真、噪声(信噪比)等因素都会导致音位的包络函数发生变化。从而导致语言可懂度恶化。研究 m(或调制指数)的变化,即可确定语言可懂度恶化的程度。
连续的语言信号可以认为是一系列被称为“音位 phoneme”的语音碎片组成的。而“音位”又可以认为是一个窄带噪声被发音器官的极低频运动所调制而形成,在时域上表现为一个以某种窄带噪声为载波的调幅波。因而,每一个音位都有自己的包络函数,语言所传递信息就包含在该调幅波包络之中。下图示一个音位的包络及其包络的频谱。包络频率F 约在 0.2~12.5Hz 之间。频谱的相对量值是用调制指数表示的,m 是各调制分量对载波的调幅度。
一般用语言传输指数 STI (speech transmission index)来描述语言清晰度的好坏。
测量方法传统方法按照相关标准,由发音人发出语言单位(句、词或音节),经语言传递系统,考察听音人正确识别的比率。
具体的操作步骤需按照标准 PB-words, CVC 或 SRT。尽管这种方法可以测得语言清晰度,但是要进行这样的测量需花费很长时间并且花费巨大,并且在一些对人体有害的位置这种方法也不可行。因此,这些方法主要用来验证候补的测量方法。
科学方法回溯到 1940 年,贝尔实验室开始研究确定语言清晰度的量测技术。那些很成熟的算法,比如 SII(语言清晰度指数)和各种形式的 STI(语言传递指数)都是可以很好的量测语言清晰度。这些测量方法考虑了很多对语言清晰度有影响参量,比如:
语言声压级
背景噪声声压级
反射
混响时间
心里声学效果(掩蔽效应)
ST****I 法
STI 法,即“语言传输指数 “speech transmission index” 法。
该法用人工合成的测量信号进行测量。其信号在模拟一个“音位”的基础上,考虑到以下诸因素:平均语声谱、频率计权、听觉掩蔽效应、听觉门槛、由非线性和非线性互调引起的谐波分量(正确的设计可以使这些分量变成干扰测试信号的噪声而不是无法从当前测试信号中分离的谐波)等
STI 信号包含 7 个窄带噪声载波,其中心频率为
125Hz、250Hz、500Hz、1kHz、2kHz、4kHz、8kHz
每一个载波分别用14个极低频的简谐信号调制,调制信号的频率为:
0.63\0.80\1.0\1.25\1.6\2.0\2.5\3.15\4.0\5.0\6.3\8.0\10\12.5(单位为 Hz, 相隔 1/3 倍频程)
共有 98 个测量信号分量。
STIPA 法
由 STI 法派生出 3 种简缩版 (condenced version):
STITEL - 适用于长途通信 (STI for telecommunication systems);
RASTI - 适用于不用电声设备的、仅由房间声学特性决定的可懂度测量 (room acoustics STI);
STIPA - 适用于扩声系统(STI for pubblic address systems)。即适用于评价包括扩声系统和房间声学特性的语言传输质量。
与 STI 法不同的是,STIPA 法把测量信号矩阵简化了。主要是只选用 12 个调制频率,且每个载波只有 2 个调制频率,其构成如下:
|| ||
这样,98个测量信号便缩减为14个。
STIPA 是在广泛的科学研究下得到的标准化的结果。但与 RASTI 不同的是,在 2 年内已经有 4 家国际测试仪器制造商采用了 STIPA 的方法并提供了解决方案。由于其精确的测试结果和较短的量测时间(15s),可以这样说 STIPA 是世界上测量语言清晰度应用最广泛的方法。
应用案例语言清晰度对信息传递极其重要。
例如:建筑群中的公共广播系统必须具有在紧急情况下指导人群逃生方向的能力。这些建筑群包括机场,火车站,购物中心或者音乐厅等。尽管如此,如果由于广播系统质量差而导致人群不能听清楚播放的通知,而不能安全逃离,由此导致的后果可能非常悲惨。因此设计,安装并且验证公共广播系统的语言清晰度是必不可少的。此外,还有很多其他应用(比如法律和医疗方面),也会应用到语言清晰度为其提供佐证。12