大多数弱听人士高频听力的损失重于低频。部分弱听人士的高频听损严重,甚至无法听清言语中高频信息的词语。
此外,由于听力损失通常导致听声音失真,即使当言语声被足够放大时,人们仍然听不清高频的言语。更严重的情况是,对有些弱听人士而言,过度放大高频部分反而会影响中低频段言语的识别能力。
对于上述情况的弱听人士,为了使他们听到高频部分的言语,可采取以下方法:
将高频声信号转移到残余听力较好的中低频区域,这是移频助听器的技术原理。
频率向低频移动
图中显示,移频后,输出频率比输入频率低,例如箭头显示各个共振峰处的频率降低。此外,从声音强度来看,助听器给高频声音多放大些。
从上图中可以看到移频改变了频谱,术语称之为“频率位移”(frequency shifting),但一般都是向低频移动,所以用“频率降低”(frequency lowering)更贴切些。
这种向低频移动的技术遵循一些数学规则,其中一些规则可以通过信号处理技术来实现,让我们来看看都有哪些不同规则的移频技术。
1. 频率移转
有一种较简单的技术,称为频率移转(frequency transposition),即把所有频率降低特定数值。
假设,经过频率移转,输出频率比原来降低2000Hz。
频率移转的缺点:
此方法带来的弊端在于:0~2000 Hz的声音无法降低,保持在原来频率范围;但对于一些2000Hz频率上下的声音,比如摩擦音,由于降低2000Hz后,频率变化明显,失真大,导致弱听人士无法听清楚。
此外,又如何判断1000Hz的输出声是来自原1000Hz的输入,还是来自原3000Hz降低2000Hz后的输出呢?
图中显示,移频后,约1800~4500范围的输出频率存在重合,不能判断这部分频率是来自原输入频率段的,还是移频后的频率段。
如果把整个频率范围的输入声都降低2000Hz的话,那么输出频谱图就会是不同频率输入信号和降低频率后输出信号的组合。
这时,某个频率波段的共振峰,可能会被来自其他频率波段的言语信号所覆盖,例如前文说的1000Hz输出声。
对于许多高频听损较严重的患者来说,频率移转技术可帮助他们提升言语清晰度。但这只发生在,言语频段的信号没有被频率移转而不影响言语理解的情况。
条件化频率移转:
基于频率移转技术,有种补充方法可以减少同一频率变调的发生。
其移频原则是,当输入言语信号主要为高频时,才进行频率移转,称为条件化频率移转(Conditional frequency transposition),或动态言语编码(dymasic speech recording)。
此技术可以只对需要的声音进行频率移转,而不影响低频声音。
条件化频率移转可以提高患者对塞音、擦音、塞擦音的理解能力,且不影响鼻音和半元音的识别。
2. 线性频率压缩
另一种技术,叫做“频率压缩”(frequency compression),优点是输出频谱不会出现频率重合。当输出的频率与输入频率成固定比,称为“线性频率压缩”(linear frequency compression)。
图中所示移频为线性频率压缩,每个输出频率约等于相应输入频率的1/2,例如频率由2000Hz移至1000Hz。
在频率压缩的过程中,对应很明确,即每个输出频率都会对应一个输入频率。
增强型频率压缩:
在线性频率压缩的基础上,当输出频率等于增强后的输入频率,则被称为“增强型频率压缩”(power frequency compression),这种压缩方法和上述两种一致,即输入频率被压缩至更小的输出频率范围,如上图所示。
线性频率压缩的缺点:
频率压缩技术无法应用于整个频率范围,否则将影响声音效果。
虽然线性频率压缩保留了输入输出频率之间恰当的比例,有助于保持元音的特征和高保真的音质,但言语声的基频会被频率压缩比(frequency compression ratio)降低。
经过频率压缩后,孩子的声音听起来像成年女性,成年女性的声音听起来像成年男性。
而增强型频率压缩甚至无法保持频率比,导致压缩后的声音变得不自然、失真。
3. 非线性频率压缩
由于音调通常位于1500Hz以下的低频段,当只对1500Hz以上频率进行频率压缩时,基频不会发生改变。
此外,1500Hz以上的谐波并不是由听觉系统单独处理,即使高频谐波在移频后不再是谐波关系,但言语仍保留谐波的音质。
只降低高频的压缩叫做“非线性频率压缩”(non-linear frequency compression),具体的压缩量根据不同频率而不同,如下图所示,高于2000Hz的频率才压缩。
输入频率出现压缩的那个频率点则被称为“转换频率”“截止频率”“频率压缩阈值”或“起始频率”,上图中的起始频率即为2000Hz。
非线性压缩的输出与输入也呈一一对应关系,研究表明可提高言语识别率。目前,已在安静或高信噪比环境中下完成了效果评估。