听觉是仅次于视觉的重要感觉。风声雨声、鸟鸣虫唱、人与人的交谈、高雅的交响乐、嘈杂的市井噪声……各种声音一直在耳边回荡。声音是振动引起的机械波,通过空气传入外耳道,再进入内耳。我们可以闭上眼睛,耳朵却无法“关门”。理论上说,连绣花针落地的声音都可以被人耳听见,但是很多声音并不会被传到听觉皮层进行处理,而是通过神经抑制被忽略了。可见,“听”不仅是耳朵的功能,也是大脑在选择想听的声音。
听觉研究要从耳蜗说起,耳蜗是位于内耳的一个蜗牛形状结构。1851年,年仅29岁的意大利解剖学家阿方索 ·柯蒂,发现了耳蜗的感音装置——螺旋器,它的下方是基底膜,上方是盖膜,中间是毛细胞(包括内毛细胞和外毛细胞)和支持细胞。当声波引起基底膜振动,毛细胞和盖膜之间会形成剪切力,使毛细胞顶部的离子通道开放,钾离子顺着浓度差进入毛细胞内引起感受器电位,声音就这样从机械波变成了电信号——神经系统可以编码的信号。
1951年,美国物理学家贝克西,在显微镜下对刚死亡的人体和动物耳蜗进行观察,只见声音引起的基底膜波动(行波)从耳蜗底部逐步向蜗顶移动。高频声引起的行波的最大振幅靠近蜗底,频率降低时行波的最大振幅逐渐移向蜗顶。最大振幅处的毛细胞产生感受器电位,传给相连的听神经并逐级上传到大脑皮层。贝克西的“行波学说”解释了频率编码原理,而频率是分辨各种声音的关键。“行波学说”是听觉研究的里程碑式的发现,贝克西因此获得1961年的诺贝尔生理学或医学奖。
1978年,英国地质学家坎普因为偶然的机会进入听觉研究领域。他想试试基底膜的振动会不会像地震波一样返回外耳道,于是用传声器记录外耳道发出的声音。令人惊讶的是,外耳道真的发出了声音,这种现象被称为“耳声发射”。坎普记录到的并不是回声,而是外毛细胞运动发出的声音。显微镜下可以看见:外毛细胞会像跳舞一样发生忽长忽短的伸缩运动。这种运动和肌肉收缩的原理不一样,它源自外毛细胞独特的细胞骨架和马达蛋白。外毛细胞运动使耳蜗主动地对某些声信号进行放大和提取,是听觉高灵敏度、宽动态范围、尖锐调谐特征和精确分辨率的必要基础。
声信号转换成电信号之后传给听神经,听神经穿过颅骨进入脑,依次经过耳蜗核、上橄榄复合体、外侧丘系、下丘及内膝体,最终到了听皮层。如果把听觉传导通路和视觉传导通路进行比较,会发现听觉传导通路结构更复杂、核团之间的调控也更多样。人类有数亿个感光细胞,却只有数千个感受声音的毛细胞,既然声信号的外周编码功能不够强大,就在中枢整合的过程中加以弥补。
声信号上传到听皮层的时候,只是被“听见”,它到底好不好听,表达什么意义,还需要听皮层之外的联合皮层等脑区协同处理。我们喜欢悠扬悦耳的旋律,这些旋律会激活脑的“愉快中枢”,令人心旷神怡。微风、雨滴、鸟鸣……大自然音乐也许是我们欣赏悦耳声音的缘起;自然界也有野兽爪子在岩壁上摩擦的尖响,这些是让人天生厌恶的刺耳声音。
听觉不仅是人与大自然互动的纽带,也是人与人沟通的桥梁。我们如何听懂对方在说什么?人类的发声过程中,每个元音有一系列特有的共振峰,而辅音决定了这些共振峰在时间上的过渡。即便每个人发声频率不同(音调和音色不同),大脑通过对这些共振峰及共振过渡的特征提取,可以将其转化为自己熟悉的词语。大脑进行这番分析与转换是根据经验完成,类似从茫茫人海中识别出一张熟悉的面孔。语音识别技术则是通过计算提取出语音的共振峰参数,并与声学数据库中的词汇进行对比匹配,类似用大数据的方法进行人脸识别。
随着年龄增长,听觉衰退更早于视觉衰退,远离噪声、减少耳毒性药物摄入、保证休息和健康饮食,将有助于我们耳聪目明。
(作者系华中师范大学副教授,中国神经科学学会会员)