清晰度(Clarity)
清晰度是一个多变量的尺度,从清晰稳定到粗糙或嘈杂的音调。例如,带有大量气声或低频喉音的声音被认为清晰度较低,而音色清晰的声音则被认为清晰度较高。这个概念与谐噪比(Harmonic to Noise Ratio, HNR)很相似。
谐噪比(Harmonic to Noise Ratio)
谐噪比(HNR)主要用于描述声音的嘈杂程度。
声音由谐波(harmonics)和噪声(noise)组成。谐波在频谱图上表现为水平线,而噪声则出现在谐波之间,可能由声门收缩、气声 或其他因素引起。下图展示了左侧的清晰模式和右侧的嘈杂模式。这被称为声音的清晰度,但它主要指噪声成分,而不包括鼻音或舌根收缩(tongue root retraction)等影响音色的因素——这些可能会让声音有点怪。
导致谐噪比低的主要原因:
- 声门外展 (气声)
- 假声带收缩 (FVF) constriction
- 低频喉音 以及 喉音震颤 (creak)
掩盖因素(Covers)
掩盖因素指任何能掩盖、改变或伪装声音整体音质的因素。例如,鼻音就是一种掩盖因素。
常见的掩盖因素:
- 鼻音(Nasality)
- 舌根收缩(Stitch Voice)
- M2(假声)或音重过低