Depression recognition using a proposed speech chain model fusing speech production and perception features

摘要

基于语音的抑郁识别可作为早期筛查的重要辅助工具,但现有方法多关注语音感知特征,较少考虑发声系统变化。本研究提出一种用于抑郁识别的机器语音链模型(MSCDR),从语音产生到语音感知捕获与文本无关的抑郁语音表征。研究提取线性预测编码和梅尔频率倒谱系数来表征语音产生与感知,并利用深度序列建模捕获段内与段间抑郁特征。两个公开数据集上的实验准确率分别达到 0.77 和 0.86,说明语音产生与感知特征在抑郁分析中具有互补价值。

关于本文的更多详情,请访问此链接

下一页
上一页