Depression recognition using a proposed speech chain model fusing speech production and perception features

Minghao Du, Shuang Liu*, Tao Wang, Wenquan Zhang, Yufeng Ke, Long Chen, Dong Ming*, Journal of Affective Disorders, 2023, 323:299-308.

Feb 15, 2023

PDF 项目 DOI

摘要

基于语音的抑郁识别可作为早期筛查的重要辅助工具，但现有方法多关注语音感知特征，较少考虑发声系统变化。本研究提出一种用于抑郁识别的机器语音链模型（MSCDR），从语音产生到语音感知捕获与文本无关的抑郁语音表征。研究提取线性预测编码和梅尔频率倒谱系数来表征语音产生与感知，并利用深度序列建模捕获段内与段间抑郁特征。两个公开数据集上的实验准确率分别达到 0.77 和 0.86，说明语音产生与感知特征在抑郁分析中具有互补价值。

类型

期刊文章

出版物

Journal of Affective Disorders

关于本文的更多详情，请访问此链接。

期刊论文