编译:chux
出品:ATYUN订阅号
麻省理工学院的研究人员开发了一种神经网络模型,可以分析采访中的原始文本和音频数据,以发现指示抑郁症的语音模式。该方法可用于为临床医生开发诊断辅助工具,以便在自然对话中检测到抑郁症的迹象。
为了诊断抑郁症,临床医生采访患者,询问具体问题,例如,过去的精神疾病,生活方式和情绪,并根据患者的反应确定病情。
近年来,机器学习一直被认为是诊断的有用辅助手段。例如,机器学习模型可以检测指示抑郁的语音的单词和语调。但是这些模型倾向于根据个人对特定问题的具体答案来预测一个人是否抑郁。这些方法是准确的,但是它们依赖于被问到的问题类型,这样限制了它们的使用方式和位置。
在Interspeech会议上发表的一篇论文中,麻省理工学院的研究人员详细介绍了一种神经网络模型,该模型可以通过采访发现原始文本和音频数据,以发现指示抑郁症的语音模式。给定一个新的主题,它可以准确地预测个体是否抑郁,而不需要任何其他有关问题和答案的信息。
研究人员希望这种方法可以用来开发在自然对话中检测抑郁迹象的工具。例如,在未来,该模型可以为移动应用程序提供支持,以监控用户的文本和语音以进行精神痛苦并发送警报。这对于那些无法获得初步临床医生诊断的人来说尤其有用,因为有距离、成本的限制,或者缺乏相关意识。
论文第一作者,计算机科学与人工智能实验室研究员Tuka Alhanai说:“我们得到的第一个提示是,一个人可能快乐,兴奋,悲伤或有一些严重的认知状况,如抑郁症。如果你想以可扩展的方式部署抑郁检测模型……你希望最大限度地减少对你正在使用的数据的约束。你希望在任何常规对话中部署它,并从自然交互,个人状态中获取模型。”
CSAIL的高级研究科学家James Glass补充说,该技术当然可用于识别临床办公室临时谈话中的精神痛苦。“每个病人的谈话方式都不同,如果模型看到变化可能会提示医生,这是一种进步,看是否可以做一些帮助临床医生的辅助工作。”
该论文的另一位合着者是医学工程与科学研究所(IMES)成员Mohammad Ghassemi。
无上下文建模
该模型的关键创新在于能够检测指示抑郁症的模式,然后将这些模式映射到新的个体,而无需额外的信息。“我们称之为’无上下文’,因为你没有对你正在寻找的问题类型以及对这些问题的回答类型施加任何限制,”Alhanai说。
其他模型提供了一组特定的问题,然后举例说明没有抑郁症的人如何回应以及抑郁症患者如何反应的例子,例如,直截了当的询问,“你有抑郁症的历史吗?”它使用那些确切的答案,然后在被问到完全相同的问题时确定新个体是否抑郁。“但这不是自然对话的工作方式,”Alhanai说。
另一方面,研究人员使用了一种称为序列建模的技术,通常用于语音处理。通过这种技术,他们一个接一个地从抑郁和非抑郁个体的问题和答案中提供文本和音频数据的模型序列。随着序列的积累,该模型提取出有或没有抑郁症的人出现的语音模式。诸如“悲伤”,“低”或“向下”之类的单词可以与更平白且更单调的音频信号配对。患有抑郁症的个体也可能说话较慢并且在单词之间使用较长的暂停。在以前的研究中已经探索了这些用于精神痛苦的文本和音频标识符。最终由模型确定是否有任何模式可以预测抑郁症。
Alhanai表示,“该模型可以看到单词或说话风格的序列,并确定这些模式更有可能出现在抑郁或不抑郁的人身上。然后,如果它在新实验对象中看到相同的序列,它也可以预测他们是否是抑郁的。”
这种测序技术还有助于模型将整个会话视为对话,并注意随着时间的推移,有抑郁症和无抑郁症的人之间的差异。
检测抑郁症
研究人员在来自遇险分析访谈语料库的142个相互作用的数据集上训练和测试了他们的模型,该数据集包含患有心理健康问题的患者和由人类控制的虚拟智能体的音频,文本和视频访谈。使用个人健康问卷调查,每个受试者按0到27之间的等级评定抑郁。高于中度(10至14)和中度(15至19)之间的阈值的得分被认为是抑郁的,而低于该阈值的所有其他得分被认为是不抑制的。在数据集中的所有主题中,28个(20%)被标记为抑郁。
在实验中,使用精确度和回忆来评估模型。精确度测量由模型识别的哪些抑郁受试者被诊断为抑郁。回忆测量模型在检测整个数据集中被诊断为抑郁的所有受试者时的准确性。在精确度方面,该模型得分为71%,并且在回忆得分为83%。考虑到任何的错误,这些指标的平均综合得分为77%。在大多数测试中,研究人员的模型几乎超过了所有其他模型。
Alhanai指出,该研究的一个关键见解是,在实验过程中,该模型需要更多的数据来预测音频中的抑郁而不是文本。通过文本,模型可以使用平均七个问答序列准确地检测抑郁症。通过音频,该模型需要大约30个序列。“这意味着人们使用的词汇模式可以预测抑郁症发生在文本的短时间内,而不是音频,”Alhanai说。这些见解可以帮助麻省理工学院的研究人员和其他人进一步完善他们的模型。
Glass表示,这项工作代表了一个“非常鼓舞人心”的试点。但现在研究人员试图发现模型在大量原始数据中识别出哪些特定模式。“现在它有点像黑盒子,但是,当你对他们正在采取的措施有所解释时,这些系统更加可信。接下来的挑战是找出它抓住的数据。”
研究人员还旨在测试这些方法来测试来自更多具有其他认知条件(如痴呆)的受试者的其他数据。“这不是检测抑郁症,而是类似的概念,如果有人有认知障碍可以根据言语中的日常信号进行评估。”
领取专属 10元无门槛券
私享最新 技术干货