李盈 李盈

科技控,关注医疗领域的大数据和人工智能技术

语音技术是这两年资本市场和巨头公司追逐的宠儿,从像苹果的Siri,微软的Cortana,谷歌的google Assistant这样的语音助理,以及Amazon Echo和Google Home进入客厅和卧室场景的智能音箱,再到今年10月份的锤子新机发布会上,科大讯飞惊艳全场的语音识别技术。语音技术正在融入我们日常生活的每一个场景,天气、交通、订餐、家居……

「说话」是我们每天都要进行的活动之一,那么「说话」和我们健康是否相关?能否利用语音识别健康?在此基础上,随处可见的语音助理能否成为我们个人的「私人医生」?

答案是肯定。科学家认为,人们的健康和发出的声音息息相关。如果身体上或心理上出现了问题,那么发出的声音可能会变得纤细,或说话带有鼻音,或者你的言语更加粗暴,又或者你的声音会伴随着人耳难以区分的「颤抖」。

原因就在于,仅说一个简单的词语就需要大脑中的多个神经回路中进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活的时间,这样才能控制整个声道的发音的清晰度。一旦身体出现了疾病,疾病的特异性干扰会对某个系统或多个系统会产生细微的、难以察觉、但具有特性的变化。而这种变化,是可以利用机器来进行分析计算的。

奇点糕之前写过一篇文章,讲的就是Sonde Health公司通过分析语音特征来诊断疾病,比如说抑郁症、脑震荡、认知障碍、帕金森症等神经系统疾病。该公司希望利用人们现有设备,比如说智能手机,在不记录人们具体的说话内容,仅仅提取人们的语音特征来监测人们的生理和心理健康。

现在,语音识别技术在健康医疗领域又有重大突破。这个月,梅奥诊所与以色列语音分析公司Beyond Verbal合作的研究发现:13个语音特征和冠心病存在相关性,其中一个语音特征会增加冠心病19倍的发生概率。

NewLogoWeb

「这项研究说明在语音特征和冠心病之间存在相关性。」研究人员说,这项研究将在美国心脏协会科学会议展示。「语音特征分析可以辅助医生评估胸痛患者患有冠心病的概率,尤其适合在远程医疗中使用。」这项研究首次发现语音特征和纯粹的身体疾病存在相关性,这意味着在未来的某一天,医生可以使用语音分析的软件作为一种无创、辅助诊断工具。

这项研究是一项双盲研究,一共有150名实验对象,包括120名已经进行了冠状动脉血管造影术的冠心病患者,9名没有进行冠状动脉血管造影术的实验对象,以及21名健康的实验对象作为控制组。

所有的实验对象进行了冠状动脉血管造影术之前,使用一个下载到他们个人智能手机的应用来录三段30秒的语音。第一段语音要求实验对象读一段指定的文本;第二段语音要求实验对象描述一段积极的经验;第三段语音要求研究对象描述一段负面的经验。

所有录好的语音将会由Beyond Verbal提供的工具分析语音的强度和频率。研究人员利用梅尔频率倒谱系数(MFCCs)来从录好的音频中提取声音特征,分析时不知道实验对象的临床数据。

研究人员一开始对声音特征使用单因素二元逻辑回归(Univariate binary logistic regression)进行分析,发现声音特征与冠心病存在相关性。为了验证到底哪些声音特征与冠心病相关,研究人员使用逐步二元逻辑回归(Stepwise binary logistic regression)分析发现有13个声音特征与冠心病存在相关,其中研究人员在实验对象描述消极经验的录音中识别的「15号」声音特征与冠心病存在强相关性,出现15号声音特征的研究对象所患冠心病的概率是其他人的19倍。结果显示,利用声音特征识别冠心病独立于年龄、性别和其他一些利用传统冠心病风险评分的因素。

QQ截图20161118151124
上图显示为在一段消极经验时冠心病患者和控制组语音的功率谱密度对比(PSD)红色为冠心病患者,绿色为健康的控制组

 

至于Beyond Verbal如何从三段录音中提取声音特征,可能因为涉及商业机密,梅奥诊所发布的研究中没有显示。「很难去描述那些声音特征听起来是什么样的。这些声音特征不是人类的耳朵可以识别的。」 Yuval Mor说,他是Beyond Verbal的CEO。「这和我们的视力很相似,人眼可以看到一个特定的光谱,但实际上现实中还存在更多的光谱。」

Beyond Verbal,成立于2012年。2014年推出了Beyond Wellness API 。这款软件可以将智能手机或配置麦克风的可穿戴设备变为「情绪传感器」,不考虑实际内容和上下文语义,而是研究语音中的语调、频率来监测用户的情绪。该公司有两个免费、面向消费者的应用程序,Moodie 和Empath,并且还有一个面向临床医生的应用Beyond Clinic,他们希望在任何场景下都可以监测识别情绪的手段,比如说工作场景,市场研究场景,甚至梅根凯利采访川普的视频都可以进行情绪的识别。

9月份,Beyond Verbal推出一个研究平台,将它的软件用于健康医疗领域,想要通过识别语音的生理标志来进行健康问题的诊断。这家公司虽然拥有语音分析的经验,但一直以来更侧重于检测那些明显会影响到个人声音的疾病,比如说帕金森和其他的影响神经认知功能的疾病。这项和梅奥诊所的研究是首次揭示了语音特征可以用来识别单纯的身体疾病。

「这项研究已经进行了两年,我们花了很长时间证明两者之间存在联系,」  Mor说,「发现声音特征和身体疾病之间的相关性意味着在其他领域可以应用这项技术。」比如说内嵌到一个APP中,通过说一段话来为人们的心脏健康进行预警。「本次研究为我们开了一扇门,让我们可以继续心脏健康方面更多边、多语言的研究。」Mor说。

Beyond Verbal 将会和梅奥诊所继续合作,将会在不同的语言环境中检测这项技术,确认语音特征分析是否会超越语言。

参考资料:

【1】http://www.mobihealthnews.com/content/mayo-clinic-study-shows-voice-analyzing-app-may-be-useful-heart-disease-diagnosis

奇点分享微信

推荐阅读

发送