李盈 李盈

科技控,关注医疗领域的大数据和人工智能技术

最近,学界和业界掀起了一股「声音诊断」的热潮,只要利用你的声音,就能判断出你是否患有疾病。诊断的范围大到令人瞠目结舌–从抑郁症到心脑血管疾病,只要有声音,就没有检测不了的疾病。

这听起来好像和中医的「望闻问切」的「闻」很相似–闻而知之者,闻其五音,以别其病。但这里所说的「声音诊断」可不是医生去听你的声音看病,而是「机器」去听你的声音来诊断疾病。你需要做的,就是在手机里下个APP就行了。

下载个APP说几句话就能看病?这可不是异想天开,而是有科学依据的。

越来越多的证据表明:你的健康都和你发出声音息息相关。如果你身体上或心理上出现了问题,那么你的声音可能会变得纤细,或说话带有鼻音,或者你的言语更加粗暴,又或者你的声音会伴随着人耳难以区分的「颤抖」。[1]

对于人类来讲,仅说一个简单的词语就需要大脑中的多个神经回路中进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活的时间,这样才能控制整个声道的发音的清晰度。一旦身体出现了疾病,那么对于人类普遍相似的非语言特征来讲,疾病的特异性干扰会对某个系统或多个系统会产生细微的、难以察觉、但具有特性的变化。而这种变化,是可以利用机器来进行分析计算的。

虽然在目前,声音诊断的准确性和精确性仍然处于”模糊”的状态下,但大量的科学家和企业涌入这个领域则表明一件事:声音诊断是一场不能输掉的比赛。

1

IBM正在组建一支学术研究人员的队伍来训练「训练」沃森机器人,想让沃森从人们的语音模式来判断未来患上精神失常的可能性。柏林的一家公司AudioProfiling正在利用声音诊断小儿多动症(ADHD)。澳大利亚国家信息通信技术(NICTA)同样也在研究利用语音来诊断精神疾病。波士顿的一家公司,Cogito,为美国军人退伍事业部研发了一款APP,能够利用声音监测人的情绪状况,这款APP能诊断抑郁症和双相型障碍(bipolar disorder)。

甚至连美国军方对声音诊断也十分感兴趣:今年6月份,美国军方和MIT的林肯实验室(MIT Lincoln Laboratory)合作,其目的是要研发出一款能够通过FDA审批、检测脑损伤的设备。

而在激烈的竞争中异军突起的是一家初创公司–Sonde Health

logo-sonde-w

Sonde Health,一家位于波士顿的创业公司,6月28日成立,致力于利用声音来监测和诊断人们的生理和心理健康,获得了PureTech公司的风险投资。

Sonde Health作为一家创业公司能在这场激烈厮杀市场站稳脚跟,靠的是过硬的技术–2016年6月28日,Sonde Health宣布它对健康监测音频分析技术(health monitoring audio analysis technology)独占许可证。

 

这项令人眼红的技术诞生在麻省理工的林肯实验室(就是上文中与美国军方合作的实验室),是Thomas Quatieri博士带领的HUMAN LANGUAGE TECHNOLOGY团队研发出来的。

lablogo

Thomas Quatieri

这项发明获得了Audio/Visual Emotion Challenge (AVEC)下治疗抑郁症的大奖–从简短讲话的样本中识别抑郁症并估计症状的严重程度中这项技术表现出了最佳的准确性。[2]在试点研究中,这项技术也展现出了它具有检测轻度创伤性脑损伤(MTBI)、脑震荡、认知障碍和帕金森病并客观测量症状的能力。

Sonde Health声音诊断的蓝图是:利用人们现有设备研发一款APP来监测人们的生理和心理健康–对病人的朗读内容进行音频剪辑,在不记录说话内容的情况下对病人的声音特征进行提取。联合创始人兼首席运营官Jim Harper说:「这么做的目的是利用人们已有的设备对人们的健康随时随地进行监测」。

James-Harper_large「说话是我们每天必做的事情」Harper说,「说话需要大脑相应的肌骨系统、呼吸系统区域之间极其复杂的协调。正常时说话的停顿,包括停顿时间长短不同、音调音色的变化都会导致说话声音的混乱。据此,我们可以分析出用户潜在的健康问题、正在恶化的疾病、甚至是存在自杀的倾向」。

目前Sonde专注于抑郁症、呼吸系统、心血管疾病三大领域,而对于这三大领域来说,远程、被动监测是非常有用的。「这项技术对监测抑郁症很有效」,Harper说。孕妇和产妇很容易患上抑郁症,美国政府正在呼吁对这类人群给予更多的关注,而Sonde也许能提供一个有效的监测手段。

2「利用人们现在已经有的设备识别出精神病的早期症状,并且能监测治疗的反应是从滞后性的治疗迈向预防性护理的关键一步」Aimee Danielson说,她是治疗之星乔治城大学医院(MedStar Georgetown University Hospital)妇女心理健康计划(Women’s Mental Health Program)的主任。「这种方法对那些需要长期诊断的疾病尤为重要,像围产期的心情和焦虑障碍,包括产后抑郁症和其他的中枢神经系统的疾病。而恰恰是这些疾病缺乏客观、可靠的筛选和检测技术。」

到目前为止,语音诊断领域的学者只进行了一系列相对较小的研究。Sonde需要进一步扩大研究的范围,这么做不仅是为了收集更多证据说服临床医生和监管机构相信诊断的结果,同时也是因为语音诊断的底层技术,也就是机器学习,需要大量的数据支撑。

「Sonde会将语音诊断技术应用到其他神经系统疾病上,这项技术会不断改进,一开始它需要人们主动和它交谈,然后改进为它能主动地检测人们的健康,帮助人们预防疾病。绝大多数病情不断恶化的病人不会积极地去监测自己。最后,语音检测一定会融入我们日常生活当中。」Harper说。

「利用人们现有的设备进行语音诊断,并长期监测人们生理和心理健康」这个愿景看上去很美,但是语音诊断的结果到底可不可靠呢?

3「想要使声音诊断在临床上有效,可不是一件容易的事。」Christian Poellabauer说道,他是圣母大学(University of Notre Dame)的计算机科学家,主要研究方向是神经系统疾病的生物标志物(biomarkers for neurological conditions)。「找出声音模式变化的真正原因是非常难的。想要通过声音诊断疾病,那录音必须是有用的,这就可能需要购买昂贵的设备。而且还需要大量的数据,以确保诊断的相关性是可靠的。」

同时,「文化差异」也是影响诊断准确性的因素之一。Poellabauer的团队在一次用声音诊断脑震荡的测试中发现:许多年轻的运动员在说「hell」这个词语时变得吞吞吐吐,或者改变了他们的音调。[3]然而,这种情况和年轻运动员有脑损伤并没有什么相关性。

「说话是一个非常、非常复杂的机制」Poellabauer说道。

除此之外,制约语音诊断发展的另外一个关键性的问题就是:语音诊断的信息对病人到底有多大用处?临床医生是否知道该如何处理语音诊断的结果?

4「如果你下载这个APP,它告诉你你讲话吐字不清并患有中风,这的确有用,因为你知道自己需要马上去医院」纽约大学(New York University)的医学伦理家Arthur Caplan说,「但如果这个APP告诉你你下周可能有38%的可能性患有偏头疼,那就对你没什么用了。」

Caplan提出另外一种情况可能会影响语音诊断的准确性:「假如你有一次大发雷霆或控制不了自己的情绪,那么这个APP会不会把你偶尔一次的『暴走』诊断为疾病?」Caplan继续问道:「我们该如何让语音诊断的APP明白哪些是我们想要让它监测的,哪些是我们不想让它监测的?两者的界限在哪里?」

对于中医来讲,「闻」这种方法不会对病人的隐私造成干扰,毕竟中医的「闻」只是短暂的、间断性的,病人可以有意识地选择自己说话的内容。然而,对于语音诊断来说,可能需要APP在后台运行,无时无刻地监测病人的语音,那么病人的「隐私安全」就成为一个棘手的问题。

反对者认为:语音识别的技术已经发展到仅仅凭语音、语调以及说话的节奏就可以识别患者的身份,即使语音样本中没有出现患者的名字。而这将大大威胁到我们的隐私安全,一旦软件记录的非常私人化的语音信息泄露出去,那么我们毫无隐私可言。

对此,Harper首先表示:「语音诊断的确可能会在用户不知情的情况下监测疾病」。但他提出了一种解决方法:「只分析语音样本的生物标志物(vocal biomarkers),而不去分析语音样本说话的具体内容,也不会去存储。这样既能提醒用户潜在的健康问题,又能保障用户的隐私安全」。

5「我不认为我们现在的技术水平能够做到仅仅通过语音来辨别一个人的身份」Cheryl Corcoran说,她在哥伦比亚大学研究精神分裂症,目前正在和IBM的沃森机器人合作,「但是这项技术在未来很有可能实现」。

 

 

BIG HERO 6

也许在不远的未来,当语音诊断技术和人工智能结合,或许我们每个人都能拥有一个随时随地呵护我们健康的「大白」。

 

参考文献:

[1]Thomas F. Quatieri and Nicolas Malyska. Vocal-Source Biomarkers for Depression: A Link to Psychomotor Activity[J]. MIT Lincoln Laboratory,2012

[2] James R. Williamson, Thomas F. Quatieri, Brian S. Helfer, Rachelle Horwitz, Bea Yu,Daryush D. Mehta. Vocal biomarkers of depression based on motor incoordination[Z] ACM Multimedia,2013.

[3] Poellabauer el al. Challenges in Concussion Detection Using Vocal Acoustic Biomarkers[J].IEEE Acess,2015

[4] https://www.statnews.com/2016/06/29/speech-diagnosis-technology/

[5] http://www.businesswire.com/news/home/20160627006347/en/Sonde-Health-Advances-Vocal-Biomarker-Analysis-Platform

[6] http://www.xconomy.com/boston/2016/06/28/amid-brexit-fallout-uk-listed-puretech-debuts-speech-diagnosis-firm/#

奇点分享微信

推荐阅读

发送