IBM的人工智能“沃森”首次确诊罕见白血病,只用了10分钟!

原标题:IBM的人工智能“沃森”首次确诊罕见白血病,只用了10分钟!

DeepTech深科技 麻省理工科技评论独家合作

导读:10分钟能做什么?充其量只能用来看几条新闻的时间,对于Watson(“沃森”)而言却能诊断一名病人。Watson的认知计算能力已经为我们所熟悉,而它也在医学领域不断发力。日前,东京大学医学研究院利用Watson判断一位女性患有罕见的白血病,而这只用了10分钟的时间。患者为一名60岁的女性,最初根据诊断结果,显示她患了急髓白血病。

8月8日有外媒称,学习了海量医学论文的人工智能用了10分钟左右时间为一名60岁女性患者诊断出了很难判断的白血病类型,并向东京大学医科学研究所提出了适当的治疗方案,为这名女性的康复做出了贡献。据日本《东京新闻》8月5日报道,研究人员所使用的是曾在美国智力竞赛节目中打败人类冠军、由美国国际商用机器公司(IBM)研发的“沃森”。

患者为一名60岁的女性,最初根据诊断结果,显示她患了急髓白血病。但在经历各种疗法后,效果并不明显。 根据东大医学院研究人员Arinobu Tojo的说法,他们利用Watson系统来对此病人进行诊断。系统通过比对2000万份癌症研究论文,在10分钟得出了诊断结果:患者得了一种罕见白血病。该研究主要由美国的IBM研究所,纽约基因组中心及东大医学研究所联合完成。

10分钟诊断是如何实现的?

东京系统与软件开发研究所Watson Health Cloud的软件工程师林雪婷向雷锋网表示,目前医疗方面的项目难点其实比较统一:

首先,你要有可以对照的数据,在这个项目里是和纽约基因中心进行合作;

其次数据使用时,第三方只能根据HIPPA协议使用个人数据的统计信息;

再者,可能就是怎么把数据导出来作为这个研究的样本了,这个也很麻烦,因为基因数据很大。

而做人工智能诊断智能图谱的康夫子CEO,前百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人张超也列举了这一研究的主要难点。“数据抽取是个非常有门槛的技术”,主要体现在四个方面:

1. 相比较结构化或者半结构化抽取,无结构化抽取面临更多的挑战,比如:抽取模板学习更为复杂,抽取过程的语义转移,另外还有不少歧义、边界问题需要处理;

2. 无结构化抽取的面对的数据源更为繁杂,如:网页、论文、书籍、问答数据等等,不同数据源带来的数据清洗工作也不尽相同;

3. 在医学应用场景下,要求抽取工作的准确率、召回率都需要很高,这也是抽取任务的一大挑战;

4. 无结构化文本抽取的过程也伴随着大量的计算,对计算性能也有较高的要求。

新闻中提到的“10分钟”,在林雪婷看来,“应该是不包括把数据导出来的时间的”。

也就是说,这一过程首先要对结构化的知识进行构建,肯定是在离线状态下完成的。在这个案例中,将基因中心的相关数据导在一个数据池中,并进行内容管理,而Watson在10分钟内所做的,就是在已经做了筛选的数据中进行对比,找寻相似项。

“所以文中说的2000万论文,应该是离线抽取后使用的;还有一种可能是,利用这2000万篇论文去调参原来的模型。”

Watson的医疗蓝图

2011年2月,Watson在智力节目《危险边缘》打败了人类对手,用自然语言实现深度问答,展示了其强大的学习能力。而Watson在医疗机构的合作,同样也帮助医学研究人员在认知计算应用上不断推进。

Watson Health成立于2015年4月,吹响了Watson进军医疗行业的号角。

去年7月,Watson和美国第二大连锁药店CVS进行合作,对用户行为和指标分析,并预测其健康状况。在第一阶段的合作中,CVS主要向Watson开放用户的行为信息、临床数据、购药数据及保险信息等。

8月份,IBM还收购了医学影像公司Merge,结合Watson的认知学习能力,能够将医学影像、诊断和用药方案三者贯通起来,而对医学影像的深度解读,就成为了Watson的核心力量。除外,IBM还与苹果、美敦力等公司建立了合作关系。

Watson在医学研究上的应用其实不只局限于诊断领域,在读病例、读论文、寻找治疗疾病的配药方面,都已经有了成果。此前IBM和美国癌症基因会(AACR)建立过合作,据推测这一举措可能是为了获得患者的统计数据,但Watson在治疗上的成功应该是首例。

张超对IBM Watson的信心相对比较充足,他认为只要有足够的数据,就可以在肿瘤领域大规模应用。

“在记忆维度,机器要比人厉害;只要灌输给机器足够多的知识,机器可以代替人们来搜索各种可能,最后辅助医生。”

而根据林雪婷向雷锋网的表述,Watson Health Cloud将把这个案例作为成功应用放在医疗云上,这也就意味着可能成为大范围的应用。

“但我估计真正落实到云端可以用的,也就是说医院可以直接应用于诊断领域的方法要两三年,在这之前都是研究成果而已。”

而林雪婷也指出,目前所有的项目,所引用的数据都源于美国,日本暂时还没有相关的第三方使用医疗数据的法规,“据说(日本)明年会重新提案立法。”虽然目前我们已经看到了IBM在医疗领域上的成功,但要真正走进我们的日常诊断中,不仅需要技术的不断优化,在法律上同样也需要迎头赶上啊。

——延伸阅读

沃森机器人正在成为全球最顶尖的医疗专家

在WIRED 健康大会上发言前,Kyu Rhee,IBM的首席健康官,从他的口袋里掏出了一个标志性的医疗设备:听诊器。

世界上诞生的第一个听诊器是一款单声道听诊器,由法国医生雷奈克(René La ennec 1781--1826)发明的,距今已经有200年的历史了。在这二百年间,无论技术怎么发达,针对身体内部检查出现了各种各样的非侵入技术,但听诊器始终是最能代表「医生」的医疗设备。2012年一项研究表明:携带听诊器的医生显得更专业、更值得病人信赖。

令人惊奇的是,直至今天,医学在某些领域仍然使用听诊器,”Rhee说,“但是我相信,在未来的200年间,像沃森这样的认知机器人将会取代听诊器,成为未来医疗的一部分。

IBM的沃森机器人通过认知计算来吸收结构化和非结构化的数据,在此基础上产生结果。想要掌握一门学科,沃森首先要吸收海量的现存数据,然后由专家输入既定的问题和答案来对其进行训练。之后,沃森会被问到一个没有给出既定答案的问题,沃森要利用自己对问题的理解来列出上千种可行的答案,并且要为这些答案进行排序。沃森回答的越多,那么它理解的就越好。

癌症治疗的新愿景

听诊器已经存在了两个世纪之久,在这期间,医学已经发生了翻天覆地的变化。纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering)的主任医师Jose Balsega列出了自从沃森机器人出现以来在癌症治疗领域出现的快速改变。针对这些变化,医学领域每年都会出现数千篇文章。PET扫描、CAT扫描和超声图像等新的成像技术,都为癌症治疗带来了新希望。与此同时,基因组学的兴起使癌细胞测序和患者遗传学分析成为可能。60年代,医生对特定的疾病能只有两种诊断选择,但是今天的医生可能会有50种推荐和不推荐的不同治疗方案。

纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering)

沃森想要帮助医生治病可不是那么简单的,一开始就得老老实实地从「读书」开始。首先,沃森要先阅读所有可接触到的医学文献。同时,它还要阅读纪念斯隆-凯特琳医院的临床记录以及医生给出治疗方案的原因。对于沃森来说,它可以在几秒钟内阅读数百万的文字。同时,它还了解自然语言,包括医疗记录和期刊文章使用的连医生自己看着都头大的复杂语言。不但如此,沃森可不是只会「读书」的书呆子,它还能将学到的所有知识应用到新的案例中,并根据它知道的所有医疗知识给医生提出建议。

例如,有一次我们把一个年轻肺癌患者的初步诊断数据拿给沃森「看」,沃森「看」了之后,推荐患者做个分子诊断,因为患者体内可能存在基因突变,这些突变会影响治疗方案的选择。当我们把患者的分子鉴定结果给沃森「看」之后,它发现患者体内的表皮生长因子受体(EGFR)基因上有突变位点。

针对这种现象,目前医学界推荐的做法是使用药物厄洛替尼进行治疗。但最近一篇文章指出,在所有表皮生长因子受体基因出现的突变中,有一种情况药物厄洛替尼对它没有作用。凑巧的是,这种罕见的现象就出现在这个病例中。

在全世界范围内,最多也只有10位医生知道这项新研究。但是,沃森不仅仅读过这项新的研究论文,它还能将病人的病情和这些新研究结合在一起,给医生的治疗提供正确的建议。而就是增强智能(augmented intelligence)在医疗应用中的一个典型例子--沃森能够非常迅速地接触到最新的医学文献,并在此基础上消化理解,给医生决定提供支持。

纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering)在癌症治疗领域积攒了最丰富的专业知识和最尖端诊疗技术,沃森就是在这样的医院接受「培训」的。因为沃森是「盘踞」在云端的,沃森积累的认知计算的数据和资料以及它在纪念斯隆-凯特琳癌症中心与专家互动的学习经验,全世界范围内都可以接触到。所以不管纪念斯隆-凯特琳癌症中心的专家在哪里,只要有网络,便可以轻松获取沃森的认知能力和数据。

2014年10月份,位于泰国曼谷的康民国际医院(Bumrungrad International Hospital),成为北美以外首家在癌症护理领域引进IBM沃森机器人的医院。从此之后,有沃森的云计算的支持,康民国际医院和纪念斯隆-凯特琳癌症中心便可以轻松互帮互助、共享癌症诊断信息。对于沃森来说,这也是有大大的好处--它接触到的数据越多,它的理解力可以变得更广阔、更深刻。

在英国和美国,癌症护理是高度专业化的,”Rhee说,“但是在一些发展中国家,肿瘤学家非常少,与此同时他们却要治疗非常多的癌症患者。我们都知道,一个人是不可能掌握所有知识。沃森机器人的出现为我们提供了一个非常棒的机会--开放、共享全世界的癌症治疗信息,每个地区的人们都可以通过沃森来获得世界顶级的专业知识。

保存数据就是在保命

当说起医疗数据的时候,我们首先想到的就是那些保存在纸上和电脑里的医疗记录。但伴随健康智能硬件的兴起,医疗数据的边界不断地被拓展。

今年4月份,一款健康智能硬件记录的数据拯救了一个新泽西州男人的生命。这个男人在工作当中突发心脏病,医生从他的智能手机中提取心率数据,这些数据能够帮助医生排除不必要的诊断,所以医生能够迅速找到合适的治疗方法。

医疗数据可不仅仅是医学期刊和医生输入电脑的医疗记录,我们的身体无时无刻不在产生海量的潜在医疗数据。但是目前来说,绝大部分的数据都处于「丢失」(lost)的状态--我们每天走了多少步、今天的心率怎么样、皮肤的温度是高还是低、今天都吃什么了等等这些数据,都只保存在本地、孤零零的几个设备和App里。

沃森健康的欧洲负责人Matt Howard说,“对于我们来说,最重要的是数据的质量、控制和监管。正是这些因子之间的相互作用,使沃森健康成为一个非常有意思的理念。沃森可不是单单具备认知能力,它是认知能力和大数据、分析和决策的复杂相互作用。

为了获得匿名的健康数据,IBM和一些可穿戴健康设备和其他硬件的制造商合作,这其中包括Apple和Under Armor。海量的健康数据能够提升沃森对健康(health)的认知和理解,而不仅限于医疗护理(healthcare)。

我们一年大概做出15个有关于医疗护理的决定,但是每一天我们做出有关于健康的决定有1500个,”Kyu Rhee解释说,“比如说咖啡里放不放糖?今天吃不吃早餐?在哪里停车?爬不爬楼梯?今天给家人打不打电话?

Kyu Rhee

Rhee可是个多面手,在医院里担任全职医生的同时,他兼任着医院内部的儿科医疗专家。Rhee自己说,他平均花在每个病人身上的时间是10到15分钟。即使是慢性疾病的患者,一年也很少和他们的医生呆到两个小时以上--而且有一半的时间都花在更新文件上。在缺少和医生充分交流的情况下,病人们无时无刻不在做出关于他们健康的重大决定,但他们往往缺少必需的信息。

据统计,目前全世界范围内大约有 4亿人患有糖尿病,如此庞大的患者数量,医生肯定是顾不过来。就在近期,沃森和医疗设备制造商美敦力(Medtronic)合作,他们将联手解决糖尿病问题。美敦力通过它生产的血糖监测仪和胰岛素泵积累了1.25亿天的匿名记录。沃森会把这些匿名记录和其他海量的匿名健康数据相结合,并利用医疗知识进行解释。

美敦力和IBM合作的目标是要创建一个能够追踪一系列影响因子的系统,为病人们该如何预测和避免低血糖的发作提供准确的信息。

Howard 说:“如果我们大规模地运用像沃森这样的『认知健康教练』来为病人提供糖尿病风险评分、锻炼指导、饮食推荐和其他高质量的信息,哪怕只推进一丁点,都会对整个医疗系统产生巨大的影响。

未来的医院是「活的」

只有能够从结构性数据和非结构性数据中获取重要信息,并能举一反三的给出正确的结果,才是具备健全认知能力的表现。自从2015年IBM收购了Merge Technologies,沃森又具备了「看」影像资料的能力。而且这次收购,还给沃森收获了30亿张影像片子,这又大大的充实了它的知识库。

我们所需的信息各有不同--相比糖尿病患者,医生需要更多不同种类的信息。照顾生病住院的儿童也需要特殊的信息。

阿尔德黑儿童医院(Alder Hey Children's Hospital)位于英国利物浦附近,近期他们正在进行一个雄心勃勃的项目--让医院「活」起来(Living Hospital)。他们的目的是使用高精度计算、传感器和最新的娱乐技术,为住院的儿童创造出一个灵敏的、反应快速的智能就医的环境。

阿尔德黑儿童医院(Alder Hey Children's Hospital)

这个医院计划开发一个可以将多种设备串联起来的app,然后在医院布满各种互动设备。这些设备不是出文字让患者看,而是能听懂小患者的话,还能回答他们的问题。

我们希望一个孩子能够问『我的房间是什么样子』、或者『我的手术会发生什么』”,阿尔德黑儿童医院的临床创新的总监Ian Hennessey解释说。

语义分析是过去五年中重要的技术突破,现在的「口袋」人工智能,如Siri、Cortana和Google Now语音识别的范围已经超出了简单的命令,现在它们可以利用云计算的处理能力和数据容量来探寻语音的意义并寻找答案。

阿尔德黑儿童医院打造「Living Hospital」的第一步的重点就是提升病人的体验。目前,医院的App目前能够回答一些简单问题,大约占到所有问题的10%左右。像「最近的自动取款机在哪」、「手术前多久我能吃东西」。这些问题能够为医院的工作人员节省时间,并且在没有人手的情况下自动应答。

下个阶段的目标就不仅仅是回答问题,还要知晓病人问问题的状态。Talkspace,一家在线医疗平台,他们把沃森已经训练成为一个可以通过病人使用的语言和语调来判断病人的压力水平和个人信息。知道病人是出于好奇还是恐惧提问的,有助于平稳病人的情绪。情绪稳定的病人睡得更香、自我感觉更好、也能提供更清楚的答案。

沃森健全的认知要比住院和药物治疗对患者的效果深远的多。在恰当的设备和数据下,具备健全认知能力的沃森能够全天24小时保护生命健康。数据,以及解读数据的能力,将会成为21世纪最强大的药物。同时,沃森开创了新途径去了解病人,它将会成为本世纪的「听诊器」,这项变革性的技术在未来将会变得十分常见。

本文转自:蟠桃会(微信号:iPanTaoHui)

深科技招聘自由撰稿人,要求

文笔好,懂科技,稿酬优

联系:deeptech@mittrchina.com

IEEE中国是DeepTech深科技的战略合作伙伴,想要获得最新的科技资讯和会议信息,敬请关注IEEE中国。

MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。

分享至朋友圈才是义举

DeepTech深科技

ID:mit-tr

长按关注返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
免费获取
今日搜狐热点
今日推荐