知识体 采用数以千计的带注释的图像进行训练后,软件系统学会了识别人体器官,甚至在病理切片中分清癌症分期。这种可以从语义上处理解剖学和生理学问题的能力,为疾病诊断和治疗打开了一扇门。
想象一下,给你做十分全面的医疗扫描,这样你的每个细胞的位置和功能信息就可以被存储下来。你可能马上就能看到诸如心脏和前列腺细胞,这样,你就得到一幅清晰的三维图像,不管从哪个角度都可以看到每个器官,随便你放大该器官的任何一部分,或者其功能的任何元素——不管需要多么详细的信息,你只要轻松移动操作杆或者输入一个请求就可以实现。虽然20年后才有可能实现这一愿景,但是目前科学家们已经可以获得人体局部清晰的三维像素图像。每一个三维像素大约表示10万个细胞。
S. Kevin Zhou说:“我们的目标是,扫描时能够自动标记每个三维像素。”Zhou是西门子美国研究院全身影像分析项目的负责人。“本着这一目标,我们将开发诸如语义搜索等服务。这样的话,医生只要提到肝肿瘤,系统就会筛选出病人近期体检中的肿瘤图像,测量不同图像上肝的大小,并会解释肿瘤在治疗期间的变化过程。这将会使医生的工作更快、更精准、更高效地完成。”
但是,图像分析系统只有先获知肝脏的方位,才可以判断正在查找的肝脏是否就在给出的图像中。为此,系统首先要查找解剖学标志。例如,胸部的标志有肺部顶端和主动脉下端等位置。“这些标志的存在可以使图像分析系统避免混乱,并可以进行自我调节,”Zhou解释道。
机器如何记忆。机器学习系统能够越来越精准地识别解剖学标志,锁定要查找的部位。而其背后的深层原因则是学习识别图像内容的软件在不断进步,它根据大量“分类标志”或目标对象所有示例的共同特征来做出判断。
由于有了机器学习,不管是否存在阻塞,以及视角、成像方式、病理如何,机器都能逐渐准确地自动区分器官轮廓和解剖学特征,这样就为医生打开了一扇大门,使其能够更快、更准确地做出诊断
例如,采用数以千计的附带注释的肝脏图像对软件进行训练之后,这种软件已基本记住了人类肝脏的三维形状, 从而具备了归纳能力,它可以识别和区分出(区别于周围器官)任何医学影像中的肝脏——不论是否存在阻塞,以及视角、成像方式、病理如何等。该软件还被推广应用在人体其他解剖实体上,从器官、骨头,到胎儿外形或身体损伤等不一而足。
扁平的肋骨。一旦系统学会了自动识别人体的不同部位,世界就呈现出无限美好的可能性。例如,进行例行的全身计算机断层扫描之后会如何呢?现在,根据很多国家的法规,放射科医师,不管进行扫描的原因是什么,必须检查图像中的所有主要器官和整个胸腔,包括肋骨内面,来判断是否有异常迹象。“检查肋骨极其耗时,因为很难看到那些弯曲面,”Zhou解释说。
西门子中央研究院和西门子计算机放射业务部正在联手研发一种软件。这种软件可以自动把胸腔和图像的其他部分区分开来,将肋骨图像扁平化,这就大大改善了肋骨的检查过程。“该项目将会使用到机器学习,找出每根肋骨并定位其中心线。那么应用简单的程序就可以使每根肋骨变平,”Zhou补充道。
融合X射线和超声信息。50多年来,患有严重心脏疾病的病人必须忍受心脏手术的痛苦。但如今,由于成像技术的迅猛发展,自动识别及跟踪瓣膜、心腔以及心导管、置换片固定模等系统的面世,越来越多的病人在治疗过程中只需要使用特制的心导管就可以了,不再需要使用其他危害性更大的东西。例如,一年前,西门子引进了新的X射线可视化引导技术来辅助主动脉瓣置换手术。现在,机器学习算法可以自动识别不同成像模式中的同一解剖学标志,诸如主动脉瓣置换等手术定将变得更加。
借助机器学习技术,西门子Semantic Heart项目的研究人员得以生成患者心脏的全功能模型,而其他研究人员为医生开发出一种医疗推理引擎(参阅第60页的栏花)。机器学习系统可查明前列腺活体的癌症分期(右图)
“我们将这项新技术称为‘基于模型的融合’,”西门子美国研究院的Razvan Ionasec博士介绍说,“采用以X射线为基础的三维血管造影法,可以很清楚地看到心导管的位置,但却不能看清人体组织,而超声成像刚好如此相反。所以,我们把二者结合起来。”
正是出于这种想法,以同样效力于西门子美国研究院的Terrence Chen博士为首的研究人员,正在开发一种基于学习的检测跟踪技术,它将有助于利用微型血管内超声(IVUS)设备生成的图像,自动优化血管造影影响配准。这种设备常用于查明冠状动脉中的斑块。在这个应用中,学习过程的重点是在采用X射线法获得的血管造影图像中,自动查明随血液在血管中移动的超声换能器和心导管的位置。“这可以帮助判定斑块沉积的位置,并辅助制定治疗计划,”Chen说。
机器学习技术可帮助计算机断层扫描系统识别钙化组织。
自动判定钙化。在西门子中央研究院视觉和实体建模项目经理Tong Fang的带领下,一组科研人员从相关的思路出发,开发出一种叫做动态组织对比加强(DTCE)的技术,可以根据超声影像查明人体器官,Fang说:“使用先进的噪声消除和结构强化技术来优化图像质量。”在离线训练中,教材就是带注释的图像样本,在一项试验中,训练后的软件可以带来“高质量的图像和临床诊断利益,”Fang指出。
研究人员还用机器学习技术训练计算机断层扫描系统,从而在心脏图像中找出钙化组织。“钙化是导致主动脉瓣置换手术的主要原因,也是导致冠状动脉疾病的一个重要因素,”Ionasec解释说,“计算机断层扫描现在能够提供的解剖细节已经十分精细。但在未来,借助计划开发的软件,希望可以开发出一种系统,帮助医生量化主动脉瓣和胸主动脉的钙沉积程度。这种信息有助于他们预测脉瓣置换术成功的可能性,决定使用哪种脉瓣,以及固定新的脉瓣时使用的气球需要多大压力。”
沿着这条思路一直走下去,研究人员还希望机器学习能够帮助他们检测出正常斑块和所谓“不稳定的”斑块之间的不同。正常斑块附着在它所占据的表面,“不稳定的”斑块则从应附着的表面脱落,并有可能导致心脏病和中风——这是很多介入治疗术面临的主要风险。西门子美国研究院的心血管疾病Gareth Funka-Lea博士说:“我们可以在计算机断层扫描和核磁共振扫描中看到不同的斑块,但我们仍然不知道怎样去识别‘不稳定的’斑块。不过,通过利用机器学习和大规模的数据挖掘技术,我们有可能最终找出答案。”
Semantic Heart。西门子心血管和机器学习小组,还将其研究重点从主动脉瓣延伸至整个人类心脏。“作为西门子主要研发项目‘Semantic Heart’的内容之一,我们正在利用机器学习技术自动识别四个瓣膜,并将此信息和我们的心腔模型相结合,生成一个完整的心脏模型,”Ionasec介绍道。这样做的目标就是,在手术之前就了解病人整个心脏的动态,使手术医生能够对不同形态的心脏介入治疗术建模并进行比较——包括插入心脏支架、动脉瘤修复或置换、瓣膜修复等。”
借助机器学习技术,西门子Semantic Heart项目的研究人员得以生成患者心脏的全功能模型,而其他研究人员为医生开发出一种医疗推理引擎(参阅第60页的栏花)。机器学习系统可查明前列腺活体的癌症分期(右图)
Semantic Heart项目取得的影响最深远的成果之一,就是快速提高负责控制从左心房到左心室的血液流动的二尖瓣的建模能力。二尖瓣比主动脉瓣要复杂得多,它是由一串串的腱索网联系起来的,腱索固定住它的两个膜瓣,使其正对着左心房。但是由于用力过度或疾病,腱索会发生断裂,这可能导致轻微的或致命的疾病。这种疾病可以采用经导管术修复,把断裂腱索上的膜瓣和健康部分的膜瓣夹合在一起。“但是,在仅仅采用透视法的情况下,用心导管将极小的夹合器附着到两片不停运动的膜瓣上,并非易事,” Ionasec指出。
面对这种挑战,Ionasec研究团队正在开发一种方法,将插入患者食管的超声换能器生成的亚毫米级术前图像,与采用西门子Artis zee血管造影系统上的syngo DynaCT Cardiac生成的术中X线图像结合起来。这种方法的基础是利用数以千计的患者图像训练过的算法,利用机器学习技术自动识别并跟踪膜瓣的组织和运动,同时结合X射线和超声图像。这种新手术预计2011年下半年在德国进入临床试验阶段。
读懂细胞的隐含意义。将来有一天,世界上将会出现一种数字病理诊断扫描仪。它每小时可以处理上千个病理切片——每个切片上都有一张纸那么薄的一块疑似病变的组织,并以的成本做出最的分析。得出的结果将与患者的遗传学、生理学、解剖学和人口统计学特征结合在一起。当然,它还会从每个切片上学到新东西,这样就会不断地提高其分析的度。事实上,这种机器很可能会联网,这样它们就可以相互学习。
虽然,这样的机器看起来似乎是一个遥远的梦想,但是研究人员现在积累基础知识,早晚有一天会开发出这样的设备。例如,在新泽西的普林斯顿,西门子美国研究院的生物医学影像分析Leo Grady博士,目前正带领着一队研发人员利用机器学习技术预测前列腺活体样本中的癌症分期。
使用由病理学已经做好标记的癌症分期的切片,“系统学习识别不同分期的细胞结构以及细胞排列等特点。在每一百个标注好的切片中,90个被用来训练系统,剩下的十个被用来进行测试。然后再用另外90个做练习,剩下的十个进行测试。切片的选择都是随机的。” Grady解释说。
这个过程不断重复,直到的结果足够令所有人都满意,此时系统就已经从经验中学会了如何归纳,有的时候,其结果相当出乎意料。比如,不仅仅是我们所期望的那样,系统能够学会判断不同细胞的样子——这样就打开了自动计算的大门——而且,它甚至发现了一些连研究人员都没有注意到的东西。
“系统提炼出一个事实,虽然每幅图像上都有环状的癌细胞和正常细胞,单凭图像中细胞环的长度和细胞的数量,就可以预测癌症分期。这令我们十分惊讶。但是,我们和一位病理学家讨论这个时,他说确实如此,一些确实利用这种结构去判断癌症的不同分期。然而,在这里,系统自己发现了这一点,”Grady说。未来医生的推理引擎
展望一下,将来有一天医生可以使用一种系统来解决复杂的医学问题。西门子美国研究院的研究人员,目前正在开发一种深层推理机器,这种机器可以从大量的数据中学习。下面这个简单的例子说明了深层推理过程的四个步骤。
(1)获取患者的病史和体检数据;
(2)做出各种可能的诊断;
(3)进行推荐诊断测试以弥补目前的知识漏洞:如,进行心电图检查以检测ST段抬高(即冠状动脉闭塞)和Q波 (即心肌细胞电信号传导障碍),从而
(4)筛选出可能性的诊断结果。
项目组负责人Mathaeus Dejori博士解释道:“这种系统体现了治疗中的决策过程。”医生一般会收到有关病人的大量资料,并需要做出艰难的决定。参与该项目的Vinay Shet博士补充道:“我们的系统不需要直接处理语言这样复杂的问题。相反,它仅仅依据语义概念判断,比如‘冠状动脉闭塞’和‘急性胸痛’——深层推理机器已经对这些概念有所认知——再根据医疗知识得出结论。”Dejori、Shet和合作研究员Dan Tecuci博士预计,这种技术可以成为医生的智能助理,使他们可以轻松利用快速发展的数字信息库。