Radiomics: 使用先进的特征分析从医学图像中提取更多信息

本文是Radiomics领域里程碑式文章,有Radiomics“开山之作”之称,最早提出Radiomics概念,文章虽然很简短,但系统介绍了方法体系的背景、流程、假设(理论基础)。谷歌学术显示被引次数近2000次。

Abstract

实体肿瘤具有空间和时间异质性。这限制了基于侵入性活检的分子测定法的使用,但为医学成像提供了巨大的潜力,该技术具有以非侵入性方式捕获肿瘤内异质性的能力。在过去的几十年中,具有新硬件、新显像剂和标准化协议的医学成像创新使该领域转向定量成像。因此,还需要开发自动化和可重复的分析方法以从基于图像的特征中提取更多信息。放射组学(Radiomics)-从放射线图像中高通量提取大量图像特征-解决了这个问题,它是一种很有前途的方法,但需要在多中心环境和实验室中进行进一步验证。

Keywords:Imaging;Radiomics;Tumour;Intra tumour;heterogeneity

Introduction

在过去的十年中,医学影像技术在临床肿瘤学中的用途和作用已从最初的诊断工具大大扩展到在个体化医学背景下发挥更加核心的作用(Fig.1)。期望与其他资源(例如人口统计学、病理学、血液生物标志物,基因组学)相比,影像包含互补且可互换的信息,并且将这些信息源结合起来将改善个体化治疗的选择和监测。

Fig. 1. Different sources of information, e.g. demographics, imaging, pathology, toxicity, biomarkers, genomics and proteomics, can be used for selecting the optimal treatment.

依赖于所使用的非侵入性成像设备或其操作方式,可以多种方式探测癌症(Fig.2)。传统上,解剖计算机断层扫描(CT)成像是一种经常使用的模态,以高分辨率(例如1  mm 3)获取“解剖图”的图像。现在,CT成像已被常规使用,并且在癌症管理的所有阶段都发挥着至关重要的作用,包括预测、筛查、用于检测的活检指导、治疗计划、治疗指导和治疗反应评估。CT用于评估肿瘤的结构特征,但不能描绘出实体瘤的功能或分子细节。功能成像涉及生理过程和功能,例如扩散、灌注和葡萄糖摄取。这里,通常使用的方法为动态对比增强磁共振成像(DCE-MRI)评估肿瘤灌注和氟-2-脱氧d -葡萄糖(FDG)正电子发射断层扫描(PET)成像评估肿瘤代谢,这两者通常被发现具有预后价值。最后,另一个模态是分子成像,在体内特定的通路或者大分子的水平可视化。例如,有分子标记物评估肿瘤缺氧或标记抗体,评估肿瘤的受体表达水平。

Fig. 2. Multilevel imaging: anatomical, functional, and molecular imaging.

在过去的几十年中,医学成像以四种不同的方式取得了进步:

  • 医疗设备(硬件)的创新:这涉及成像硬件的改进和不同模态组合式设备的开发。例如,在过去的十年中,我们从单层CT到了多层CT和CT / PET。最近的发展是双源和双能CT。这些技术显著提高了4-D CT重建的时间分辨率,从而可以在心脏或呼吸期像的多个阶段中可视化组织中的精细结构。此外,双能CT可以用来改善组织组成和密度的识别。

  • 显像剂的创新:显像剂(或影像生物标记物、影像探针,放射性示踪剂)的创新,即注入体内并用作体内特定生物过程指示剂的分子物质。这是通过造影剂,即使用正发射断层扫描(放射示踪剂)的显像剂来实现的。通常的用途是寻找病理过程的迹象,例如使用PET成像的低氧标志物。

  • 允许定量成像的标准化协议:历史上放射学一直是定性科学,也许除了在放射治疗计划中定量使用基于CT的电子密度外。使用标准化协议(例如常见的MRI自旋回波序列)有助于实现影像的多中心使用,并将放射学转变为更定量、高度可重复的科学。

  • 影像分析的创新:医学图像的分析对衍生图像的结论有很大的影响。越来越多的软件可用,可以进行更多的量化和标准化。计算机辅助检测(CAD系统)的发展已证明了这一点,该系统可提高在乳房X线检查或肺部疾病中检测癌症的性能。

Radiomics致力于通过自动高通量提取大量(200+)医学图像定量特征来改善图像分析,并且属于医学图像分析创新的最后一类。假设是,通过给定影像模态的自动或半自动软件对医学图像数据进行定量分析,可以比医生提供更多更好的信息。这通过患者表现出通过不同的成像模态可测量的肿瘤形状和纹理差异来证明(Fig.3)。

Fig. 3. (A) Two representative 3-D representations of a round tumour (top) and spiky tumour (bottom) measured by computed tomography (CT) imaging. (B) Texture differences between non-small cell lung cancer (NSCLC) tumours measured using CT imaging, more heterogeneous (top) and more homogeneous (bottom). (C) Differences of FDG-PET uptake, showing heterogeneous uptake.

The workflow of Radiomics: a (semi) high-throughput approach

Fig.4描述了Radiomics工作流程中涉及的过程。第一步为诊断或计划目的而获得高质量和标准化的影像的采集。根据该图像,可以通过自动分割方法或由经验丰富的放射科医生或放射肿瘤科医生定义肉眼可见肿瘤。随后从先前定义的肿瘤区域提取定量影像特征。这些特征包括强度分布的描述、各种强度水平之间的空间关系、纹理异质性模式,肿瘤的形状以及与周围组织的关系(即与肺胸膜壁的附着、分化)的描述(descriptors of intensity distribution, spatial relationships between the various intensity levels, texture heterogeneity patterns, descriptors of shape and of the relations of the tumour with the surrounding tissues (i.e. attachment to the pleural wall in lung, differentiation))。然后对提取的图像特征进行特征选择过程。根据其与其他特征的独立性、可重复性和在数据上的突出性,确定出最有用的特征(The most informative features are identified based on their independence from other traits, reproducibility and prominence on the data)。然后分析所选特征与治疗结果或基因表达之间的关系。最终目标是通过将影像学特征纳入治疗结果的预测模型中,以提供准确的风险分层,并评估其对常用预测因子的附加价值(The ultimate goal is to provide accurate risk stratification by incorporating the imaging traits into predictive models for treatment outcome and to evaluate their added value to commonly used predictors.)。

Fig. 4. The Radiomics workflow. On the medical images, segmentation is performed to define the tumour region. From this region the features are extracted, e.g. features based on tumour intensity, texture and shape. Finally, these features are used for analysis, e.g. the features are assessed for their prognostic power, or linked with stage, or gene expression.

The Radiomics hypothesis: inferring proteo-genomic and phenotypic information from radiological images

Radiomics的基本假设是,对常规和新型医学影像进行的先进的图像分析可以捕获当前未使用的其他信息,更具体地说,可以根据基于宏观图像的特征来表达基因组和蛋白质组学模式。如果得到证明,我们可以从医学图像数据的定量分析中推断出表型或基因蛋白签名,其中可能包含预后信息。

(The underlying hypothesis of Radiomics is that advanced image analysis on conventional and novel medical imaging could capture additional information not currently used, and more specifically, that genomic and proteomics patterns can be expressed in terms of macroscopic image-based features. If proven, we can infer phenotypes or gene–protein signatures, possibly containing prognostic information, from the quantitative analysis of medical image data.)

这种假说得到了影像引导活检的支持,其表明肿瘤在蛋白质表达上显示出空间差异。更具体地说,已证明肿瘤内蛋白质表达模式的主要差异可以与影像学发现(或放射表型)相关,例如基于CT数据的对比增强区域和非增强区域。作者认为,图像引导的蛋白质组学有望在治疗决策之前表征组织,并且如果没有影像,确实存在忽略最佳治疗决策的风险(即使用或不使用靶向药物)。另外,Kuo等也报道了CT衍生的影像学特征与组织病理学标志物以及肝癌上几个预定义的基因表达模块的关联。在卵巢癌,描述增强分数(治疗前CT扫描增强组织的比率)的成像特征,发现可预测一线化疗后的结果。在肺癌中,CT衍生的信息仅限于肿瘤体积的治疗前评估,而反应评估则定义为肿瘤缩小。对于PET成像,经常要研究FDG的最大摄取量和中位数摄取量,表现出很强的预后预测能力。然而,更复杂的描述摄取仅研究在有限的范围。El Naqa等人的研究研究了强度-体积直方图(IVH)指标、形状和纹理特征的预测能力,以评估对有限数量的头颈部和子宫颈癌患者的治疗反应。Tixier等还探索了从基线FDG-PET图像中提取的基于SUV的形状和纹理特征的潜力,以评估对治疗和预后的反应,从而预测食道癌对联合放化疗的反应。同样,由于不同的采集模式和重建参数,FDG PET图像中的纹理特征表现出很小的变异。这些示例提出了以下问题:在常规影像上定量提取额外的影像特征是否会提高当前使用的参数预测或监视对治疗反应的能力。

此外,Radiomics可以与放射基因组学的概念联系起来,后者假定影像特征与基因签名有关。最近的文献中有趣的发现是,具有更多基因组异质性的肿瘤更可能对治疗抵抗和转移。这与异质性更强的肿瘤预后较差的概念有关。根据Radiomics的假设,基因组异质性可以转化为肿瘤内异质性的表达,可以通过影像学评估其表达,并最终显示较差的预后(According to the Radiomics hypothesis, the genomic heterogeneity could translate to an expression in an intra-tumoural heterogeneity that could be assessed through imaging and that would ultimately exhibit worse prognosis)。Jackson等及Diehn等的研究支持了这一假设,他们非常有说服力地表明增殖和缺氧基因表达模式可以分别通过质量效应和肿瘤对比增强来预测(who quite convincingly showed that proliferation and hypoxia gene expression patterns can be predicted by mass effect and tumour contrast enhancement,respectively)。他们还表明,特定的成像模态可以预测表皮生长因子受体(EGFR)(一种已知的治疗靶标)的过表达。此外,在他们的分析中,某些影像特征的存在可高度预测结果。作者得出的结论是,在这种情况下,MR成像为胶质母细胞瘤多形性的全基因组基因表达提供了“在体肖像”。Segal等人在肝细胞癌中也发现了类似的发现,显示了仅28个影像特征的组合足以重建116个基因表达模块的变异。

这些类型的研究将需要扩展,包括更多具有外部验证数据集的患者,更多表现出诸如侵袭性等表型的肿瘤类型。这将是QuIC-ConCePT联盟的重点,通过实验确定Radiomics的假设,即在基因表达模式和图像特征之间建立因果关系。

Conclusions

实体癌在不同水平上具有很大的时空异质性:基因、蛋白质、细胞、微环境、组织和器官。这限制了基于活检的分子分析的使用,但是相比之下,非侵入性影像技术具有巨大的潜力,它具有以非侵入性方式捕获肿瘤内异质性的能力。具有新硬件、新显像剂和标准化协议的医学影像创新现在可以进行定量成像,但需要开发“智能”自动化软件以从基于图像的特征中提取更多信息。放射组学-从放射线图像中高通量提取图像特征-是一种前景广阔的方法,但需要在多中心环境和实验室中进行进一步验证。

编译不易,如果各位朋友觉得对您有帮助,烦请各位积极转发,收藏,并点击文末右下角“ 在看”,让更多人看到。
(0)

相关推荐

  • 基于大数据和5G的精准放疗:已来的将来

    电子科技大学医学院附属肿瘤医院 一 .当前放疗的现状与挑战 近 30 年来,得益于物理.计算机.医学影像及互联网技术的迅猛发展,放射外科技术进步突飞猛进,成为肿瘤治疗的核心手段[1].从全球来看,肿瘤 ...

  • 深度学习在医学影像中的研究进展及发展趋势

    王丽会1,2, 秦永彬1,2 1 贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 550025 2 贵州大学计算机科学与技术学院,贵州 贵阳 550025 摘要:医学影像是临床诊断的重要辅助工 ...

  • 低剂量CT成像取得新进展

    来源:深圳先进院 2021-09-13 08:26近日,中国科学院深圳先进技术研究院研究员胡战利团队在低剂量CT成像领域取得新进展.团队提出了一种基于注意力机制的解剖先验信息融合网络,可以在降低CT辐 ...

  • 从财务凭证摘要中提取人名信息,简单的两种方法及优化思路

    最近遇到从财务凭证摘要里提取信息的情况比较多,一是学员的提问,还有就是最近的项目上也多次涉及到这样的需求,比如下面这个,要求从摘要里把人名提取出来: 又如这种: 实际情况一般没有这么乱,因为大多数公司 ...

  • 如何从文本中提取特征信息?

    虽然之前也写过gensim库的word2vec的教程,但是对于文本分析的特征提取并不太理解.最近看了几篇scikit的外文教程,对机器学习中文本的特征提取有了一些了解. 首先做文本的机器学习(自然语言 ...

  • 超帅超先进的两款国产中大型新车!谁更能代表中国高尖水平?

     今晚20:00公众号对话框准时发送口令「红包」 领取限量版玩车教授微信红包封面! 若要说今年最火的纯电动轿车都有谁?我想,蔚来ET7和小鹏P7一定榜上有名,而论关注度,用"旗鼓相当&qu ...

  • 总结展望,唱响红歌,表彰先进,加油充电!中钢网2018年中总结会精彩纷呈

    总结过去的成绩经验,展望明天的美好未来, 6月30日至7月2日, 中钢网全体干部员工齐聚一堂, 在中钢网董事长姚红超的带领下, 告别上半年,为下半年加油喝彩. 三天的会议精彩纷呈,议程满满, 充满朝气 ...

  • 从文件夹中提取符合条件的记录

    先来看数据源,在快递寄送信息表的文件夹中,存放了多个结构一致的工作簿: 打开一个工作簿看看,里面就是每一年度的详细记录了: 再来看看汇总表,这里使用数据验证(数据有效性)功能制作了一个下拉菜单,在下拉 ...

  • 在Excel中提取单元格混合字符串中的数字与英文的函数介绍

    如何将某个单元格中的由英文与数字混合组成的字符串中的英文与中文分别提取到其它单元格? 首先说明,在Excel中没有满足这种功能的现成的函数,要想使用这种函数,就必须使用自定义的函数. 下面我们先看效果 ...

  • 从寒山诗中的年代信息探索寒山生平足迹

    内容提要:千余年来文献记载寒山条,大都是"不知何许人也"."不知其乡里".为了考证寒山的生平,通过对寒山诗的解读及地方志的发掘,对邢台任县双蓬头村的调查和考证, ...

  • 教学管理菜鸟成长记60-从工作表中提取所需数据之上集

    关键词:EXCEL2016:自动筛选:高级筛选:操作难度**** 身为一名教学管理人员,经常需要面对领导时不时要求的统计要求.比如下一张表,领导关注的是学生评教得分不及格的教师信息 图 1:数据源示意 ...

  • 教学管理菜鸟成长记61-从工作表中提取所需数据之下中集

    关键词:EXCEL2016:Power Query:合并工作表:操作难度***** 昨天小菜和您分享的是一张数据表的数据查询,实际工作中,很多时候我们同一个事项累计了很多张首行相同的工作表,比如像每个 ...