0%

从胸椎中自动subsolid 病变结节检测方法【论文笔记】

0 摘要

病变结节被描述为不透明圆形,半径大约为3cm。病变结节可以分为subsolid)或solid结节。solid结节在CT Scan上有均匀的软组织衰减。subsolid结节可以进一步分为non-solid结节(即ground glass 结节)和part-solid结节(即semi-solid结节)。non-solid结节表现出没有消除支气管或者血管的焦点区域模糊衰减幅度的增加。模糊区域衰减幅度的增加称为ground 玻璃不透明度,因此这些结节称为ground玻璃结节。part-solid或者semi-solid结节既包含了ground玻璃部分也包含了solid部分。在Early Lung Cancer Action Project(ELCAP)中,基准线上81%的正样本发现为solid结节和19%的subsolid结节。

一 数据

本文使用的数据来源于NELSON实验,一个大的多中心肺癌筛选实验。NELSON实验是一个正在进行的随机对照试验建立,以测试 在高风险吸烟者之间进行的低剂量CT检测是否会导致肺癌死亡率25%的降低。

实验中7557个志愿者接受了多轮低剂量CT筛选。所有在CT scan看图检测期间发现的肺结节都会被记入数据库。放射剂师会记录所有检测到的结节的位置、半径和结节类型。数据集总共从4500个对象里挑选了大概20000个scans。我们收集的thin-slices,低剂量的CT检测数据来源于两个 NELSON实验的网站,至少一个subsolid(part-solid或non-solid)被标注了的。所有subsolid 结节标注半径小于5mm的都会被丢弃,因为彼时的临床指南说明这些结节不需要后续的CT。需要注意的是solid结节标注并没有被包含入分析中。

两个网站的所有的CT检测需要在螺旋模式下 16x0.75mm的准值。轴(Axial)状位1.0mm厚度的图像将会以0.7mm的增量重构为512x512的矩阵,平面体素大小变化范围为0.53mm到0.89mm。

移除小于5mm的subsolid 结节的标注之后,第一个网站中收集了103个病人 的209个scans。这些病人中,发现了122个subsolid结节(63个part-solid,59个non-solid)。注意到,肺结节可能会在多个scan中被标注,因为每个病人可能还有后续的检测。后面的检测中,209个scans中有了225个标注。这个数据仅用于CAD系统欧冠的训练和优化。

第二个网站中,移除小结节之后,得到56个病人的109个scans。这些病人中,发现了60个subsolid(32个part-solid,28个non-solid),最后获得了109个病人的114个标注。此数据集由于是来源于不同的扫描仪,所以用于CAD系统的独立评估。

两份数据集的有效半径设置为5-34mm,中值为10.7mm。

二 方法

在检测流程之前,使用之前已经发布的肺、气道和血管的分割算法(van Rikxoort et al., 2009; van Ginneken et al., 2008; Dongen and Ginneken,2010)需要先走一遍。初始的检测阶段包括结节分割生成候选。为subsolid 结节候选定义了丰富的特征集合。先前发布的论文中(es (Kim et al., 2005; Zhou et al., 2006; Ye et al., 2007; Tao et al., 2009)的关于subsolid 结节CAD系统使用了密度,形状和上下文特征。本文中我们通过加入上下文特征添加了另外一种类别的特征。我们进行一种添加或剔除上下文特征来展示这些特征的额外的价值。我们试验了不同的分类器方案和不同的分类器以探索他们在分类性能上的影响。本文提出了一个泛化的结构化的评估方法来选取最佳分类方案。基于这些实验结果,CAD系统的最优配置会被选出,同时这个最终系统会被在独立的测试集上测试。

2.1 候选检测

2.1.1 粗粒度候选检测

候选检测过程是在肺腔内使用一个双阈值密度mask来获得一个体素mask,其衰减值是从通常从磨砂玻璃不透明度中观察到的。使用的是-750到-300的HU。肺部边缘、血管和器官的部分容积的影响可以提升在定义的区间范围内衰减值。为移除这些体素,使用了一个球形半径为3体素的形态学腐蚀操作。在此之后,聚合所有体素为候选的连通组件分析。由于半径小于5mm的subsolid不需要进一步的CT检测,所有体积小于 $35mm^3$的候选(对应的是一个被移除的半径为4mm的完美球形)。然后再做一个使用相同结构元素的形态学扩张操作来撤销这种由腐蚀操作导致的收缩。最终,所有候选的容积和质心都被计算,并且质心相距小于5mm的都被合并了。此合并过程用来确保结节只会存在于一个候选中。

2.1.2 结节分割

上述的候选检测过程生成的是聚合的区域,并不是subsolid结节的精确分割。因此使用算法来进一步分割,算法作用于立方块的VOI(Volumn of Interest)并使用一些形态学操作来获取鲁棒性的结节分割。算法分为自动胸壁移除和从附着脉管系统分离。此方法用于solid结节性能表现优异(Kuhnigk et al 2006),我们做了稍微调整来适应subsolid结节。Kuhnigk的算法使用的是一个全局下限阈值为 -450HU,为了在subsolid结节分割上获得较好的结果,我们将阈值下限改变为-750HU。分割算法的VOI在候选质心周围创建,并且VOI半径设为初始候选的等同的1.5倍。使用了这种方法,所有候选的精确分割被创建,这也形成了进入分类处理的最终候选集。

2.2 特征

描述候选的丰富的特征的计算可以分为四类:密度,上下文,形状特征和上下文特征和质地。

2.2.1 密度特征

密度特征在四个不同的体素集合上计算

  • 分割(segmentation):候选分割内的体素

  • 边框(boundingbox):边框内的体素定义在候选分割的周围

  • surrounding3:候选分割的周围内的体素,通过扩张候选分割为3x3x3体素的长方形结构元素。

  • surrounding5:候选分割的周围内的体素,通过扩张候选分割为5x5x5体素的长方形结构元素。

下图展示了这四种特征的样例。下图从左到右分别是segmentation,boundingbox,surrounding3,surrounding5

5种特征

这四种区域是定义的用来从候选的内部和周围的强度分布抽取特征的。对每个体素集合,计算了一个归一化直方图,每个bin size为50HU。每个直方图统计如下信息:熵,均值, 平均bin的高度,mode(极值点的位置),mode bin的高度,5%,25%,50%,75%和95%分位的bin值。进一步的,计算体素分割集的方差,最大值,最小值和先前的7个Hu moment(来自一篇论文 Hu,1962)。Hu moment是指转换、尺寸、旋转不变性,通常用来描述潜在的强度分布。最后,计算多尺寸(1.0,1.77,3.16,5.62和10体素)上的最大血管,segmentation(此处的应该指前面提到的四个特征之一)体素集合的最大血管性的最小值、最大值、均值和方差都作为了特征。部分容积效应可以创建靠近血管或在血管壁上的的磨砂玻璃不透明度的区域,通过这些特征可以知道候选是在血管壁附近或者在血管壁上。

总共有54个强度特征被收集到。

2.2.2 质地特征

质地分析中,使用了local binary patterns(LBP)和2D Haar小波。它们都是很常见的质地分析来表述局部空间信息。样本的这些特征可以从来去除运动伪影造成的磨砂玻璃不透明度区域的假阳性。从候选segmetation周围的boundingbox 创建的VOI,同时这个VOI的容积被重新取样(Lanczos 重新抽样,$\alpha =3$)为两个尺寸为 16x16x16体素和 32x32x32体素的立方块。然后对每个重新抽样之后的每个slices(两个立方块)使用一个邻居为**3x3(P=8,R=1)**的2D的LBP计算。然后,对每个容积的LBP输出计算 bin size为1的归一化直方图,同时计算2.2.1节提到的一些其他统计量,除了分位值,这些都用作质地描述。

进一步的,对重新取样之后的尺寸为32x32x32的容积2D做 Haar小波计算。每个重新取样的容积slices(两个立方块)分为4个频带。每个slice的四个频带创建四个容积。计算高频带的三个容积的三个归一化直方图。从低频带创建的容积没有使用。同时计算与质地描述相同的直方图统计量。

总共有40个质地特征。

2.2.3 形状特征

第三图特征由形状特征组成,这些都是从候选segmentation中计算得来。其他结构而不是结节上的segmentation会得到怪异的形状,因此形状是个区分假阳性和真阳性的重要特征。首先计算如下特征:球状性(sphericity ),紧凑性1(compactness1),紧凑性2(compactness2),猜想半径(guessRadius)。为了计算球状性,一个球形S被定义为候选区域的质心,它与候选segmentation有着相同的容积。然后球状性sphericity被定义为候选segmentation在球形S内的体素与全部球形S的容积的比例。然后为了计算紧凑性1,紧凑性2和猜想半径,候选segmentation的boundingbox被使用,并且维度称为dimx,dimy,dimz。为了计算紧凑性1,使用boundingbox内的体素的数目除以候选cluster的体素的数目。紧凑性2的计算为,使用bounding box的最大维度($max(dimx,dimy,dimz)$) 构建的立方块的体素除以候选cluster内的体素的数目。猜想半径的计算方法为,将bounding box的容积除以6即可得到。如果是一个完美球形,将会计算得到球形的真正半径。第二步,计算体素的数目和cluster size($mm^3$)可以用来描述候选的尺寸。这些两个特征几乎似乎相同的,但是cluster的size将CT scan的分辨率也考虑进来了。最后,从候选mask体素中计算相同集合的7个Hu moments来描述其形状。注意:与前面为了强度特征计算的Hu moments相反,此处在segmentation内部的体素设为1,之外的设为0。

总共计算13个形状特征。

2.2.2.4 纹理特征

最后定义了一组新的纹理特征,用于描述相对于肺边界、气道树和其他subsolid 结节候选的的候选区域的位置。例如,稍大点的磨砂玻璃不透明度可以被看做由于微观选择的原因造成的肺的重力依赖部分。这会导致候选沿着肺边界有着细长的形状。结合上下文和形状信息可以获悉这一点。另外一种情况是,气道被填满了粘液,在密度强度上可能表现得像磨砂玻璃不透明。这些候选将表现出与气道segmentation重叠,这个可以用来将他们分为假阳性。更进一步说,候选之间的关联也是相关的上下文信息。例如,被其他候选包围的候选更可能是微观选择区域的源头,而不是subsolid结节。

首先,需要计算肺部区域内的两个距离转换;第一个使用肺部segmentation,第二个使用气道树。到肺边界的距离和到气道最近的距离来自对所有候选segmentation内的体素距离转换。这意味着,到肺边界的距离和到气道的距离的方差、最大值、最小值也被用作纹理特征。

其次,bounding box被定义在肺周围,它被用来计算相对位置特征;相对的X,Y,Z位置,以及到bounding box左下角的距离也被计算。甚至会计算两个肺的质心的距离。

再者,计算绝对和相对的气道和血管重叠。为了计算这个,我们会算入 bounding box内的体素,这些体素是气道segmentation或者血管segmentation的部分。相对重叠和绝对重叠的精确体素数目的计算为,bounding box内的体素除以segmentation内的体素。

最后,描述的是候选与其他候选的关系。首先,一个scan内的候选的数目作为一种特征。这提供了肺内部磨砂玻璃区域的数目。其次,计算了候选距离为30mm以内的候选和50mm以内的候选,以及与其他候选最近的候选。

总共有21个这样的纹理特征。

2.3 分类

这部分描述的是优化分类器的性能。然后描述的是CAD系统在独立测试集上的评估。系统评估期间,若候选的质心与结节中心的距离为R之内时结节标记为检测到。为确保CAD系统的标记在CT scan上的结节之中,我们将R设置为结节的半径。

2.3.1 分类模式优化

为选择最佳的分类器模式,做了如下实验。在训练集上做10折交叉验证。因为的病人的同一个结节可能会出现在多个scan中,所以每一折都是以病人级别划分以避免偏差。候选被分类为结节或假阳性(FP),然后CAD系统的最终性能评估使用的是自由响应操作特性(FROC)分析。

候选分类器的测试分为两个阶段。一阶段分类器是计算所有候选的完整特征集,然后使用一个监督学习的分类器将所有候选分为两类。相反的,二阶段分类器的分类器模式是仅仅使用第一阶段的5个特征来做第一阶段的分类。第一阶段的分类器主要是移除尽可能多的假阳性候选。。然后,仅计算剩下余下候选的特征集。这种二阶段的方法有两个优点,第一是计算时间消耗要少,因为第二阶段不用计算所有候选,第二个是第一阶段的分类器会使得数据更加均衡,因为第二阶段做了分类。两种方法都用来测试以评估那种分类模式在分类性能中更优。

二阶段分类的第一阶段的分类器使用的是线性判别分类器(Linear Discriminant Classifier)(LDC Fukunaga 1990),因为其简单性和速度。第一阶段分类器的5个特征的最优集由3种方法获得的。前两种方法是,一种sequential forward floating selectoin(SFFS)。SFFS步骤将训练集中随机取50%作为训练集,剩余的50%作为测试集。第一种方法中,准确率用作SFFS步骤的优化标准。

第二个方法中,FROC曲线下的0-3FP/scan的部分区域用作优化标准。最后第三种方法中,计算所有特征的Fisher’s linear discriminant 比例,其中比例最高的5个特征会被选出。注意这种方法不考虑特征组合。三种不同的LDC分类器使用三种不同的5个特征集合,并为每个分类的所有候选算出一个似然度。第一阶段的每个分类器的似然度通过对所有正样本的似然度排序并选出最低的似然度。紧接着,移除训练集中的非正样本。所有低于此似然度的都被移除。这种方法中,我们获得5个移除了大部分假阳性候选同时没有移除正样本的特征集合。

对于一阶段分类器和二分阶段分类器的第二个阶段,测试了KNN分类器、随机森林分类器、GentleBoost 分类器,最近均值分类器(nearest mean classifier NM),使用径向偏置核函数的支持向量机SVM-RBF和LDC。不同分类器的参数在训练集交叉验证上优化过。
KNN分类器中,K设置为正样本数的均方根。随机森林分类器使用100颗树来训练,最大深度为20. GentleBoost分类器,回归stumps用作若分类器,使用了250个若分类器。分类器之后,一个10GentleBoost的分类器,记为GB10。这100个 GentleBoost分类器都是独立的在训练集上随机去75%作为训练集来训练。GB10分类器的最终输出是10个分类器的输出概率的中位数。对于GB10,每个分类器都是用了250个回归stumps。SVM-RBF分类器的C和伽马参数是从一个10折交叉验证循环的数据集上的内部的5折交叉验证循环优化得到的。是用FROC曲线下方0-3FP/scans的部分区域作为优化标准。所有的特征都被归一化为均值为0和单位方差。

2.3.2 评估上下文特征的收益

我们假设上下文特征有助于更好的分类器性能。是用最终的CAD系统在训练集上对比包含了和不包含上下文特征来测试这个假设。使用Bootstrap方法来测试统计显著性。从交叉验证集中抽样5000次来获得scan。每个bootstrap样本有着原始数据集一样多的scans。FROC曲线下的0-8FPs/scan的区域作为分类器性能的衡量标准。

2.3.3 独立测试集上的最优分类器模式的评估

最优分类器模式,一阶段分类器和二阶段分类器,最优分类器基于训练集上的交叉验证FROC分析。CAD系统的最优分类器模式使用的是完整训练集,并在独立的测试集上评估性能。注意,测试集在分类器模式优化期间并没有使用。

2.4 结合solid nodule CAD

临床实践中,subsolid 结节CAD系统通常与solid结节CAD系统结合使用。尽管solid 结节CAD算法并没有对subsolid结节检测做优化或训练,它们可能检测所有subsolid结节的部分。尤其是,它们可能对检测part-solid结节的solid core十分敏感。

三 结果

3.1 候选检测

训练集中每个scan在候选检测步骤生成 $237\pm267$ 个候选区域,测试集中每个scan生成 $109\pm127$ 个候选区域。训练集中,所有subsolid 结节的候选检测灵敏度为84%,同时part-solid结节和non-solid结节的灵敏度分别为81%和87%。测试集中所有subsolid结节的灵敏度为88%,part-solid和non-solid的灵敏度分别为85%和90%。

3.2 分类器

3.2.1 分类器模式的优化

一阶段分类器模式的训练集上的10折交叉验证的不同分类器的FROC曲线如下图

可以看到GB10分类器性能最好,1FPs/scan时达到了69%的灵敏度,2FPs/scan时达到了74%。注意到候选检测灵敏度为84%,这意味着分类器灵敏度不可能高于这个值。

分类器的第一阶段旨在减少候选区域的FPs数量。使用的是2.3.1节的三种方法,构建第一阶段的分类器的三种不同集合的5特征,其性能在10折交叉验证中测试,结果如下表。下表显示的是阈值使用先验概率设置为T不移除训练集中正样本时的样本移除数量。此表显示,基于Fisher’s linear discriminant比例的特征集移除最多的样本,因此这个特征集被选为CAD系统第一阶段的特征集。

Feature set Reduction ratio(%)
SFFS-accuracy 68
SFFS-partial area under FROC curve 79
Fisher’s linear discriminant ratio 59

第二阶段的不同分类器的性能如下图。与上图相比,GB10分类器表现最好。同时注意,候选检测灵敏度为84%,分类器的灵敏度不可能超过这个值。