使用Transformer的无卷积医学图像分割
重磅干货,第一时间送达

小白导读
论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。


摘要
与计算机视觉中的其他应用一样,医学图像分割最成功的解决方法是使用深度学习模型,该模型依赖于卷积操作作为其主要构建模块。卷积具有一些重要的特性,比如稀疏交互、权值共享和平移均衡性。这些特性使卷积神经网络(CNNs)在视觉任务中具有强大而有用的诱导偏差。在这项工作中,作者证明了完全基于相邻图像块之间的自我注意,而不需要任何卷积操作的不同方法可以获得竞争或更好的结果。给定一个3D图像块,作者的网络将其分成n 3个3D patch,其中n = 3或5,计算每个patch的1D嵌入量。该网络根据各patch嵌入之间的自我注意度预测块中心patch的分割图。作者表明,在三个数据集上,所提出的模型可以达到比最先进的cnn更好的分割精度。作者还提出了在未标记图像的大型语料库上对该模型进行预训练的方法。作者的实验表明,在预先训练的情况下,当标记的训练数据很小时,作者提出的网络相对于cnn的优势是显著的。

本研究的目的是探讨基于自我注意的深度神经网络在三维医学图像分割中的潜力。作者提出了一种基于三维图像块线性嵌入之间的自我注意的网络结构,不需要任何卷积操作。作者在三个医学图像分割数据集上训练网络,并将其性能与最先进的CNN进行比较。本工作的贡献如下:
提出了第一个用于医学图像分割的无卷积深度神经网络。
在三个不同的医学图像分割数据集上,作者证明了作者提出的网络可以实现优于或至少相当于最先进的CNN的分割精度。作者表明,与最近的图像分类([8][33])不同,作者的网络可以有效地训练用于3D医学图像分割的数据集20 200个标记图像。
在有大量未标记训练图像的情况下,提出了提高网络分割精度的预训练方法。作者表明,当有标记的训练图像数量较少时,作者的网络表现得比预先训练的最先进的CNN要好。

框架结构

提出的一种用于三维医学图像分割的无卷积网络

实验结果

所提出的网络和最先进的CNN预测的样本分割

用该方法和UNet++预测的样本分割

结论
卷积运算在哺乳动物初级视觉皮层的结构中有很强的基础,适合于开发强大的图像建模和图像理解技术。近年来,cnn已被证明在解决各种计算机视觉问题方面非常有效。然而,没有理由相信没有其他模型能在特定的视觉任务上胜过cnn。特别是医学图像分析应用,带来了特定的挑战,如图像的3D性质和少量的标记图像。在这样的应用中,其他模型可能比cnn更有效。本文提出了一种新的三维医学图像分割模型。与最近所有使用卷积作为主要构建块的模型不同,作者的模型是基于相邻3D补丁之间的自我注意。作者的结果表明,在三个医学图像分割数据集上,所提出的网络可以优于最先进的CNN。通过对未标记图像进行去噪和绘画任务的预训练,作者的网络在只有5-15个标记的训练图像可用时也比CNN表现更好。作者期望本文提出的网络能够有效地用于医学图像分析的其他任务,如异常检测和分类。
每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。
- END -

#投 稿 通 道#
让你的论文被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。深度学习爱好者 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
深度学习爱好者 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
📝 来稿标准:
· 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)
· 如果文章并非首发,请在投稿时提醒并附上所有已发布链接
· 深度学习爱好者 默认每篇文章都是首发,均会添加“原创”标志