基于拉普拉斯约束的半监督模糊C均值算法

基于拉普拉斯约束的半监督模糊C均值算法

近年来,聚类分析在模式识别、图像处理和数据挖掘中得到了广泛的应用。它试图将数据集划分为不同的组,使得同一集群中的数据点具有较高的相似性,而不同集群中的数据点具有较低的相似性。到目前为止,已经开发了许多聚类算法,包括层次聚类、谱聚类和模糊c均值聚类(FCM)等。

作为半监督聚类,可以采用不同的方法来控制聚类过程。传统的模糊聚类算法对未知样本的使用率较低,针对于该问题,相关领域学者经过不断研究提出了半监督模糊聚类。由于模糊c均值(FCM)是最经典的算法之一,一些相关的工作已经被提出,来约束半监督模糊c均值,例如在隶属度中加入半监督项。在汉斯出版社《应用数学进展》期刊中,有学者表明半监督模糊聚类算法通过将少量的数据类别标签作为监督信息加入到模糊聚类算法中,使其在整个聚类迭代优化过程中发挥一定的监督作用。

SFCM算法是一种经典的半监督聚类算法,它以标签信息作为先验知识。该算法将已知的类别标签集成到隶属度矩阵中,指导隶属度矩阵的优化,约束项中所含的先验信息则会对隶属度矩阵的优化起监督作用,并创建最合理的模糊划分,以此提高聚类效果。

半监督聚类方法分为基于相似度的聚类方法和基于搜索的聚类方法,有学者提出了一个框架,对由边缘信息构造的加权拉普拉斯矩阵进行优化更新。重要的是,结合稀疏性的概念,进一步引入惩罚项,使每个样本的对象簇成员具有适当的稀疏性。该算法不仅保证了软聚类算法在实际应用中的鲁棒性,而且考虑到隶属度数量较少,避免了性能下降。

根据不同聚类评价算法的适用范围,提出了一种特征加权模糊半监督聚类算法(SFFD)。该算法基于完全自适应的距离函数、特征权重和两两约束构造一个统一的目标函数,用于在两两约束下搜索最优原型参数和最优特征权重。同时,给出了四种不同的模糊聚类有效性评价算法,采用不同的算法来评估SFFD算法的有效性,得到不同输入数据集的最优聚类数,从而确定聚类形成过程中的聚类数。文章中提出的半监督模糊聚类算法充分利用了已知的信息样本,以最小信息熵对应的聚类数作为整个样本的最优聚类数,以此得到的聚类中心是模糊聚类的原始聚类中心。

本文在研究模糊c均值聚类(FCM)算法的基础上,通过加入正则项来约束FCM,提出了一种基于拉普拉斯约束的模糊c均值(FCML)算法,给出了FCML算法的迭代结果,并对其进行非负证明,即uij经过多次迭代后,其最终结果仍为非负数,以此来证明该算法的有效性。文章提出了基于拉普拉斯约束的半监督模糊c均值(SFCML)算法,该算法通过引入一些监督信息来改进FCML算法,可以在不提供先验信息的情况下充分利用先验信息来对未标记样本进行部分标记,合理有效地利用部分已识别样本的类别信息,从而提高半聚类算法的聚类性能,其最终结果具有和FCM算法一样简洁的隶属度与聚类中心的迭代公式。

最后,将文章中提出的基于拉普拉斯约束的模糊c均值(FCML)算法及基于拉普拉斯约束的半监督模糊c均值(SFCML)算法与原始模糊c均值(FCM)的聚类性能进行了检验和评价。

本文在经典FCM算法的基础上引入了拉普拉斯算法进行约束,提高聚类的抗噪性能以及提取重要的属性特征,并将最终迭代结果进行非负验证。其次,利用少量标记信息进行数据预处理,构造半监督聚类算法SFCML来对FCML算法进行改进。此外,由于SFCML的目标函数是基于FCM的,它继承了聚类算法FCM的大部分优点。本文在真实数据集上进行算法对比实验,实验结果进一步验证了本文提出的SFCML算法的有效性。

文章链接:https://doi.org/10.12677/AAM.2021.102049

(0)

相关推荐

  • 【学术论文】改进指纹库精度下的室内定位算法研究

    摘要: 随着传感器网络的不断发展,基于位置服务逐步成为研究热点,其中的室内定位技术发展更为迅猛.为准确而快速地确定室内待测节点位置,通过对ZigBee无线网络的研究,提出在离线建库阶段使用基于离群点检 ...

  • 谱聚类(spectral clustering)原理总结

    谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也 ...

  • 【学习笔记】嵌入式技术(11):基于Kinect传感器的康复训练系统

    2015年微型机与应用第11期 作者:杨文璐,占 婵 摘  要: 针对脑卒中患者后期的康复训练需求,设计并实现了一个基于Kinect传感器的实时康复训练指导系统.该系统利用Kinect传感器实时采集人 ...

  • 到底什么是谱聚类算法?

    谱聚类算法是目前最流行的聚类算法之一,其性能及适用场景优于传统的聚类算法如k-均值算法. 本文对谱聚类算法进行了详细总结,内容主要参考以下论文,若对谱聚类算法有不理解的地方,欢迎交流. 论文名称: & ...

  • R语言谱聚类、K-MEANS聚类分析非线性环状数据比较

    原文链接:http://tecdat.cn/?p=23276 有些问题是线性的,但有些问题是非线性的.我假设,你过去的知识是从讨论和解决线性问题开始的,这是一个自然的起点.对于非线性问题的解决,往往涉 ...

  • 基于MRI医学图像的脑肿瘤分级

    本文对近年来脑磁共振(MR)图像分割和肿瘤分级分类技术进行概述.文章强调了早期发现脑肿瘤及其分级的必要性.在磁共振成像(MRI)中,肿瘤可能看起来很清楚,但医生需要对肿瘤区域进行量化,以便进一步治疗. ...

  • 用于半监督语义分割的基于掩码的数据增强

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • 基于深度学习的无监督磁共振图像去噪方法

    MRI图像是一种以不同灰度显示不同结构的解剖和病理的断面图像,广泛应用于疾病的检测.诊断以及治疗监测.然而,MRI图像的成像过程往往伴随着随机噪声,这导致了低质MRI图像的产生.MRI图像的质量不仅会 ...

  • TricycleGAN:基于形状先验的无监督图像合成和分割

    重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...

  • 自监督、半监督、无监督学习,傻傻分不清楚?最新综述来帮你!

    推荐给大家一篇昨天arXiv新出的论文 : A survey on Semi-, Self- and Unsupervised Techniques in Image Classification ( ...

  • 基于调峰约束的河北南网风电消纳能力研究

    2017第六届新能源发电系统技术创新大会 中国电工技术学会主办,2017年6月21-24日在河北省张北县举办,大会围绕新能源发展战略.系统关键技术.微电网及储能等重要议题展开交流.浏览会议详情和在线报 ...

  • 基于单片机的胶带输送机智能模糊检测系统设计

    点击下面标题,了解通知详情 2020第九届电工技术前沿问题学术论坛暨第十三届中国电工装备创新与发展论坛 胶带输送机因施加的负载频繁变换,导致实际运行速度与设定运行存在误差,因此打滑检测系统经常会发生误 ...

  • 基于统编教材对半包围结构产生的困惑

    自2016年部编版教材问世以来,教材一直在做改动,每个学期都有增删改的情况,有的甚至改动比较大.尽管我在每学期开学前会对教材有一个全面的了解,也会关注到教材的变化,但是尴尬之事还是时有发生. 前不久, ...

  • 基于跟踪质量熵的分布式组网雷达航迹融合算法

    0 引言 在分布式多传感器融合系统中,由于各传感器平台的测量误差.导航误差.传感器系统误差.传输延迟误差.目标跟踪误差等不同,传统的统计学关联方法如最近邻法.JPDA法.极大似然概率法存在不同时刻关联 ...

  • 基于局部对比度机制的红外弱小目标检测算法

    0 引言 随着红外焦平面性能水平的不断提高,红外探测系统在军事和民用中得到了广泛的应用,尤其是在制导.预警等领域具有非常重要的应用价值[1].其中,能否及时准确地检测到远距离目标,是关系到能否有效地制 ...