上海科技大学在联邦学习与可视分析的研究中取得重要进展

上海讯    上海科技大学信息学院李权课题组与合作者在联邦学习与可视分析的研究中取得重要进展,成功实现了使用可视分析技术对联邦学习运行全过程的探查。该成果目前以 “Inspecting the Running Process of Horizontal Federated Learning via Visual Analytics”为题在可视化与计算机图形领域旗舰期刊《IEEE可视化与计算机图形学汇刊 》(IEEE Transactions on Visualization and Computer Graphics,TVCG)上在线发表。

作为一种去中心化的机器学习模型训练方法,联邦学习使多个参与方在数据隐私保护、满足合法合规要求的前提下进行大数据合作,解决了数据孤岛问题。但由于联邦学习隐私保护特性,决策者通常缺乏足够信息去探查建模过程中各参与方及联邦模型,只能对潜在异常行为进行浅层次分析,评估参与方贡献及实施必要的干预手段非常有限。李权课题组通过将可视分析技术与横向联邦学习框架进行无缝对接,严格遵循联邦学习数据隐私保护原则,设计并实现支持探查横向联邦学习运行全过程的可视分析框架,帮助联邦学习实践者和大数据合作决策者方便地探查横向联邦学习运行全过程,分析所有参与方在不同通信轮的信息相关性,识别潜在的异常情况及评估各参与方贡献。

李权课题组针对典型的联邦学习的应用场景,总结领域专家是如何在真实应用场景中使用联邦学习,以及在使用过程中的主要关注点,梳理联邦学习技术应用及推广的痛点。根据调研结论,提出一种名为HFLens的交互式可视分析技术,帮助领域专家掌握联邦学习执行过程的概览,全面了解每个通信回合各个联邦参与方的状态,识别可能的异常情况,并评估每个回合的各个参与方贡献。同时,在真实场景中,HFLens支持在全貌概览,通信回合和联邦参与客户端三个层面的细粒度分析,能够识别出参与积极性不高及数据样本分布差异较大的客户端。 两个真实案例研究和专家反馈证实了该系统的有效性。

此项工作由上海科技大学信息科学与技术学院、深圳旭宏医疗科技有限公司人工智能部、微众银行人工智能部及香港科技大学计算机科学与工程学系协作完成,李权为第一作者。该研究得到上科大科研启动经费及香港研究资助局基金的大力支持。

文章链接:https://ieeexplore.ieee.org/document/9408377

图. (a)三轮通信回合的流程示例。(b)基于(a)的示例生成用于检查横向联邦学习运行过程的概述设计。 连接关系指示相应的节点是否参与下一轮联邦通信。

图. (1) 横向联邦学习的参与方模型性能演化遵循一条有规律的路径,远离该路径的参与方最有可能出现异常。(2)领域专家点击第21轮通信回合,在两两比较视图中检查每个横向联邦学习参与方的模型性能指标分布。(3)他们识别出一个异常客户端。(4)他们还发现,客户端5的性能总是低于所有参与方准确率的中位值。(上科大宣)

(0)

相关推荐