隐私安全计算赋能AI药物发现|翼方健数受邀参加2021人工智能药物研发创新论坛
隐私安全计算是一个全新的概念。从技术层面来讲,隐私安全计算包含多种计算模式,其中较为常见的有安全沙箱计算/TEE、联邦学习、多方安全计算、同态加密等。通过使用这些前沿的技术手段,隐私安全计算得以解决数据安全和数据共享这两者之间的矛盾、最终实现在保护数据资产安全的前提下完成数据协作,实现数据价值的挖掘、流通和合理分配。
AI制药领域持续发展的核心基础之一是持续不断增加的数据资源。数据质量不佳、特定任务可用的数据过少、以及负样本数据缺失等常见问题是制约AIDD发展的关键原因。因此,通过隐私安全计算促进数据协作,使丰富、高质量的数据安全地用于模型训练,对于AI制药行业有着重要的意义。
解决数据孤岛问题的隐私安全计算技术,在药物发现领域已有实例。
翼方健数的技术栈支持多种主流的隐私安全计算方式,包括多方安全计算MPC、联邦学习、安全沙箱计算/TEE,此外还有差分隐私,对抗神经网络等。根据用户的使用场景、信任假设的不同,翼方健数帮助客户选择最合适的计算方式。
根据信任假设和计算复杂度要求,可以选择不同合适的计算方式
安全沙箱的计算环境,是一个对包括管理员在内的用户完全隔离的计算黑盒。处于加密状态的模型和数据进到沙箱后完成解密,模型对数据进行运算,运算得到的结果加密后传输到沙箱外,然后沙箱环境随即销毁,确保模型代码以及数据的安全。
燧坤智能和翼方健数的协作主要用到安全沙箱计算
可信执行环境
在沙箱环境外增加可信执行硬件TEE会对内存加密,规避了恶意的平台操作系统窃取模型代码及数据的风险,由此进一步提高了沙箱的安全性。翼方健数是信通院首批通过TEE测评的企业,并参与制定进一步测评的标准。
可信执行环境进一步提高了安全性
全面支持跨平台联邦学习
联邦学习技术利用多个数据所有方的数据分布式地训练同一个机器学习模型,过程中各方原始数据不离开自己的平台,使多方得以安全协作、共同发掘数据价值。
翼方健数开发了一整套联邦学习的框架,同时也支持通用的FATE、TF、Paddle等框架,全面支持跨平台联邦学习,目前已通过工信部信通院联邦学习标准评测。
翼方健数的跨平台联邦学习