用户隐私与推荐精度兼得,星云Clustar“联邦安全矩阵分解”论文被国际权威期刊收录
近日,星云Clustar主导的论文“联邦安全矩阵分解框架(Secure Federated Matrix Factorization)”正式被《IEEE Intelligent Systems》期刊收录。在论文中,星云Clustar 算法工程师柴迪、星云Clustar AI科学家王乐业等人基于联邦学习环境提出一个名为FedMF的安全矩阵分解框架,在不牺牲任何准确度的前提下,保护用户的隐私信息。该论文首次从数学上验证了矩阵分解在横向联邦学习中交换梯度明文信息会造成隐私泄露,并提出了使用同态加密对梯度信息进行保护的解决方案。
IEEE(电气和电子工程师协会)是世界最大的非营利性专业技术学会,据IEEE官方2019年统计数据显示,其会员人数超过40万人,遍布160多个国家。IEEE致力于电气、电子、计算机工程和与科学有关的领域的开发和研究,在航空航天、信息技术、电力及消费性电子产品等领域拥有近1300余个正在开发的行业标准及项目,现已发展成为具有较大影响力的国际学术组织。IEEE Intelligent Systems 是其出版的极具含金量的学术期刊之一,关注包括自然语言处理、机器学习、数据挖掘、自适应和智能机器人技术、以及与智能系统相关领域的研究进展。
大数据红利已经渗透到各行各业,而光鲜的数据繁荣背后却是隐私泄露和安全管理的重重隐患,提升对数据隐私与安全的保护力度已成为世界性的议题。近年来,新兴的人工智能基础技术——联邦学习(Federated Learning)应势而生,作为一种加密的机器学习范式,联邦学习能够在满足数据隐私、安全以及政府监管的前提下,使得各参与方的数据得以保留在本地,并在安全可信的数据保护措施下打破数据孤岛难题,让企业数据无论在内外部均能安全有序地交互和聚合,实现共同获益的“数据联邦”。
目前在隐私保护机器学习领域,推荐系统是一个广受关注的研究课题,而矩阵分解是常见的技术手段。星云Clustar团队在论文中证明,在传统的矩阵分解推荐系统中,当用户将梯度信息以明文形式发送到服务器,仍有泄露用户的评分信息、特征向量等信息的可能性,进而暴露用户的年龄、性别、地址等等隐私数据,造成难以预估的严重风险。为此,星云Clustar团队设计了一个用户级的分布式矩阵分解框架FedMF,采用同态加密来增强该分布式矩阵分解框架,并用一个真实的电影分级数据集对其进行了测试,结果验证了FedMF对于一个诚实但好奇的服务器是安全可靠的,并且精度相对于用户原始数据的矩阵分解并无二致。
FedMF的创新性见解已落地于FATE。FATE(Federated AI Technology Enabler)是微众银行推出的全球首个工业级别的开源联邦学习框架,旨在推进安全合规的AI协作生态建设。星云Clustar合作设计了基于FATE的联邦推荐算法库(FedRec),使得联邦学习在推荐系统中的应用更加明确化。这一算法库包含了6种常用的推荐算法,包括5种纵向联邦学习算法和1种横向联邦学习算法,可用于解决联邦学习场景下的推荐问题,如评分预测、物品排序等。FedRec广泛支持各种推荐场景,对于开放者而言,可以显著提高产品分发效率和算法预测效果,优化用户体验,还可解决数据不足和标签短缺等问题。
星云Clustar近年来在联邦学习领域不断创新求索,赋能AI数据协作生态。在技术普及与规范上,星云Clustar携手微众银行、创新工场、腾讯云、小米、华为、华大基因等三十余家海内外知名企业与研究机构共同推进IEEE联邦学习国际标准,其中星云Clustar荣获IEEE联邦学习工作组秘书长单位,负责制定联邦学习的底层系统架构标准并积极进行联邦学习生态推广。在产品形态上,星云Clustar提供从硬件到软件的全生命周期解决方案,实现同态加密环境下的无损运算,能以高效计算、超低延时的算力加速联邦学习场景中海量密态数据处理过程。
近年来,联邦学习技术以破竹之势备受行业瞩目,为有效解决数据孤岛分布现象、以及满足日益加强的隐私监管力度提供了新的技术思路。作为联邦学习赛道的积极探索者,星云Clustar未来将继续以高性能网络和联邦学习技术助力人工智能产业发展与技术突破,深掘联邦学习落地场景的可能性,推进联邦学习带来的技术红利落实于各行各业,使企业与机构的多方安全协作更具可得性。
论文作者介绍
“联邦安全矩阵分解框架(Secure Federated Matrix Factorization)”论文第一作者是星云Clustar算法工程师柴迪,星云Clustar AI科学家、北京大学助理教授、博士生导师王乐业(按姓名字母排序);第二作者为星云 Clustar创始人、香港 科技 大学教授陈凯;第三作者为微众银行首席人工智能官、香港科技大学教授杨强。
此前,此论文也发表在IJCAI 2019 Federated Machine Learning Workshop,IJCAI 国际人工智能联合会议是全球人工智能领域最权威的学术会议之一。