如何使用一个有安全性问题的隐私计算技术?

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

易观数字化: 术业有专攻,联邦学习的出现,目的在于解决零信任下异质数据计算的问题。从技术实现的角度看,联邦学习的本质是分布式机器学习,将传输的数据转换成梯度计算或损失函数的参数,保证了数据不流动,但是可以扩大模型训练所需的数据量和数据特征,实现隐私的保护。

联邦学习使用实践

联邦学习分为横向、纵向、迁移三种方式,目前横向联邦的应用居多,例如能够支持计算机视觉计算的微众银行的FedVision。从实现原理上,易观分析总结了横向与纵向联邦的实现流程,如图所示 如何使用一个有安全性问题的隐私计算技术?

联邦学习系统架构图

横向联邦核心目的是扩大样本量,目前在学术与商业化方面应用较多。典型应用场景为反洗钱。

纵向联邦核心目的是扩大同类数据的特征,以获取该类数据的全景,并在本地使用自构建的模型实现数据计算。理论上可以实现的场景为:信用风险管理、精准营销等。

迁移联邦的架构与纵向联邦类似,但是目前尚未有商用化案例。

挑战与风险

作为隐私计算中先进性技术代表,联邦学习的普及应用上存在多种挑战与风险。易观分析总结了以下五点核心挑战:

如何使用一个有安全性问题的隐私计算技术?

其他前沿技术如同态加密、数据匿名、敏感数据智能识别、用户实体行为分析等都在不同程度上有所应用,其中有部分技术方案可以商业化,例如半同态加密技术。同时,传统技术也能够在与其他技术的融合发展过程中,弥补或展现更好的性能,例如匿踪查询技术,可以引入可信第三方,在一定程度上解决匿踪查询中的数据匹配费用不能精确计量的问题。

在研究系列中,易观分析还将对技术全景、产业生态、应用案例、开源市场、应用风险、发展趋势等提供全面分析。

给CTO的提示

方法总比困难多。联邦学习存在的挑战与风险在当下不能得到根本性的解决,但是可以有多种手段规避和缓解潜在的困境。结合目前研究,易观分析为CTO提供以下建议参考:

开源广天下

联邦学习的多数玩家都以不同程度的开源项目为牵引,利用社区的合力,让技术的鲁棒性、适配性、完整性得到全面的提升。2017年开始,陆续出现了OpenMind、微众银行、谷歌、百度、字节跳动、矩阵元等开源项目,具体信息如下表所示,CTO可做参考:

如何使用一个有安全性问题的隐私计算技术?

针对算法构建数据要素安全体系

构建数据要素体系,针对数据本身构建分类、分级规则,为数据可信流通提供了安全基础。同时,在联邦学习应用场景中,需要构建针对算法的数据要素安全体系,保证算法的明文计算和密文计算都有适配性规划与调整。

典型企业:华为与中国电子云等综合平台型企业,在自身全产业链基础上,能够建立从宏观体系到微观功能的全局方案。

融合强化与基础密码协议,控制风险

传输的安全依旧需要引入加密协议,以保证信息本身的安全性。这种处理方式不能从根本上实现绝对的安全,但是为联邦学习提供了一种实践的可能性。在引入强化加密协议时,需要注意模型训练过程中频繁出现加密和解密进程,这回导致网络传输量的增加;同时,需要注意引入的加密协议对训练结果准确性的影响。因此,CTO需要考虑融合强化与基础的密码协议,平衡计算成本和准确性。

典型企业:星环科技——Sophen FL、腾讯云——Angel FL、百度PaddleFL、微众银行FATE目前均支持同态加密和基础协议。

融合区块链技术,实现去中心化计算

去中心化是区块链的看家本领,融合该技术,取代可信第三方,是联邦学习实现无中心化的选择之一。但是在融合使用时,需要注意区块链本身存在的计算与认证的效率问题,以及智能合约存在的“智能化”的真实性问题。目前在学术界有探索性尝试,2021年Swam Learning的诞生,能够将参数共享在Swarm网络中,实现本地数据独立建模。

选择用户体验友好型的平台

联邦学习的诟病之一是交互界面与数据输入的友好性问题,这也是CTO需要考虑的要素之一。数据的输入需要能够支持Hive、MySQL等数据库;界面需要能够实现组件化与模块化操作。

典型企业: 富数科技封装了组件化的IDE,实现流程及业务,给客户以透明化、上下低耦合、算法可扩展的体验。

声明须知: 易观分析在本文中引用的第三方数据和其他信息均来源于公开渠道,易观分析不对此承担任何责任。任何情况下,本文仅作为参考,不作为任何依据。本文著作权归发布者所有,未经易观分析授权,严禁转载、引用或以任何方式使用易观分析发布的任何内容。经授权后的任何媒体、网站或者个人使用时应原文引用并注明来源,且分析观点以易观分析官方发布的内容为准,不得进行任何形式的删减、增添、拼接、演绎、歪曲等。因不当使用而引发的争议,易观分析不承担因此产生的任何责任,并保留向相关责任主体进行责任追究的权利。

随意打赏

提交建议
微信扫一扫,分享给好友吧。