在中国,隐私计算领域的发展迅速,多个开源框架被广泛应用于金融、医疗、政务等领域。
开源框架
以下是使用较多的隐私计算开源框架及其特点:
1. FATE(联邦学习框架)
- 开发者:微众银行(WeBank)
- 技术方向:联邦学习(Federated Learning)
- 特点:
- 支持横向联邦、纵向联邦和迁移联邦学习。
- 提供可视化工具(FATE Board)和工业级部署方案。
- 兼容主流机器学习框架(如TensorFlow、PyTorch)。
- 应用场景:金融风控、医疗数据联合建模等。
- 开源地址:GitHub - FATE
2. 隐语(SecretFlow)
- 开发者:蚂蚁集团
- 技术方向:多方安全计算(MPC)、联邦学习、可信执行环境(TEE)融合。
- 特点:
- 整合了多种隐私计算技术(如SPU安全计算单元)。
- 支持大规模分布式计算,适用于复杂业务场景。
- 提供Python友好的API,易与现有AI框架集成。
- 应用场景:广告推荐、联合风控等。
- 开源地址:GitHub - SecretFlow
3. Rosetta
- 开发者:矩阵元(JUZIX)
- 技术方向:基于MPC的隐私计算(兼容深度学习)。
- 特点:
- 基于TensorFlow扩展,支持隐私保护的深度学习模型训练。
- 提供MPC协议(如SecureNN、Helix)的封装。
- 适合已有TensorFlow生态的用户迁移。
- 应用场景:联合数据分析、模型训练。
- 开源地址:GitHub - Rosetta
4. PaddleFL
- 开发者:百度(PaddlePaddle生态)
- 技术方向:联邦学习
- 特点:
- 基于百度飞桨(PaddlePaddle)深度学习框架。
- 支持多种联邦学习策略和自定义算法。
- 适合需要与PaddlePaddle深度集成的场景。
- 应用场景:自然语言处理、图像识别等AI模型的联邦训练。
- 开源地址:GitHub - PaddleFL
5. PrimiHub
- 开发者:原语科技
- 技术方向:多方安全计算(MPC)、联邦学习、隐私求交(PSI)等。
- 特点:
- 模块化设计,支持灵活扩展。
- 提供数据隐私保护的全流程工具链。
- 应用场景:金融数据合作、政务数据共享。
- 开源地址:GitHub - PrimiHub
6. FederatedScope
- 开发者:阿里巴巴、浙江大学
- 技术方向:联邦学习
- 特点:
- 轻量级、模块化设计,支持快速实验。
- 支持跨设备、跨组织的联邦学习场景。
- 应用场景:学术研究、轻量级业务部署。
- 开源地址:GitHub - FederatedScope
选择建议
- 联邦学习优先:FATE、PaddleFL、FederatedScope。
- 多方安全计算(MPC):隐语(SecretFlow)、Rosetta、PrimiHub。
- 企业级支持:FATE(微众)、隐语(蚂蚁)适合需要工业级稳定性的场景。
- 学术研究:FederatedScope提供灵活的模块化设计。
这些框架多数由中国顶尖科技企业或学术机构主导,兼顾技术创新和实际落地需求,可根据具体场景(数据规模、安全要求、技术栈兼容性)选择合适的工具。
隐语(SecretFlow)框架
开源可信隐私计算框架——隐语 SecretFlow,以安全、开放为核心设计理念,支持安全多方计算/联邦学习/同态加密/TEE 等主流隐私计算技术。 积极推进产学研生态共建,助力行业标杆场景应用与数据要素市场发展。
良好的分层设计可以提高开发效率和可维护性,满足不同用户的需求。隐语从上到下一共分为六层。
- 产品层:通过白屏化产品提供隐语整体隐私计算能力的输出,让用户简单直观体验隐私计算,屏蔽隐私计算底层细节,节约开发成本;
- 调度层:提供隐私计算任务的编排与资源调度能力;
- AI & BI 算法层:屏蔽隐私计算技术细节,提供一些通用的算法能力,比如 MPC 的 LR/XGB/NN,联邦学习算法等;
- 设备层:提供了统一的可编程设备抽象,将 MPC、HE 等隐私计算技术抽象为密态设备,将单方本地计算抽象为明文设备;
- 安全协议层:提供密码原语能力,支持高安全、高性能的协议;
- 硬件层:支持TEE可信硬件。