机器学习项目关键要点解析
1. 数据准备与理解
在开展机器学习项目时,为了深入了解组织对机器学习的准备情况,可以推动一个短期项目。这个项目能提供合同保障,支持数据的提取和检查,涵盖隐私、数据保留与使用条款,以及安全和数据处理承诺。通过这项工作,团队能对数据有足够深入的理解,从而更有信心预测项目建模阶段可能取得的结果。
尽管在项目初期获取数据资源存在挑战,但务必尽力理解并记录团队将使用的数据模型,掌握数据的真实特征。在对数据缺乏足够了解的情况下规划和构建机器学习项目风险极高。若这些任务未妥善完成,在项目估算中加入大量应急项十分重要,包括时间和资金方面,以避免团队在数周内通宵达旦地解决严重的数据问题。若无人知晓数据里的具体内容,这极有可能意味着存在待发现的实际问题。
2. 安全与隐私
安全和隐私是机器学习项目的重要考量因素。机器学习项目与数据资源紧密相连,这些数据往往敏感且重要,许多业务流程依赖它们,或者包含受法律保护的个人隐私信息。
任何不安全的项目都可能给组织带来安全漏洞,因此机器学习项目需满足合作组织的安全要求。为此,应尽快与目标组织的安全基础设施对接。在项目售前阶段,对接的目标是收集评估安全约束和要求对项目影响所需的信息。系统安全方面的审批通常由不同组织负责,有时组织内的安全部门与 IT 部门完全分离,首席安全官(CSO)直接向首席执行官(CEO)汇报。
在客户组织中,理想情况下能确定并对接单一的安全利益相关者,但更多时候需要多个安全利益相关者参与项目。以下是需要考虑的关键事项:
- 确定安全利益相关者 :针对每个核心数据集、相关组织和 IT 平台,明确安全利益相关
超级会员免费看
订阅专栏 解锁全文
448

被折叠的 条评论
为什么被折叠?



