机器学习与深度学习在金融领域的应用
1. 机器学习高级概念
在机器学习和深度学习项目中,有许多有用的概念可以帮助提升项目效果。我们可以探索更复杂的分类器(也有对应的回归问题变体),考虑对分类特征进行编码的替代方法,创建堆叠集成模型,并寻找解决类别不平衡问题的可能方案。
同时,使用贝叶斯方法进行超参数调优,能比流行但缺乏信息的网格搜索方法更快地找到最优超参数集。深入研究特征重要性和AI可解释性也很关键,这有助于我们理解所谓的黑盒模型,不仅对从事ML/DL项目的人员重要,对业务利益相关者也至关重要。我们还可以将这些见解与特征选择技术相结合,进一步提高模型性能或减少训练时间。
1.1 有用的工具库
数据科学领域不断发展,每天都有更多有用的工具出现。以下是一些在项目中可能有用的库和工具:
| 工具名称 | 简介 |
| ---- | ---- |
| DagsHub | 类似于GitHub的平台,专为数据科学家和机器学习从业者定制。集成了Git、DVC、MLFlow和Label Studio等强大的开源工具,帮助用户轻松构建、管理和扩展ML项目。 |
| deepchecks | 用于测试ML/DL模型和数据的开源Python库。可用于各种测试和验证需求,如验证数据完整性、检查特征和目标分布、确认有效数据分割以及评估模型性能。 |
| DVC | ML项目的开源版本控制系统。可将不同版本的数据和模型信息存储在Git中,实际数据存储在其他地方(如AWS、GCS、Google Drive等云存储)。还能创建可重现的数据管道,并存储数据集的中间版本,使用与Git相同的语法。 |
| MLFlow | 用于管理M
超级会员免费看
订阅专栏 解锁全文
1699

被折叠的 条评论
为什么被折叠?



