- 博客(2)
- 收藏
- 关注
原创 机器学习——模型评估与参数选择
数据集D,训练集和测试集的产生方法(训练和测试要尽可能保持数据分布一致性):(1)留出法(hold-out):直接将数据集 D划分为两个互斥的集合,其中一个为训练集S,另一个为测试集T.。k通常取10(10折交叉验证)。(5)泛化误差(generalization error):学习器在新样本上的误差,希望得到泛化误差小的学习器,然而事先不知道新样本是什么样的,实际能做的使经验误差最小化。(1)错误率和精度:二分类和多分类均适用(2)准确率:P=TP/(TP+FP)(3)召回率:R=TP/(TP+FN)
2024-09-17 23:09:22
385
原创 机器学习算法
**《Distilling the knowledge in a neural network》**:这篇论文由G. Hinton等人于2015年发表,介绍了知识蒸馏技术,即将大模型的知识迁移到更适合推理的小模型上[^1^]。- **多尺度蛋白模型ms-ESM**:通过多尺度建模,拓展了蛋白语言模型的处理能力,使其能处理原子尺度信息[^3^]。- **Mol-AE**:提出了基于自编码器的3D分子表示学习方法,打破了传统模型在分子性质预测上的局限性[^3^]。
2024-09-08 20:48:05
680
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅