- 博客(6)
- 收藏
- 关注
原创 【Datawhale AI春训营】AI + 新能源(发电功率预测)Task 学习笔记
它接收模型类对象、训练数据特征矩阵、训练数据标签向量、测试数据特征矩阵、模型名称及随机种子作为参数,先将训练数据按 5 折划分,接着在每一折里依据模型名称选择对应模型训练,训练中定义好模型参数并设置早停机制,完成后用模型对验证数据和测试数据预测,将验证集预测结果存于 `oof` 数组,累加测试数据预测结果并取平均,同时计算每折验证集的平均绝对误差存入 `cv_scores` 列表,最后返回训练数据在验证集的预测结果和测试数据的预测结果。利用特征变换,如归一化、编码等操作,让特征适配模型需求;
2025-04-19 15:40:52
420
原创 【Datawhale AI春训营】RNA结构预测(AI+创新药)Task 学习笔记
RNA (核糖核酸) 在细胞生命活动中扮演着至关重要的角色,从基因表达调控到催化生化反应,都离不开 RNA 的参与。RNA 的功能很大程度上取决于其三维 (3D) 结构。理解 RNA 的结构与功能之间的关系,是生物学和生物技术领域的核心挑战之一。RNA 折叠 是指 RNA 序列自发形成特定三维结构的过程。而 RNA 逆折叠 则是一个更具挑战性的问题,即基于给定的RNA 三维骨架结构设计出能够折叠成这种结构的 RNA 序列。
2025-04-19 14:22:42
214
原创 Datawhale AI冬令营(第一期)day01
简单了解数据集的两种格式,Alpaca格式和ShareGPT格式(了解微调的数据集是定制大模型的关键)(5)创建应用 控制台-讯飞开放平台 (起名-填写应用分类-填写应用功能描述)(3)创建模型(起名-选择模型类型-选择基础模型-导入数据集-提交)学习内容:基于讯飞星辰Maas平台定制专属大模型。(1)进入讯飞开放平台注册星火大模型精调平台。(6)体验 将训练好的模型发布为服务。案例1:定制AI甄嬛语录bot。
2024-12-11 23:55:38
216
原创 Datawhale X 李宏毅苹果书 AI夏令营 Task3:深度学习实践方法论
应用机器学习算法时,实践方法论能够帮助我们更好地训练模型。如果在 Kaggle 上的结果不太好,虽然 Kaggle 上呈现的是测试数据的结果,但要先检查训练数据的损失。看看模型在训练数据上面,有没有学起来,再去看测试的结果,如果训练数据的损失很大,显然它在训练集上面也没有训练好。(图示在训练集上面没有学好的几点原因)
2024-09-03 08:53:48
1288
原创 机器学习新手入门 笔记Task2 #夏令营#Datawhale X 李宏毅苹果书AI夏令营
线性模型是基于线性关系(即一次函数关系)对数据进行建模和预测的方法。在这些模型中,目标变量(也称为因变量或响应变量)被假定为一个或多个自变量(也称为特征、解释变量或预测变量)的线性组合,加上一个误差项。这种关系可以表示为一个方程,其中每个自变量前的系数表示该自变量对因变量的影响程度,而误差项则捕捉了模型中未包含的因素或随机变异。线性模型的核心特点在于其简单性和可解释性。它们不仅易于理解和实现,而且能够清晰地展示自变量和因变量之间的关系。
2024-08-31 21:16:40
1456
原创 机器学习新手入门第一章 笔记01#夏令营#Datawhale X 李宏毅苹果书AI夏令营
对参数w与b随便选一个初始的值,先计算w 对 L 的微分,再计算一下 b 对 L 的微分,接下来更新 w 跟 b,更新的方向就是 ∂L/∂w,乘以 η (学习率)再乘以一个负号,∂L/∂b,算出这个微分的值(总结来说就是第一步:取初始点,求微分;分类(classification):函数的输出是从设定好的选项中筛选一个结果输出。根据不同的参数,计算它的损失,画出来的等高线图(w-b的相关图)称为误差表 面(error surface)对于其他特定的问题,会有其适合的损失函数,并不仅限于上面的三种。
2024-08-27 18:52:24
798
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人