
模型训练
文章平均质量分 68
LRJ-jonas
药物设计
展开
-
如何用 tensorflow 构建卷积网络,使用batch_size批量训练?
其中,`batch_size`是指每次训练时使用的样本数,`epochs`是指训练的轮数。在训练时,每个epoch会将所有训练数据都过一遍,而每个epoch又分为多个batch,每个batch包含的样本数就是`batch_size`。通过修改代码中的`batch_size`参数即可实现批处理。# 修改代码以使用batch_size进行批处理。# 将卷积层的输出扁平化,以便输入到全连接层。# 编译模型,指定损失函数和优化器。原创 2023-04-23 15:10:40 · 810 阅读 · 0 评论 -
模型欠拟合怎么解决?
模型欠拟合怎么解决?原创 2023-01-03 12:00:20 · 1544 阅读 · 0 评论 -
【多项式】特征交叉、特征组合的实现代码
取消掉偏置项:(至此就只留下了a,b,a*b)相关知识:模型欠拟合怎么办?原创 2023-01-03 10:29:01 · 631 阅读 · 0 评论 -
Pytorch的 Dataset 的使用
一个自定义的Dataset必须有三个函数:__init__, __len__, and __getitem__图片存储在img_dirimport os。原创 2022-12-28 21:53:54 · 808 阅读 · 0 评论 -
【深度学习动手做】Dataset类,读取数据库中带标签的图片
原来,__getitem__的是类中一个特殊方法,可以像字典对象那样根据key取值(dict['key']),如类对象Object['key'],系统会自动调用__getitem__方法(所以pytorch里面Dataloader有时候没有发现主函数直接调用__getitem__,原来是系统自动调用!以下代码时read_data.py的内容,用于读取特定文件夹的图片数据。不应该使用 __getitem__()函数吗?data文件夹、read_data.py ...,然后按照标签分为两个文件夹。原创 2022-12-13 15:59:03 · 827 阅读 · 0 评论 -
线性回归算法——小批量随机梯度下降
如果要训练的模型有庞大的特征数量,则应选择“梯度下降法”。原创 2022-10-01 16:23:01 · 696 阅读 · 0 评论 -
【GridSearch实例】制作 KNeighborsClassifier 的MNIST数据集分类器,用GridSearch找最佳模型参数组合
据说KNeighborsClassifier模型比较适合,那就开干!MNIST数据集是一个经典分类数据集,包含了70000张。模型的任务就是对其进行学习,然后给一张像素图,他就能。(像素图,手写的0-9的十个数字),以及每张图的。那么就对这两个进行GridSearch。这个图片是哪个数字。原创 2022-09-11 23:22:40 · 441 阅读 · 0 评论 -
python特征选择——两个连续变量的线性相关系数
F检验:统计量F和 r x y 2 r_{xy}^2 rxy2变化方向一致,即与相关系数绝对值的变化保持一致,本质上和相关系数一样,也是衡量了两个变量之间的相关性,并且是一种线性相关关系,并且数值越大、线性相关关系越强,反之则越弱。import pandas as pdimport numpy as npimport random# 构建数据random.seed(6)df = pd.DataFrame({'Y':[random.uniform(1,200) for _ in r原创 2022-05-30 23:22:14 · 1399 阅读 · 0 评论 -
使用sklearn计算随机森林模型中各特征的重要性
内置随机森林重要性 (Built-in Random Forest Importance)基尼重要性 (或平均减少杂质),由随机森林结构计算得出。我将展示如何使用scikit-learn软件包和Boston数据集(房价回归任务)来计算随机森林的特征重要性。boston = load_boston()X = pd.DataFrame(boston.data, columns=boston.feature_names)y = boston.targetX_train, X_test, y_t转载 2022-05-10 01:06:28 · 8822 阅读 · 0 评论 -
sklearn metrics 的使用方法
二、 scikit-learn.metrics导入与调用有两种方式导入:方式一:from sklearn.metrics import 评价指标函数名称例如:from sklearn.metrics import mean_squared_errorfrom sklearn.metrics import r2_score直接使用函数名调用:mse = mean_squared_error(y_test, y_pre)R2 = r2_score(y_test,y_pre)原创 2022-04-29 00:08:35 · 8750 阅读 · 2 评论 -
机器学习算法数据的准备——数据清理、转换器、流水线
数据清理机器学习算法难以在缺失的特征值上工作,所以我们要创建一些函数处理那些缺失的特征值。1.放弃相应的区域,抛弃缺失数据的样本2.放弃整个特征3.将缺失的值填充为特定的值(平均数、中位数、0)可以使用sklearn中的SimpleImputer填充中位数。如下例,设置超参数strategy="median",然后用drop函数抛去文本类型的特征(这里是"ocean_proximity"),然后用 fit()函数 对数据进行使用。from sklearn.impute import原创 2022-02-24 12:01:56 · 838 阅读 · 0 评论 -
集成学习的简介(读 西瓜书 笔记)
集成学习(ensemble learning )又称多分类器系统(muti-classifier system)、基于委员会的学习(committee-based learning)。其通过构建并学习多个分类器来构建系统。图8.1显示出集成学习的一般结构:先产生一组“个体学习器”(individual learner),再用某种策略将它们结合起来,个体学习器通常由一个现有的学习算法从训练数据产生,例如决策树算法、BP神经网络算法等,此时集成中只包含同种类型的个体学习器,例如“决策树集成”中全是决策.原创 2021-12-08 13:37:17 · 526 阅读 · 0 评论