自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 关于PYTORCH GEOMETRIC安装失败的问题(已解决)

最近在安装PYTORCH GEOMETRIC时出现了很多的问题。pytorch的安装建议在anaconda中安装官网,然后在pytorch官网根据自己的系统选择下载。选择好版本后,建议在anaconda prompt中创建一个新环境进行安装后进入到新配置的pytorch环境中进行下载安装过后进行版本查询pytorch安装好以后进行PYTORCH GEOMETRIC的安装。PYTORCH GEOMETRIC的安装根据torch和cuda的版本在官网中下载whl版本。根据自己的版本选

2021-06-18 09:56:50 910

原创 文件自动化处理

感谢datawhale提供的学习机会。文件自动化处理读写文件学习内容使用python在硬盘上创建、读取和保存文件。首先,要了解文件的两个属性。路径和文件名,路径指明文件在计算机上的位置,文件名是指该位置的文件的名称。在windows上,路径书写是使用倒斜杠’‘作为文件夹之间的分隔符,而在OS X和Linux上,是使用正斜杠’/'作为它们的路径分隔符。os.path.join() 函数来创建文件名称字符串os.getcwd() 函数用来获取当前工作目录os.chdir() 改变当前工作目录路

2021-06-16 21:48:45 136

原创 集成学习之模型超参数调优

集成学习之模型超参数调优首先感谢Datawhale提供的学习机会。第一我们要明白什么是参数什么是超参数。参数与超参数:岭回归中的参数a和参数w之间有什么不一样?事实上,参数w是我们通过设定某一个具体的 后使用类似于最小二乘法、梯度下降法等方式优化出来的,我们总是设定了是多少后才优化出来的参数w。因此,类似于参数w一样,使用最小二乘法或者梯度下降法等最优化算法优化出来的数我们称为参数,类似于a一样,我们无法使用最小二乘法或者梯度下降法等最优化算法优化出来的数我们称为超参数。模型参数是模型内部的配置变

2021-03-24 20:59:12 519

原创 集成学习之优化基础模型

集成学习之优化基础模型在回归问题中,我们常用训练集去估计模型的参数,然后用测试集去预测。我们常会遇到的问题就是模型在训练集上的表现很好,但是在测试集上的表现却一般。我们所希望的是测试集与训练集的表现相近,或者说训练集优于测试集,这样我们所作的工作才是有意义的,我们可以从以下几个角度去考虑:1.训练均方误差与测试均方误差:在回归中,我们最常用的评价指标为均方误差,即:,其中是样本 Xi应用建立的模型f预测的结果。如果我们所用的数据是训练集上的数据,那么这个误差为训练均方误差,如果我们使用测试集的数据计

2021-03-22 10:53:03 383

原创 2021-03-18

集成学习之基本回归方法文章内容来源于datawhale通常来说,一个完整的机器学习项目应分为如下步骤:(1)明确自己的任务是回归还是分类。(2)收集数据集,选择合适的特征。(3)选择度量模型性能的指标。(4)选择项目的模型并进行训练优化模型。(5)评估模型的性能并调参。Sklearn构建的完整回归项目(1)收集数据集并选择合适的特征:用sklearn中的boston房价数据集from sklearn import datasets boston = datasets.load_bo

2021-03-18 17:02:25 184

原创 集成学习

机器学习之集成学习感谢Datawhale提供的学习机会。1.导论首先集成学习是机器学习里面的概念,所以我们要先了解一下机器学习。什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用????????来表示一个样本,其中???? = 1, 2, 3, . . . , ????,共N个样本,每个样本???????? = (????????1, ????????2, . . . , ???

2021-03-15 15:25:25 138

原创 2020-12-29

连接关系型连接连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照姓名和 班级连接成总的成绩表,又例如对企业员工的各类信息表按照 员工 ID 号进行连接汇总。由此可以看出,在关系型连接中,键是十分重要的,往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接 outer

2020-12-29 19:08:01 221 1

原创 2020-12-27

变形长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:显然这两张表从信息上是完全等价的,它们包含相同的身高统计数值,只是这些数值的呈现方式不同,而其呈现方式主要又与性别一列选择的布局模式有关,即到底是以 long 的状态存储还是以 wide 的状态存储。因此,pandas 针对此类长宽表的变形操

2020-12-27 12:25:04 117

原创 2020-12-24

分组分组模式及其对象分组的一般模式分组操作在日常生活中使用极其广泛,例如:• 依据 性别分组,统计全国人口 寿命的 平均值• 依据 季节分组,对每一个季节的 温度进行 组内标准化• 依据 班级分组,筛选出组内 数学分数的 平均值超过 80 分的班级从上述的几个例子中不难看出,想要实现分组操作,必须明确三个要素:分组依据、数据来源、操作及其返回结果。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:df.groupby(分组依据)[数据来源].使用操

2020-12-25 16:47:22 137

原创 2020-12-21

索引索引器表的索引列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值为 Series ,例如从表中取出姓名一列:其中列名中不包含空格,可以用.列名取出,和[列名]是等价的:如果要取出多个列,可以通过 [列名组成的列表] ,其返回值为一个 DataFrame ,例如从表中取出性别和姓名两列:序列的行索引a.以字符串为索引的Series如果取出单个索引的对应元素,则可以使用 [item] ,若 Series 只有单个值对应,

2020-12-22 22:33:45 305

原创 2020-12-17

Datawhale提供的pandas学习的开源地址:Joyful Pandaspandas基础文件的读取和写入文件读取数据写入基本数据结构SeriesDataFrame常用基本函数汇总函数特征统计函数唯一值函数替换函数排序函数apply方法窗口对象滑窗对象扩张窗口练习口袋妖怪数据集指数加权窗口文件的读取和写入文件读取数据写入基本数据结构SeriesDataFrame常用基本函数汇总函数特征统计函数唯一值函数替换函数排序函数apply方法窗口对象滑窗对象扩张窗口练习口袋妖

2020-12-17 19:17:42 151

原创 2020-12-15

Datawhale提供的pandas学习的开源地址:Joyful PandasPandas 预备知识python基础列表推导式与条件赋值匿名函数与map方法zip对象与enumerate方法numpy基础np数组构造np数组变形与合并np数组切片与索引常用函数广播机制向量与矩阵的计算练习利用列表推导式写矩阵乘法更新矩阵卡方统计量改进矩阵计算的性能连续整数的最大长度python基础列表推导式与条件赋值匿名函数与map方法zip对象与enumerate方法numpy基础np数组构造np数组变形与

2020-12-15 21:17:46 273 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除