自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 leetcode刷题记录-141环形列表

文章目录题目记录解题思路floyd's cycle detection alogrithm举例数学证明拓展确定链表的环的长度找到链表的环开始的节点参考题目记录题目地址: https://leetcode-cn.com/problems/linked-list-cycle/简单描述:输入一个链表,确定链表是否有环解题思路我最初朴素的想法是用一个hashmap记录所有遍历过的节点,每次遍历到新的节点时,在hashmap中看下是否已经遍历过这个节点,如果遍历过,则说明有环;如果可以遍历到链表的结尾,则

2021-12-25 14:04:01 769

原创 tf2学习笔记

chapter 2 的主要内容classification exampleregression example整理数据:train,test,validmodel = keras.models.Sequential()model.compile(loss=, optimizer=, metrics=)model.fit(x_train,y_train,validation_d...

2020-02-20 21:05:33 913 2

原创 python调试工具pdb

在命令行输入 python -m pdb xxx.py进行pdb调试功能h 提示帮助b 添加断点,也可以在代码中添加断点,import pdbpdb.set_trace()cl 清除断点s(step) 执行下一条命令n(next) 执行下一条语句r(return) 执行到函数结束c(continue) 运行到遇到下一条断点l(list) 列出源码p(print) 变量名 查...

2019-12-03 10:10:30 274

原创 《深入浅出统计学》笔记三--第四章:概率计算,第五章:离散概率分布的运用

深入浅出统计学第四章 概率计算互斥:P(A ∩\cap∩ B)=0穷举:P(A ∪\cup∪ B)=1条件概率: P(A|B)=P(A∩B)P(B)\frac{P(A\cap B)}{P(B)}P(B)P(A∩B)​全概率公式:P(A)=P(A∩B)+P(A∩B′)=P(A∣B)∗P(B)+P(A∣B′)∗P(B′)P(A) = P(A\cap B)+P(A \cap B')=P(A|B...

2019-11-12 20:29:24 284

原创 《深入浅出统计学》笔记二--第二章:集中趋势的量度,第三章:分散性与变异性的量度

《深入浅出统计学》笔记还是一样先概括书中的重点,对于一些抽象的内容,自己画了示意图帮助理解再使用python实现其中的统计量第二章 集中趋势的量度平均数可以知道数据中心的所在平均数计算方法何时使用均值∑Xn\frac{\sum X}{n}n∑X​或者∑fx∑f\frac{\sum fx}{\sum f}∑f∑fx​在数据非常对称,仅显示出一个趋势时使用中位...

2019-11-08 18:17:43 375

原创 《深入浅出统计学》笔记一--第一章:信息图形化

打算结合python再回顾下这本统计学入门书的内容深入浅出统计学第一章 信息图形化这一章的主要知识点是介绍常见的统计图以及相应的画法1.饼图import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.font_manager import FontPropertiesimp...

2019-11-07 16:07:32 754

原创 尝试搭建电影推荐系统,日常坑记录

day1:2019-10-22任务完成情况将csv文件通过python导入mysql中100%坑解决办法1.csv文件无法直接导入到mysql中修改mysql的配置文件mac系统里配置文件是my.cnf,地址在/etc/my.cnf。将配置文件中的secure_file_priv修改为secure_file_priv= ‘’2.csv中存...

2019-10-23 19:02:36 741

原创 矩阵特征向量的个数 和 这个矩阵充当线性方程稀疏矩阵解空间的维数不同,也没有关系。

矩阵特征向量的个数 和 这个矩阵充当线性方程稀疏矩阵解空间的维数不同,也没有关系。下面分两部分解释,先举了一个具体例子验证两者没有关系,再试着从含义上去解释1.举个具体例子以矩阵A为例A=(123123123)A = \begin{pmatrix}1 &2&3\\1&2&3\\1&2&3\end{pmatrix}A=⎝⎛​111​222​3...

2019-09-30 16:41:50 700

原创 实现基于梯度上升法的PCA

实现基于梯度上升法的PCA参考bobo老师的机器学习课程,进行总结回顾目录基于梯度上升法的PCA原理实现基于梯度上升法实现的PCA用自制数据集验证手写的PCA基于梯度上升法的PCA原理PCA(Principal Component Analysis):主成分分析可以用于数据降维,重新确定数据所在的空间的基,保留k个方差最大的基。故我们要找到令数据方差最大的基即寻找使样本空间...

2019-09-29 20:13:31 194

原创 实现基于协方差矩阵的PCA

实现基于协方差矩阵的PCA目录基于协方差矩阵的PCA原理实现基于协方差矩阵的PCA基于协方差矩阵的PCA原理参考资料:http://blog.codinglabs.org/articles/pca-tutorial.html文章写的太好了寻找一维基:还是寻找一维基,使得所有数据变换(即投影)后,方差尽可能大Var(a)=1m∑i=1mai2Var(a) = \frac{1}{m...

2019-09-29 20:10:42 369

原创 使用xgboost库

使用xgboost库目录xgboost中的参数使用sklearn中xgboostAPI绘制学习曲线进化的学习曲线:方差与泛化误差使用xgboost.train()使用xgboost.cv()案例:在波士顿数据集上,使用xgb.cv这个类进行调参分类案例:XGB中样本不均衡问题xgboost中的参数sklearn中参数xgboost库中对应的参数名集...

2019-09-18 18:43:15 977

原创 python中模型的保存和调用

python中模型的保存和调用目录使用pickle进行保存和调用(需要配合open函数来使用)使用joblib进行保存和调用(用法更简单)使用pickle保存和调用模型我们可以使用pickle和open函数连用,来将我们的模型保存到本地#要保存的模型from sklearn.datasets import load_bostonfrom sklearn.ensemble imp...

2019-09-18 16:21:36 8811

原创 实现XGBoost1.0版本-慢的要死,但准确率还能忍

实现XGBoost目录XGBoost算法推导XGBoost算法实现使用自制的数据集进行测试使用波士顿数据集进行测试,并与sklearn中的Adaboost,RandomForest进行对比XGBoost算法推导XGBoost是梯度提升树中的改进算法,所以具有梯度提升树中的一些共性,同时也存在自己的个性对于梯度提升树算法来说,有三个关键部分需要明确能够让弱评估器集成的手段(迭...

2019-09-16 18:11:22 2609 4

原创 摘抄《深入浅出学统计》

XGBoost中的预测值与GBDT中的预测值的区别:GBDT中的预测值是预测结果的加权求和,每个样本的预测结果是样本所在叶子的均值XGBoost中的预测值是弱分类起的叶子权重直接求和得到这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居...

2019-09-15 23:17:44 167

原创 《百面机器学习》 笔记(一) 第一章 特征工程

绪论对于一个机器学习问题,数据和特征往往决定了结果的上限,而模型、算法的选择及优化是在逐步接近这个上限。常见的数据类型:结构化数据:可以看作是关系型数据库的一张表,每一列都有清晰的定义,包含了数值型、类别型两种基本类型;每一行数据表示一个样本信息。非结构化数据:非结构化数据主要包括文本、图像、音频、视频数据,其包含的信息无法用一个简单的数值表示,也没有清晰的类别定义,并且每条数据的大小各...

2019-09-11 21:27:08 153

原创 集成算法 学习笔记(二) Adaboost的算法简介和推导

Adaboost算法简介:Adaboost集成算法通过基于上一次的预测结果,调整每一次样本的权重值(增加分类错误的样本权重,减少分类正确的样本权重),使得在下一次进行预测时,更加关注那些分类错误的样本。最终的分类器为f(x)=sign(∑i=1MαmGm(x))f(x) = sign\big(\sum\limits_{i=1}^M\alpha_mG_m(x)\big)f(x)=sign(i=...

2019-09-10 21:41:07 249

原创 逻辑回归笔记

为什么称之为逻辑回归?因为逻辑回归预测的是发生概率,预测一个数,所以为回归问题sigmoid函数σ(t)=11+e−1\sigma(t) = \frac{1}{1+e^{-1}}σ(t)=1+e−11​值域在(0,1)t>0时,值>0.5t<0时,值<0.5故预测值p^=σ(θT⋅xb)\hat p = \sigma(\theta^T \cdot x_b)...

2019-08-30 17:19:01 110

原创 集成算法 学习笔记(一)

什么是集成学习:也就是集成多个算法,让不同的算法对同一组数据进行分析,得到结果。常见的集成方式有:bagging(统计学中的叫法为bootstrap)bagging的方式1.hard voting:少数服从多数2.soft voting :有权重的少数服从多数...

2019-08-29 13:44:31 164

原创 决策树学习笔记

决策树简介:非参数学习算法可以解决分类问题和回归问题天然可以解决多分类问题具有非常好的可解释性决策树的局限性:生成的边界 横平竖直,所以数据如果有一点偏斜,决策树得到的决策边界可能就不能很好的反馈数据的分布情况。作为非参数学习算法,对个别数据样本点是非常敏感的。改建在机器学习领域,决策树更重要的一个应用是使用集成学习的方式,创建随机森林的算法。 随机森林的算法可以得到非常好的...

2019-08-22 16:22:08 187

原创 在进行对向量的求导时,非常好用的三个公式~

在进行对向量的求导时,非常好用的三个公式分别是1.对于向量x求导∇xwTx=w\nabla_x w^Tx=w∇x​wTx=w2.对向量x求导∇xxTAx=(A+AT)x\nabla_x x^TAx=(A+A^T)x∇x​xTAx=(A+AT)x其中x为向量,A为矩阵3.对向量x求二阶导(即Hessian矩阵)∇2xTAx=A+AT\nabla ^2 x^TAx=A+A^T∇2xTAx=A+...

2019-08-21 15:21:54 9293

原创 牛顿法原理推导

牛顿法是用迭代的方法,来求解方程的根和最优化预备知识1.Hessian矩阵2.多元泰勒展开用牛顿法求解方程的根用牛顿法求解导数为0 的点1.Hessian矩阵相当于一元函数的二阶导数,所有元素由函数的二阶偏导数构成。由于高阶导数一般和求导次序无关,所以Hessian矩阵往往是对称矩阵f(x1,x2,...xn)f(x_1,x_2,...x_n)f(x1​,x2​,...xn​)...

2019-08-21 12:08:25 6879 1

原创 衡量监督算法的性能

分类算法混淆矩阵混淆矩阵通过比较分类结果与真实值,形象分类模型的准确度准确率反映了分类系统对整个样本的判定能力——能将正的判定为正,负的判定为负Accuracy=TP+TNTP+TN+FP+FNAccuracy = \frac{TP+TN}{TP+TN+FP+FN}Accuracy=TP+TN+FP+FNTP+TN​当数据集不平衡时,也就是正样本和负样本的数量存在显著差异时,单独依...

2019-08-19 17:21:01 180

原创 线性回归学习笔记

线性回归算法线性回归算法的优缺点:优点:思想简单,容易实现是许多强大的非线性模型的基础结果具有很好的可解释性,相应的系数可以理解为权重蕴含机器学习中的很多重要思想公式推导预测 y^(i)=X(i)w+b\hat y^{(i)} = X^{(i)}w+by^​(i)=X(i)w+b目标是使yyy与y^\hat yy^​尽量接近,即使∑i=1m(y(i)−y^(i))\sum\lim...

2019-08-14 20:55:16 720

原创 这次一定要弄懂-SVM-5-推广到soft margin svm和非线性的svm

有了前面推hard margin svm的经历,这次推soft margin svm应该会迅速很多。开启~文章目录5-1 Soft Margin SVM5-1-1 Soft Margin SVM的原问题5-2 加入核函数5-3 总结SVM5-4 python实现5-1 Soft Margin SVM5-1-1 Soft Margin SVM的原问题hard margin svm是针对一个...

2019-07-31 20:52:36 665

原创 这次一定要弄懂-SVM-4-总结Hard Margin SVM的求解过程,并用python实现

文章目录4-1 总结Hard Margin SVM的数学推导过程4-2 python实现Hard Margin SVM4-2-1 建立数据集4-2-2 初始化4-2-3 设置循环,寻找第一个不满足kkt条件的$\alpha$4-2-4 求解子问题4-2-5 设置完整的计算函数4-3 总结4-1 总结Hard Margin SVM的数学推导过程我们从原问题:min⁡ω∣∣ω∣∣22\min \...

2019-07-31 19:32:41 1298

原创 这次一定要弄懂-SVM-3-Hard Margin SVM的对偶问题的求解(SMO算法)

文章目录3-1 KKT条件3-1-1 从拉格朗日乘数法的求解过程说起3-1-2 推广出KKT条件3-1-3 KKT条件用于原问题3-2 SMO算法3-3 总结并用python实现Hard Margin SVM前面我们针对Hard Margin SVM推导了他的原问题:min⁡ω∣∣ω∣∣22\min \limits_{\bold{\omega}}\frac{||\omega||^2}{2}ωm...

2019-07-29 20:50:52 1203

原创 这次一定要弄懂-SVM-2-Hard Margin SVM的原问题转换为拉格朗日对偶问题

文章目录2-1 回顾Hard Margin SVM的原问题2-2 从原问题到拉格朗日对偶问题2-2-1 拉格朗日乘数法 -> 广义的拉格朗日乘子函数 ->拉格朗日对偶问题2-2-1-1 如何使用拉格朗日乘数法2-2-1-2 构造广义的拉格朗日乘子函数2-2-1-3 拉格朗日对偶问题2-2-1-4 对比原问题与拉格朗日对偶问题2-2-2 为什么要转化为拉格朗日对偶问题来求解2-2-2-1...

2019-07-28 22:44:13 493

原创 这次一定要弄懂-SVM-1- Hard Margin SVM的原问题推导

不信邪,决定挑战下自己的能力,努力弄懂SVM因为SVM的内容太多,求解较为复杂,分为几个部分来写,分步来搞定1-1 SVM的简介SVM(Support vector machine)中文名为支撑向量机,可以用于解决分类问题,也可以解决回归问题,采用核技术可以解决非线性问题,适用于小样本和高维特征。核心思想在于最大化分类间隔,以提升分类器的泛化性能。解决线性可分的SVM叫做Hard Mar...

2019-07-24 20:56:58 1214

原创 机器学习 学习笔记(一) 机器学习导学

目录:在看了liuyubobobo、吴恩达、林轩田老师的课程以及很多博客的内容后,决心做一个知识点的大整理,梳理整个学习的脉络。在学习过更多的内容后,可能会添加上一些新的理解。1-1 为什么需要机器学习对于传统的算法来说,比如排序算法,是交给机器来执行。比如解决垃圾邮件的分辨,使用传统算法的解决问题思路:编写规则,定义“垃圾邮件”,让计算机执行但这种处理方法的问题在于,判断垃圾...

2019-07-22 14:10:55 265

原创 表格之道 学习笔记(六)

目录:第八章 数据输出常见的数据输出形式有纸张(打印)、平面(设计)、图表(静图)、BI工具(动图)8-1 让表格在纸张上呈现(打印技巧)记录一些常见的功能,在遇到打印的情况时,知道有一些设置可以让我们打印出来的表格更美观。查看打印视图想要预览打印出来的效果,可以通过打印对话框看到,也可以通过页面布局视图看到。打印对话框的预览页面布局的预览切换视图的按钮...

2019-07-22 11:52:31 332

原创 Excel表格之道 学习笔记(五)

第七章 自定义格式7-1 自定义格式老师只是讲到了部分,感觉自定义格式还有很多玄机,之后学习到相关知识后,会再进行补充数字占位符00的个数表示数字最少占几位比如:自定义格式单元格内容显示01212001212000120120000120012应用举例:1.车牌显示2.电话号码分割启发:表格内容就是单纯的表格内容...

2019-07-01 19:10:24 295

原创 高数下-空间几何(一)-向量

文章目录一、向量的基本内容向量即矢量,既有方向又有大小,比如物理量位移、速度、力向量a⃗=b⃗\vec{a}=\vec{b}a=b意味着:a⃗,b⃗\vec{a},\vec{b}a,b方向相同,大小相等1.向量的大小用向量的模表示模等于1的向量为单位向量模等于0的向量为零向量2.向量的方向可以用方向余弦表示,后面介绍二、向量的运算1.向量的加法使用平行四边形法则或者三...

2019-06-28 13:59:04 8192

原创 Excel表格之道 学习笔记(四)

文章目录第六章 生成表格6-1数据透视表简介6-2 行列的布局上下级关系混合交叉关系6-3再谈规范6-4 编辑功能自定义序列切片器日程表6-5数据透视表的计算功能计算项计算字段使用函数第六章 生成表格6-1数据透视表简介数据透视表的主要内容序号内容详细展开1三步搞定2组成要素字段行区域列区域值区域筛选器3再加工编辑 自定义排序 切片器 组合功能...

2019-06-26 12:02:13 384

原创 Excel表格之道 学习笔记(三)

文章目录第五章 字段调整5-1 函数简介5-2 学习路径5-3 单元格的命名5-4 引用5-5 统计函数5-6 日期函数5-7 文本函数5-8 随机函数5-9 逻辑判断5-10 查找引用vlookup第五章 字段调整5-1 函数简介函数的主要作用:根据现有数据,新增一列字段函数的目的:计算工作分析准备5-2 学习路径5-3 单元格的命名可以给单个或者一个区域的单元格进行命名...

2019-06-21 11:35:27 644

原创 Excel表格之道 学习笔记(二)

文章目录第四章 规范数据1.基本格式:数字在右,文本在左2.数字与文本的转化3.电子表格的通用格式4.通用格式细则错误一:避免单元格合并错误二:没有序号错误三:乱加表头错误四:胡乱合计错误五:不符合数据透视表规范错误六:单元格非原子化完美的表格表格清理顺序第四章 规范数据1.基本格式:数字在右,文本在左总结的数字格式和文本格式的区别数字文本特征右对齐左对齐...

2019-06-16 17:34:31 2772 1

原创 EXCEL表格之道 学习笔记(一)

文章目录第二章 准备工作选择类快捷键编辑类快捷键其他快捷键添加日期和时间的方法其他编辑小技巧第二章 准备工作第二章准备工作中,涉及一些快捷键的使用,特此整理下。因为我用的是mac上的excel 2016,而谷老师讲的时候用的是win 下的excel 2013,所以存在一些快捷键上的不同。选择类快捷键序号功能快捷键演示1快速跳到表格的四角command+方向键...

2019-06-13 13:09:58 1428

原创 《机器学习实战》学习笔记(四) : 朴素贝叶斯的基本原理

在看了书、优快云上的博客、B站上的视频后整理而成,超级感谢前辈提供的宝贵知识~Table of Contents1  基础数学知识1.1  条件概率公式1.2  贝叶斯公式1.3  全概率公式1.4  实例:判断瓢虫是否会冬眠2  使用朴素贝叶斯进行文档分类2.1&nbsp...

2019-05-30 17:08:30 736

原创 《机器学习实战》学习笔记(五) : sklearn中关于朴素贝叶斯的用法

Table of Contents1  朴素贝叶斯的分类1.1  GaussianNB1.1.1  以鸢尾花数据集为例,理解GaussianNB1.1.2  实例:使用GaussianNB对鸢尾花数据集进行分类1.1.3  实例:使用sklearn.GaussianNB进行鸢尾花数据集分析1.1....

2019-05-30 16:49:06 1132

原创 机器学习基石 homework1 PLA pocket算法 python实现

在做homework1 最后几道关于PLA pocket算法时,看到很多的博客,感觉代码写的好复杂(有些也给我好大的启发),但不就是完成一个选择题,实现一下思想嘛。所以想粘一下下小白写的。import randomimport numpy as npimport pandas as pd#处理数据,添加x0这一列f = pd.read_csv("train.txt",sep='\s+'...

2019-05-16 11:03:49 592

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除