- 博客(11)
- 问答 (1)
- 收藏
- 关注
原创 机器学习理论——KNN
K近邻算法(k-nearnest neighbors)可做回归和分类,两者的区别在于最后做预测的决策方式不同;回归是选择平均法,即最近的k个样本的样本输出值的平均值作为回归的预测值;分类是多数表决法,即训练集中和预测的样本特征最近的k个样本,预测为里面有最多类别数的类别。(1)KNN算法三要素KNN算法三要素:k值的选择,距离的度量方式和分类决策规则k值的选择:一般根据样本分布,选择较小的...
2019-09-19 11:51:05
2169
原创 机器学习理论——朴素贝叶斯
大部分分类算法都是判别方法,即直接学习出特征输出Y和特征X之间的关系,要么是决策函数Y=f(x)Y=f(x)Y=f(x),要么是条件概率分布P(Y∣X)=P(Y,X)/P(X)P(Y|X)=P(Y,X)/P(X)P(Y∣X)=P(Y,X)/P(X);而朴素贝叶斯算法是生成方法,即直接找出特征输出Y和特征X之间的联合概率分布P(Y,X)P(Y,X)P(Y,X),然后用P(Y∣X)=P(Y,X)/P(...
2019-09-19 11:50:54
236
原创 机器学习理论——CART决策树
行文思路:CART分类树(重点比较与C4.5算法异同)——CART回归树(重点比较与CART分类树异同)——CART树建树和剪枝算法——总结决策树的优缺点CART分类树算法...
2019-09-01 22:05:05
443
原创 机器学习理论——决策树ID3和C4.5
(1)决策树ID3算法的信息论基础熵在物理学中是度量分子运动的不确定性,分子运动不确定性越大熵越大。而在信息论中,熵度量事件的不确定性,越不确定的事件,熵越大。离散随机变量X的熵:H(X)=−∑i=1npilogpiH(X)=-\displaystyle\sum_{i=1}^{n}p_ilogp_iH(X)=−i=1∑npilogpi,其中n是离散随机变量的n种不同离散值,pip_ipi...
2019-08-30 11:45:45
226
原创 机器学习理论——知识前提、回归和感知机
前言:所有数学值的大写形式无特殊说明均表示向量形式。梯度下降法:超参数:步长α和各方向梯度下降距离ξ损失函数:J(θ) = 12∗(Xθ−Y)T(Xθ−Y)\frac{1}{2}* (Xθ-Y)^T(Xθ-Y)21∗(Xθ−Y)T(Xθ−Y)下降距离=梯度*步长:∂J(θ)∂θ∗α\frac{\partial J(θ)}{\partial θ} * α∂θ∂J(θ)∗α 其中a初始值一...
2019-08-29 16:23:12
420
原创 Numpy,Pandas和matplotlib的知识点总结
Numpy1. 数组的基本属性data.shape 了解数组的结构data.dtype 了解数组的数据类型2.创建数组np.array([1,2,3,4,5,6])data1 = [[1,2,3],[4,5,6]]np.array(data1)np.zeros([3,4])np.ones([5,6])np.arange(6) #创建一个从0到5的数组np.arange...
2018-10-28 21:38:08
885
原创 对数据分析师岗位进行数据分析
1. 爬取数据利用GitHub上的现成包(需要的话可以留言),修改参数后获得XX网关于“数据分析师”的数据。爬取完成后为一个txt的文本,内容如下:总体来说关于职位的信息已经比较齐全了。2.数据预处理引入EXCEL后的状态,所有数据都在一列中,导致数据共8W行。。。。。。对原始数据进行操作Created with Raphaël 2.2.0开始删除--------------依靠定...
2018-10-26 15:41:18
853
转载 csdn怎么快速转载别人的文章
首先确定原文允许转载在文章开头处一般有版权声明,如图转载时要注明出处和作者如何转载用谷歌浏览器加载文章地址,打开文章F12打开Developer Tools,并打开Elements页面将文章开头部分的文字作为关键字在Elements界面搜索以此文为例:http://blog.youkuaiyun.com/aggressive_snail/article/details/5437587...
2018-10-25 15:55:07
205
原创 《Python编程从入门到实践》常用知识点的复习
第二章 变量与简单数据类型2.2 变量变量名只包含数字,字母和下划线,且数字不打头2.3 字符串修改字符串大小写:str.title(), str.upper(), str.lower()合并字符串:str1 + str2添加空白:‘\tPython\nJava’ (\t:制表符,\n:换行符)删除空白:str.rstrip(删除末尾空白),str.lstrip(删除开头空白)...
2018-10-25 15:46:40
325
原创 Leetcode刷题以及优快云中sql常用习题练习有感
知识点补充:交换同一列两个值A,B的位置:update tb_name set col_name = (if col_name = A, B, A) 或者 update tb_name set col_name = (case when col_name = A then B else A end)union 组合了多个select语句结果,不包含重复值;union all 组合了多个sel...
2018-10-23 21:28:14
516
原创 SQL常用语句的学习小结
@目录SQL常用语句的学习小结之前学习SQL的基本操作的知识,现在隔一段时间后对其进行总结。下列语句中,[]表示可有可无的语句1. SQL最基本的命令1.1 数据库的基本操作通过命令提示符对数据库进行操作(后期直接用Navicat对数据库操作更加方便):连接数据库:mysql -u用户名 -p密码创建数据库并确定编码方式:create database db_name char...
2018-10-22 17:18:13
566
空空如也
vscode怎么设置代码提示?
2018-11-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人