- 博客(17)
- 收藏
- 关注
原创 ROC,AUC,PR
1.召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念这个是今天的重点,传统机器学习里面也是很重要的一点,刚好可以重新学习一下,像AUC其实它就是一个用来评判你的一个模型的准确率的,因为在普通的正确率中,会因为样本的不平衡,而正确率也会跟着改变受到影响!今天就来彻底搞懂什么是AUC,什么是ROC1.性能度量:机器学习要建模,而对于一个模型的好坏也就是对于判定一个模型的泛化能力...
2019-04-10 21:36:21
571
原创 Tensorflow的安装与使用
自己其实是在学习传统机器学习算法关于数据挖掘方面的,一直想去了解一下自然语言处理方面,还有就是学习如何使用Tensorflow这个库,以后找工作可能都可以用来吹一下
2019-04-07 14:59:01
30218
1
原创 MYSQL学习(三)
通过MYSQL的实战来复习自己的快要遗忘的mysql知识,然后希望李某人也能找回曾经爱学习时的状态!!1.开始实战:定义表结构:插入数据:展现数据:创建Department表:查询每个部门工资最高的员工:2.小美是一所中学的信息科技老师,她有一张seat座位表,平时用来储存学生名字和与他们相对应的座位 id。其中纵列的...
2019-04-06 21:22:16
239
原创 Mysql的简单学习(二)
mysql中对表的操作:1.创建一个学生选课的表,然后选出其中被大于或等于5名学生都选择了的课程图:可以看到表中被超过5名学生选择了的是math这个课程,所以我们的答案也是math。那么接下来就写sql语句吧!表结构:先是选择数据库,然后定义好了表结构,现在就是向里面插入上图的数据了执行如下的程序就将数据插入到了表course里面了然后就是写入查询语...
2019-04-04 15:06:15
322
原创 Windows下MYSQL的安装与简单得SQL语句的学习
(-)mysql的安装先将下载好的mysql解压,下载直接在这个官网下载就行,这里什么版本的都有,链接:https://dev.mysql.com/downloads/mysql/然后我将mysql解压到了D盘下面:接下来就是安装了mysql了。1.我们先在xxmysql这个文件下,创建一个文件my.ini,这里我们需要输入它的配置信息:2.接下来就是进入CMD命令窗口...
2019-04-02 17:10:34
380
原创 pandas时间序列
时间序列是一种重要的结构化数据形式。时间序列的数据意义取决于应用的场景:1.时间戳(timestamp) : 特定的时刻2.固定时期(period),如2018年的8月3.时间间隔(interval): 由起始的时间戳和结束的时间戳决定.时期(period)可以被看作时间间隔的特列,因为时间间隔过长,可以去这样想可能我们经常见到或用到的索引就是时间戳。 1.日期和...
2018-08-23 10:24:12
319
原创 pd字符串处理
先说明一下,这些知识,也是我在学习有些书籍,然后写的知识点,也是用自己的理解写出来,例子有些是自己添加,有些是和书籍上一样的,是看我是否写错。我写这些博客也是自己学习的痕迹和以后方便自己复习,再回顾。所以本人也是一个学生。1.python很多内建方法很适合处理string。2.而对于更复杂得模式,可以配合正则表达式。而pandas则混合了两种方式。1.字符串对象方法大部分字符串可以使用...
2018-08-12 21:48:25
1561
原创 pandas数据变换(二)
5.离散化和装箱连续型数据经常离散化或分散成bins(分箱)来分析。假设又一组数据,数据代表不同的年龄,把人分到不同的年龄组import numpy as pdimport pandas as pdfrom numpy import nan as NAages = [20, 22, 25, 27, 21, 23, 37, 31, 61, 45, 41, 32]#把上诉年龄下...
2018-08-09 16:52:15
1591
1
原创 pandas数据变换(一)
1.删除重复值import numpy as npimport pandas as pddata=pd.DataFrame({'k1':['one','two']*3+['two'],'k2':[1,1,2,3,3,4,4]})print(data)#输出: k1 k20 one 11 two 12 one 23 two 34 one ...
2018-08-09 10:05:24
1515
原创 pandas数据清理
在数据分析中,80%的时间是用于数据清理。1.对于数值型数据,pandas用用浮点值NaN来表示缺失值,称之为标识符,这种值能被轻易检测到。在pandas中,把缺失值表示NA内建的python None也表示缺失值NAimport numpy as npimport pandas as pdobj=pd.Series(['li','xun',np.nan,'big'])p...
2018-08-08 14:45:41
1477
原创 pandas学习(五)
A 排序(按照索引index)在Series和DataFrame中,如果按照row或column 的index来排序的话,可以使用sort_index()方法来排序,默认排序是按row index。如果要按column index 排序,那么sort_inde(axis=1)import numpy as npimport pandas as pdobj=pd.Series(ran...
2018-07-27 21:12:07
319
原创 python之padnas学习(四)
A.整数索引:用整数索引在pandas中 与python的list与truple有一点不同,如果在Series的默认row Index为数字的话,用整数索引会出错,那么我们就应该将index更改掉,改成其它。1.import numpy as npimport pandas as pdobj=pd.Series(np.arange(3.))print(obj)print...
2018-07-27 19:04:41
1029
原创 python库之pandas库学习(三)
学习pandas中一些常用的功能1.Series的reindex()方法能修改Series的index,如果修改的index与创建的index没有对应的话,就会引入缺失值import pandas as pdimport numpy as npobj=pd.Series([4.1,4.2,5.7,8.9],index=['a','b','c','d'])print(obj)...
2018-07-25 15:41:12
818
原创 python之pandas库学习(二)
本来说好要坚持每天更新自己的学习成果的,但是因为自己电脑坏了,重装了硬盘,然后自己也玩了两天,所以没有做好自己坚持的东西,在以后的34天我将每天更新自己的博客,坚持!!今天学习的是pandas库中另一个重要的数据结构:DataFrame1.DataFrame表示一种长方形表格并包含已经排好序的列,DataFrame有自己的行索引与列索引,这点与Series有一点不同,Series只有自...
2018-07-23 14:50:56
4298
1
原创 python之pandas库学习(一)
几经辗转,须静下心来学习才是王道啊导入pandas:import pandas as pdfrom pandas import Series,DataFrameSeries创建一个Series对象:import pandas as pdfrom pandas import pandas,DataFrameobj=pd.Series([1,5,7,9])print(obj结果:在这个结果数据中...
2018-07-14 22:40:50
1351
原创 安装了如numpy 这个模型 ,但是在pycharm中使用,提醒: No module named 'numpy'
今天在使用pycharm写代码时,调用了Numpy这个库,但是报错了,提醒了No module named 'numpy'。最后知道了一个快速的解决办法:1.在pycharm里:点击file-->settings:2.点击project-->project interpreter3.然后点击右边的 + 号 进入一个添加库的的界面,然后搜索你需要的库,在右下角点击安装,然后等待安装,安装...
2018-06-11 11:47:06
42837
17
原创 机器学习实战之决策树最有特征的选取
在学习了jack cui机器学习博客后,为了给自己留下一个理解的笔记,本人比较笨,以后方便查看。他的博客地址在下方,写得很好。点击打开链接决策树机器学习的一种分类方法,拿相亲来说,决策树模型就是上面这一个,长方形为这个人的某个特征,决策树有内部节点和叶节点。内部节点就是这个长方形,是其特征。叶节点是椭圆,就是其得到的结果,是备胎还是值得考虑。而特征也是一个分类的规则条件。是将它继续划分到哪一边。每...
2018-05-15 11:22:58
4911
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人