- 博客(11)
- 收藏
- 关注

原创 机器学习实战——学习笔记
前言及序章本书的主要内容:原理简述+问题实例+实际代码+运行效果机器学习:把无序的数据转换成有用的东西数据分析与挖掘的基本技能:针对具体任务,搞懂所有相关数据的意义如何选择合适的算法:(1)想要算法满足什么任务?(2)需要分析或收集的数据是什么?发现最佳算法的关键环节:反复试错开发机器学习应用程序的步骤:(1)收集数据,(2)准备输入数据(数据格式),(3)分析输入数据(缺失值、异常值、可视化展示...
2018-07-03 16:31:12
439
原创 SQL学习笔记——关系除法
该汇总来自于[日]MICK的《SQL基础教程》与《SQL进阶教程》,这两本书内容深入浅出,非常值得学习。 例子:找出员工表emp中拥有技能表skills中全部技能的员工id(例子与解题思路来自于[日]MICK的《SQL基础教程》) select distinct id from emps awhere not exists(select skill from skill...
2018-07-23 18:23:51
1790
原创 SQL学习笔记——MySQL求差集
一些数据库,如SQL server、Oracle可以使用except,但是MySQL还不支持except语句,目前有三种替代方法:(1)外连接(2)not exists(3)not in select a.id,a.namefrom class_a a left join class_b b on a.id=b.idwhere b.id is null; s...
2018-07-23 18:20:33
2912
原创 SQL学习笔记——null与限定谓语、极值函数
最近在学习MICK[日]的《SQL进阶教程》,该教材内容深入浅出,非常值得学习。记录下该教程中的一些难点与疑惑,方便之后继续学习。 class_1 name age city black 22 beijing raj 19 ...
2018-07-23 18:17:19
601
原创 SQL学习笔记——各种关系型数据库SQL语言的差异
该汇总来自于[日]MICK的《SQL基础教程》,该教材内容深入浅出,非常值得学习。涉及的数据库有:SQL Server、Oracle、DB2、MySQL、PostgreSQL 数据类型Oracle中不推荐使用varchar,使用varchar2Oracle中date包括年月日、时分秒 更新表定义alter table 表名 add/drop column 列定义...
2018-07-23 18:09:25
1418
1
原创 SQL学习笔记——grouping运算符
我最近看了MICK的两本SQL教程,分别是《SQL基础教程》与《SQL进阶教程》,教材内容深入浅出,非常值得学习。 仅Oracle、SQL Server、DB2支持grouping grouping运算符有三类:rollup、cube、grouping sets使用方式/书写格式为 group by rollup/cube/grouping sets 三者的区别在于...
2018-07-23 18:05:50
3331
原创 机器学习实战——朴素贝叶斯(代码)
最近在学习Peter Harrington的《机器学习实战》。Craigslist个人广告链接已经找不到了,改用该网站的社会事件event与政治politics的RSS源https://newyork.craigslist.org/search/eve?format=rss&sale_date=2018-06-11https://losangeles.craigslist.org/sear...
2018-07-04 11:18:36
880
原创 机器学习实战——绘制决策树(代码)
最近在学习Peter Harrington的《机器学习实战》,代码与书中的略有不同,但可以顺利运行。import matplotlib.pyplot as plt# 定义文本框和箭头格式decisionNode = dict(boxstyle='sawtooth', fc='0.8')leafNode = dict(boxstyle='round4', fc='0.8')arrow_ar...
2018-07-03 18:39:22
2133
1
原创 机器学习实战——决策树(代码)
最近在学习Peter Harrington的《机器学习实战》,代码与书中的略有不同,但可以顺利运行。from math import logimport operator# 计算熵def calcShannonEnt(dataset): num = len(dataset) labelCounts = {} for featVec in dataset: ...
2018-07-03 18:38:25
1153
1
原创 机器学习实战——k-近邻算法(代码)
最近在学习Peter Harrington的《机器学习实战》,代码与书中的略有不同,但可以顺利运行。from numpy import *import operatorimport os# 创建一个数据集,用于测试def createDataset(): group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]]) l...
2018-07-03 10:09:04
407
原创 《Python机器学习应用》课程总结
Python机器学习应用-北京理工大学-礼欣 MOOC课程地址:http://www.icourse163.org/learn/BIT-1001872001?tid=1001965001课程资料可在GitHub上下载(包括数据与相关教学资料)链接:https://github.com/caiiiac/Machine-Learning-with-Python 课程内容非监...
2018-06-11 08:36:48
1571
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人