Python与机器学习 1
目标
- 实现人工智能;
- 研究利用数据和经验进行学习;
- 改善算法的性能;
机器学习类别
类别 | 特点 | 举例 |
---|---|---|
无监督学习 | 无标签 | 聚类、降维 |
监督学习 | 有标签 | 分类,回归 |
强化学习 | 无标签,学习+决策 |
涉及领域
- 概率论
- 统计学
- 算法复杂度
- 等
应用
- 网络搜索
- 垃圾邮件过滤
- 推荐系统
- 广告投放
- 信用评价
- 欺诈检测
- 股票交易
- 医疗诊断
- 等
分类
根据已有的分类标准将多个目标分成几种类型
聚类
发掘几种目标的分类标准并将其分类
回归
发掘两组数据之间的相关性,如线性回归、曲线回归、Logistic回归等,用于发掘相关性、预测发展、判定可能性等
降维
降低数据维度,方便数据计算、获取本质特征、节省存储空间等
中文名 | 英文名 |
---|---|
监督学习 | Supervised Learning |
无监督学习 | Unsupervised Learning |
半监督学习 | Sime-supervised Learning |
强化学习 | Reinforcement Learning |
深度学习 | Deep Learning |
Python Scikit-learn 特点
- http://scikit-learn.org/stable/
- Machine Learning in Python
- 一组简单有效的工具集
- 依赖Python的Numpy、Scipy和Matplotlib库
- 开源、可复用
类别、应用,与其常用函数
类别 | 应用 | 常用函数 |
---|---|---|
分类 classification | 异常检测、图像识别,等 | KNN(最近邻节点算法)、SVM(支持向量机)等 |
聚类 clustering | 图像分割、群体 划分,等 | k-Means(Kj均值算法), 谱聚类等 |
回归 regression | 价格预测、趋势预测,等 | 线性回归、SVR(支持向量回归)等 |
降维 Dimension Reduction | 可视化 | PCA(主成分分析法)、NMF(非负矩阵分解) |
课程数据推荐
- 《机器学习》 周志华
- 《PRML》
- 《数学之美》、《机器学习实战》、《推荐系统实践》、《海量数据挖掘》
- 《统计学习方法》、《数据挖掘导论》、《数据挖掘(韩家炜)》
- 《PRML》、《ESL》、《MLAPP》
- 课程主页: http 😕/cs231n.stanford.edu 😕/cs231n.stanford.edu
- 课程主页: http://cs229.stanford.edu
前提库
- Numpy : 多维数组、矩阵及矩阵运算
- Scipy:积分、插值、优化、信号处理等算法
- Matplotlib:可视化
Sklearn库中的标准数据集及基本功能
数据集
基本功能
- 分类
- 回归
- 聚类
- 降维
- 模型旋转
- 数据预处理