
机器学习
打不死的小黑
个人github地址:https://github.com/wakemeuphzk/study,关于AI的学习记录,与各位共勉! 喜爱文艺的程序员,喜欢技术研究、毛姆、陈奕迅、张国荣、文学创作、火影及绘画的记得关注微信公众号:残留的存在主义。
展开
-
机器学习(一):简介
机器学习简介这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python参考书籍:《Python机器学习实践指南》《机器学习实战》为什么使用PythonPython具有清晰的语法结构,简单易上手。大家也把它称作可执行伪代码(executable pseudo-code)。易于操作纯文本文件。...原创 2019-03-09 11:44:29 · 522 阅读 · 0 评论 -
机器学习(十二):数据预处理
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python操作系统:Windows数据预处理主要包括异常值处理、去重、特征编码、归一化处理等,主要借助pandas进行处理。...原创 2019-05-28 23:57:20 · 269 阅读 · 0 评论 -
机器学习(十三):训练调参
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python操作系统:Windows训练调参是所有机器学习(包括深度学习)最核心的部分,主要涉及交叉验证、学习曲线、网格搜索、误差分析、模型解释几部分。数快速建模及初步分析交叉验证学习曲线调参网格搜索验证曲线误差分析衡量指标ROC曲线与AUC值...原创 2019-05-28 23:49:40 · 388 阅读 · 0 评论 -
机器学习(十):机器学习训练速度的提升技巧
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python操作系统:Windows机器学习中最耗时也是最核心的两个阶段,一个就是特征工程,另一个就是训练过程了,训练过程,少则几个小时,多则几天,这个总是会占用不少时间,如果赶在向领导汇报或者业务方需要结果的是,这个真的是时间就是金钱。我在机器学习过程中一直...原创 2019-04-14 11:13:59 · 5956 阅读 · 0 评论 -
机器学习(九):机器学习环境搭建
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:PythonPython3还是Python2IDE——PyCharmAnaconda...原创 2019-04-13 14:39:39 · 902 阅读 · 0 评论 -
机器学习(八):样本分布不均衡问题的处理
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中拿到数据,大部分情况下都是自己切分训练集、测试集,对于训练集,经常会遇到正负样本比例很不均衡的情况,即偏斜类(Skewed Class)问题,有些时候往往还很严重,比如数据量上负样本:正样本>=100,这是比较严重的偏斜类问题,下面针...原创 2019-04-13 12:17:19 · 6880 阅读 · 0 评论 -
机器学习(十一):机器学习的流程
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python操作系统:Windows关于机器学习的流程,大的方向都比较类似,基本都是需求分析、特征工程、训练调参、部署上线四个大步骤,细分下来会有些不同,各个步骤顺序也会稍有不同,下面将自己实际项目中采用的机器学习步骤、各个步骤用到的知识点进行总结分享给大家:...原创 2019-04-15 21:52:05 · 566 阅读 · 0 评论 -
机器学习(七):Pandas的使用技巧(三)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中经常用到pandas,尤其是数据分析与数据预处理这两部分,自己最直接的感受就是pandas像是SQL+excel,当然,pandas的功能远不止这些。(注:以下pd均表示pandas,df指pandas对象)映射MapDataFram...原创 2019-04-06 21:32:08 · 341 阅读 · 0 评论 -
机器学习(六):Pandas的使用技巧(二)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中经常用到pandas,尤其是数据分析与数据预处理这两部分,自己最直接的感受就是pandas像是SQL+excel,当然,pandas的功能远不止这些。(注:以下pd均表示pandas,df指pandas对象)数据切片pandas获取某...原创 2019-04-05 15:15:37 · 324 阅读 · 0 评论 -
机器学习(四):Python与Numpy的使用技巧
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python下面从自己项目中遇到的一些python、numpy知识点整理出来:(注:以下np均表示numpy)python2与python3的几点不同python2与python3是目前使用最广泛的两个版本,一些新的代码都建议使用python3,对于一些经典...原创 2019-04-05 14:08:29 · 434 阅读 · 0 评论 -
机器学习(五):Pandas的使用技巧(一)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Pythonpandas常用函数清单轻松处理浮点数据中的丢失数据(以NaN表示)以及非浮点数据大小可变性:可以从DataFrame和更高维的对象插入和删除列自动和显式的数据对齐:对象可以显式地与一组标签对齐,或者用户可以简单的忽略标签,让Series,Da...原创 2019-04-03 23:48:00 · 379 阅读 · 0 评论 -
机器学习(三):开源工具包
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python机器学习三驾马车NumpyMatplotlibPandas机器学习包:scikit-learnscikit-learn是python的机器学习开发包...原创 2019-03-09 19:09:51 · 1003 阅读 · 0 评论 -
机器学习(二):基础概念
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python参考书籍:《Python机器学习实践指南》《机器学习实战》参考视频:吴恩达老师的机器学习系列视频吴恩达老师机器学习笔记整理笔记下载:机器学习个人笔记完整版什么是机器学习机器学习是人工智能的一个分支,实际上,即使是在机器学习的专业人士中,也不存...原创 2019-03-09 14:47:51 · 472 阅读 · 0 评论 -
机器学习(十四):机器学习的跨平台部署——PMML
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python操作系统:Windows模型训练好后的部署上线,如果考虑跨平台的问题,针对目前很多web应用,都是基于java框架的,那么就需要java能够解析python训练出的模型文件,这时候就要借助一个第三方语言工具—— PMML(预测模型标记语言)。Pyt...原创 2019-05-29 00:08:45 · 631 阅读 · 0 评论