
机器学习
文章平均质量分 75
记录点滴学习
_Tunan
I am coding in 优快云.
展开
-
聚类算法汇总(附代码)
聚类算法汇总(附代码)本次整理了聚类工程里面常见算法,以及给出合适的工程结构方便调用,编写常用的聚类指标当作聚类结果函数,并Github链接在文末,供大家交流学习。文章目录聚类算法汇总(附代码)前言一、KMeans算法二、Kernel-Kmeans算法三、AP聚类算法四、谱聚类算法五、总结前言“物以类聚,人以群分”下面介绍几种聚类算法一、KMeans算法主要实现了肘部法确定聚类簇数,以及调用python的库函数进行聚类,可以参考我前面的博文二、Kernel-Kmeans算法这一部分在原创 2021-06-17 17:15:57 · 7211 阅读 · 1 评论 -
LSTM实践(代码详解)(一)
LSTM实践(代码详解)(一)首先学习LSTM的目的:对时序数据有一个更深层次的挖掘,对比深度学习方法和机器学习方法在特征提取上的优劣。文章目录LSTM实践(代码详解)(一)一、LSTM博文推荐二、代码详解先贴代码再解释总结一、LSTM博文推荐这里先推荐一本教材 《TensorFlow深度学习》 。首先学习Tensorflow对LSTM实战是有帮助的。这里不对LSTM进行过多原理解释,给出几个大佬的博文供大家学习:博文一 :系列好文!!!大佬主要讲解了原理部分和Kears实现部分,建议有程序基原创 2021-06-10 17:12:23 · 8366 阅读 · 7 评论 -
GBDT+LR方法学习+算法实践
GBDT(梯度提升决策树)+LR(逻辑回归)方法+python实践这篇文章记录一下在KDD比赛中大放异彩比肩Deeplearning的分类模型:GBDT+LR,小伙伴们可以读一下2014年facebook的论文,Practical Lessons from Predicting Clicks on Ads at Facebook,需要资源的欢迎评论交流文章目录GBDT(梯度提升决策树)+LR(逻辑回归)方法+python实践一、GBDT二、GBDT+LR总结一、GBDTGBDT也叫梯度提升决策原创 2021-05-24 13:28:15 · 1001 阅读 · 0 评论 -
聚类算法学习--Kernel K-means
聚类算法学习–Kernel K-means文章目录聚类算法学习--Kernel K-means前言一、代码总结前言具体原理不再阐述,详细实现过程可参见上一篇博文,这一篇是从原理或者核思想出发对核聚类的总结,一、代码直接贴代码代码如下(示例):import matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import make_circlesimport randomimport mathf原创 2021-03-22 10:43:29 · 1451 阅读 · 4 评论 -
聚类算法学习——kernel K-means及实现过程
聚类算法学习接着上一个博客的学习,这篇对改进算法kernel K-means进行了整理记录。**第二节 核空间聚类学习**文章目录聚类算法学习前言一、kernel是什么?二、核聚类学习1.问题描述2.代码实现3.结果展示总结前言物以类聚,人以群分。以下为学习笔记整理一、kernel是什么?相信刚接触核空间思想的小伙伴,在搜索帖子学习的过程中,脑海里不止一次会想到“Kernel is a shit!!!”,但是但是但是,核空间太厉害了好吗,它确确实实是低维空间映射到高维的核武器。“原创 2021-01-26 21:41:24 · 11464 阅读 · 126 评论 -
聚类算法学习——K-means
聚类算法学习导师给安排的方向发生改变,因此需要深入学习这部分内容,这系列就当作学习记录吧。**第一节K-means学习**文章目录聚类算法学习前言一、聚类是什么?二、K-means算法1.算法介绍2.代码实现3.结果分析4.调用API代码实现总结前言物以类聚,人以群分。以下为学习笔记整理一、聚类是什么?通过无监督学习或者半监督学习,把一群关系紧密存在着不同的样本进行亚群体划分。这里的关系紧密可以是指他们来自同一数据集,表示着相同的事物含义,以至于人们不能把他们进行区分的关系。通过原创 2021-01-15 22:35:58 · 970 阅读 · 2 评论 -
数据分析及预处理(三)
文章目录前言一、关于时间特征二、批量处理csv文件1.批量读入2.批量另存为前言这两周高高低低给导师当了工具人,没有学习到新的技能,这篇就当作今天的砖搬完后总结一下这两周吧一、关于时间特征上一篇文章讲了时间特征的一些定义,并讲了实例中的转换过程。但在批处理过程中遇到了一个小问题。就是.csv文件读取到pycharm中时,时间格式会发生改变,比如‘2018-12-11 09:23:11’这是在csv文件中正常的时间格式,但读入到编辑器之后,可能会变成’18-12-11 09:23:11’或者‘原创 2020-11-25 20:46:13 · 319 阅读 · 0 评论 -
数据分析及预处理(二)——时间特征
文章目录前言一、时间戳与时间二、时间格式解析三、DataFrame的更改前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。今天总结的是时间特征部分。时间特征构造包括连续时间特征和离散时间特征。连续时间特征比如持续时间和间隔时间,离散时间特征有拆解、判断等。本学习案例中用到的是离散时间特征构造,将一天时间按照从凌晨00:00:00开始进行标记,每五分钟是一个间隔,一天标记288..原创 2020-11-15 20:26:33 · 2747 阅读 · 0 评论 -
数据分析及预处理(一)
文章目录前言一、数据分析和预处理要做什么二、实际操作1.读取数据2.数据分析3.数据预处理总结前言经过了好几天的摸鱼,面对老师丢给的任务迟迟也是没有进展。但是摸鱼不能白摸,读了好多博主的文章,也是总结出来一些东西,慢慢罗列起来。一、数据分析和预处理要做什么 读取(txt、csv、xls等文件)数据分析【质量分析(缺失值、异常值)、特征分析(分布、对比、统计量、周期性、相关性)】数据预处理【数据清洗(缺失值、异常值)、数据集成(实体识别、属性冗余)】数据集划分(训练集、测试集)二、..原创 2020-11-14 20:47:10 · 3619 阅读 · 1 评论 -
Python读入制表位分割的csv文件
Python读入制表位分割的csv文件常见的csv文件都是以逗号进行分割的,但一次数据库导出的文件是以制表位间隔。虽说另存为如下方式即可正常使用,但大批量的文件总归是不合适的平时使用pandas读取csv文件挺方便,调用pd.read_csv()函数即可。同样使用该函数参数delimiter是设置分割符,默认是‘,’,但也可以设置为‘;’和‘\t’,\t即为制表位的符号表示。一直头疼的就是编码格式,这个不在这赘述,通常可见的就是utf-8和gbk,但是在我这份代码中设置这两种都会报错。询问一番原创 2020-11-12 11:40:08 · 2215 阅读 · 1 评论