
机器学习
文章平均质量分 72
机器学习领域知识
JaquanC
这个作者很懒,什么都没留下…
展开
-
机器学习工程项目的基本流程
机器学习工程项目的基本流程原创 2023-01-04 10:37:36 · 777 阅读 · 1 评论 -
KMeans算法在RFM模型(用户分层模型)上的应用
KMeans算法在RFM模型(用户分层模型)上的应用原创 2022-02-18 14:36:52 · 1016 阅读 · 0 评论 -
KMeans算法实践
KMeans算法实践原创 2022-02-16 15:44:16 · 980 阅读 · 0 评论 -
KNN算法代码练习
KNN算法实践原创 2022-02-16 10:41:26 · 1093 阅读 · 0 评论 -
线性回归代码练习
简单线性回归的代码原创 2022-02-15 16:24:24 · 388 阅读 · 0 评论 -
SVM入门系列
SVM入门(一)至(三)SVM的八股简介和白话解说,涉及经验风险和结构风险等知识;线性分类器、分类间隔(函数间隔、几何间隔)SVM入门(四)线性分类器的求解问题的描述SVM入门(五)线性分类器的求解目标函数和约束条件、二次规划SVM入门(六)线性分类器拉格朗日乘子SVM入门(七)为何需要核函数SVM入门(八)松弛变量续篇:SVM入门(九)松弛变量SVM入门(...原创 2019-04-12 08:58:15 · 404 阅读 · 0 评论 -
决策树算法梳理(从原理到示例)
决策树算法原理和实践原创 2019-03-29 11:05:49 · 7002 阅读 · 6 评论 -
逻辑回归算法梳理(从理论到示例)
逻辑回归算法的原理原创 2019-03-29 09:25:34 · 22878 阅读 · 5 评论 -
线性回归算法梳理(从理论到示例)
1、机器学习的一些概念有监督、无监督:有监督机器学习又被称为“有老师的学习”,所谓的老师是指标签。监督学习就是最常见的分类(注意和聚类区分)问题,通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。也就具有了对未知数据分类的能力...原创 2019-03-28 08:59:39 · 2244 阅读 · 0 评论 -
图解词嵌入、语言模型、Word2Vec
嵌入(embedding)是机器学习中最迷人的想法之一。 如果你曾经使用Siri、Google Assistant、Alexa、Google翻译,甚至智能手机键盘进行下一词预测,那么你很有可能从这个已经成为自然语言处理模型核心的想法中受益。在过去的几十年中,嵌入技术用于神经网络模型已有相当大的发展。尤其是最近,其发展包括导致BERT和GPT2等尖端模型的语境化嵌入。Word2vec是一种有效创...原创 2019-04-06 22:54:34 · 11235 阅读 · 6 评论 -
k-近邻算法梳理(从原理到示例)
k-近邻算法是一个有监督的机器学习算法,k-近邻算法也被称为knn算法,可以解决分类问题。也可以解决回归问题。本文主要内容整理为如下:knn算法的原理、优缺点及参数k取值对算法性能的影响;使用knn算法处理分类问题的示例;使用knn算法解决回归问题的示例;使用knn算法进行糖尿病检测的示例;一些扩展知识。1 算法原理knn算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投...原创 2019-04-01 08:51:07 · 48043 阅读 · 3 评论 -
文本预处理:TF-IDF
前一篇博客已经讲了向量化,那么向量化之后一般都伴随着TF-IDF的处理,这篇博客就TF-IDF做一个解释。1 向量化特征的不足还是上一篇博客中的例子,如果我们直接将统计词频后的9{9}9维向量作为文本分类的输入,会发现一些问题。比如第一个文本′This is the first document.′{'This\ is\ the\ fi...原创 2019-04-04 23:37:57 · 758 阅读 · 0 评论 -
文本预处理:词袋模型与向量化
一般对文本预处理或者叫做特征提取,首先是要分词,分词之后就是向量化,也就是训练词向量(其实就是将词和词频对应起来,做成矩阵向量的形式)。下面我们要讲的就是向量化。1 词袋模型讲向量化之前,先讲一下词袋模型(Bag of Words,BoW)。词袋模型假设我们不考虑文本中词与词之间的上下文关系,仅仅考虑所有词的权重,而权重与词在文本中出现的频率有关。词袋模型首先会进行分词,之后,通过统计每个词...原创 2019-04-04 22:22:09 · 2632 阅读 · 0 评论