
机器学习
lhxsir
Unto a full grown man.
展开
-
Dev-Cpp使用&快捷键
之前搞过蓝桥杯,就从官网下载了Dev-cpp软件~http://dasai.lanqiao.cn/pages/dasai/news_detail_w.html?id=1819解压后,点击File – New – Project,直接F9编译F10运行:#include <stdio.h>#include <stdlib.h>int main(int arg ,char *argv[]) { printf("hello world!"); return 0;}编译运原创 2020-10-21 10:58:52 · 966 阅读 · 0 评论 -
机器学习-KMeans聚类算法
K-Means和KNN区别:KNN是监督学习的分类算法,有对应的类别输出。KNN基本不需要训练,对测试集里面的点,只需要找到在训练集中最近的k个点,用这最近的k个点的类别来决定测试点的类别。K-Means是无监督学习的聚类算法,没有样本输出;K-Means则有明显的训练过程,找到k个类别的最佳质心,从而决定样本的簇类别。两个算法都包含一个过程,即找出和某一个点最近的点。两者都利用了最...原创 2019-12-29 21:33:17 · 604 阅读 · 0 评论 -
机器学习-决策树
未完待续原创 2019-12-22 14:55:13 · 106 阅读 · 0 评论 -
机器学习-逻辑回归
后期补。。原创 2019-12-15 21:48:38 · 301 阅读 · 0 评论 -
第七章(逻辑回归)
一元逻辑回归数据:1|21|31|41|51|60|70|80|90|100|11代码:import org.apache.spark.mllib.classification.LogisticRegressionWithSGDimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.ml...原创 2018-10-11 17:47:26 · 853 阅读 · 0 评论 -
第六章(随机梯度下降)
测试数据1:5,1 17,2 19,3 211,4 119,5 318,6 2测试代码1:import org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.mllib.regression.{LabeledPoint, LinearRegressionWithSGD}import org.apache.sp...原创 2018-10-10 18:06:43 · 153 阅读 · 0 评论 -
第五章(ALS算法)
代码:import org.apache.spark._import org.apache.spark.mllib.recommendation.{ALS, Rating}object CollaborativeFilter { def main(args: Array[String]) { val conf = new SparkConf().setMaster("local...原创 2018-10-10 18:04:51 · 413 阅读 · 0 评论 -
第五章(余弦相似度)
代码:import org.apache.spark.{SparkConf, SparkContext}import scala.collection.mutable.Mapobject CollaborativeFilteringSpark {val conf = new SparkConf().setMaster("local").setAppName("CollaborativeF...原创 2018-10-10 17:56:15 · 274 阅读 · 0 评论 -
Spark ML常用函数
VectorAssembler是一个transformer,作用是将多列数据转化为单列的向量列。 val assembler = new VectorAssembler().setInputCols(featureCol).setOutputCol("features")StringIndexer 作用是把一组字符型标签编码成一组标签索引,索引的范围为0到标签数量。val indexer = ne...原创 2018-06-27 15:26:03 · 1030 阅读 · 0 评论 -
梯度下降法(下)
梯度下降法2原创 2019-12-08 18:40:44 · 130 阅读 · 0 评论 -
梯度下降法(上)
梯度下降法原创 2019-12-08 18:39:49 · 97 阅读 · 0 评论 -
机器学习-回归算法(下)
评价分类结果(上)线性回归的评价指标《机器学习的敲门砖:归一化与KD树》特征工程系列:特征预处理(上)模型之母:简单线性回归&最小二乘法模型之母:简单线性回归的代码实现模型之母:多元线性回归《还不了解梯度下降法?看完这篇就懂了!》《手动实现梯度下降(可视化)》《线性回归中的梯度下降》...原创 2019-12-08 18:36:08 · 116 阅读 · 0 评论 -
机器学习-回归算法(上)
之前我们介绍的KNN算法属于分类(Classification),即Label为离散的类别型(categorical variable),如:颜色类别、手机品牌、是否患病等。而简单线性回归是属于回归(Regression),即Label为连续数值型(continuous numerical variable),如:房价、股票价格、降雨量等。在这里插入代码片...原创 2019-12-01 18:37:24 · 137 阅读 · 0 评论 -
数据预处理(特征工程)
本次主要介绍处理分类型特征:编码与哑变量、二值化与分段略原创 2019-11-24 22:49:30 · 302 阅读 · 0 评论 -
机器学习-KNN分类算法(下)
之前写了KNN的基本概念和python基本实现方法,并没有对模型的好坏进行判断,接下来使用训练数据集和测试数据集来判断(使用accurcay分类指标)编写自己的train_test_split测试数据集未完待续...原创 2019-11-17 21:19:26 · 143 阅读 · 0 评论 -
机器学习-KNN分类算法(上)
K近邻算法(k-NearestNeighbor)k近邻算法是机器学习算法最简单的算法,流程如下:(1) 计算测试对象到训练集中每个对象的距离(2)按照距离的远近排序(3)选取与当前测试对象最近的k个对象,作为该测试对象的邻居(4)统计这k个邻居的类别频率(5)k个邻居里频率最高的类别,即为测试对象的类别python代码实现1、自实现KNN算法import numpy as np...原创 2019-11-10 20:54:30 · 177 阅读 · 0 评论