
机器学习与数据挖掘
dominic_z
这个作者很懒,什么都没留下…
展开
-
【无监督学习】积累与发现
K-MeansCanopy ClusteringCanopy算法聚类算法杂货铺——k均值聚类(K-means)基本Kmeans算法介绍及其实现(距离的度量)K-means与K-means++DBSCAN聚类方法:DBSCAN算法研究(1)–DBSCAN原理、流程、参数设置、优缺点以及算法5.无监督学习-DBSCAN聚类算法及应用DBSCAN密度聚类算法LOF异常点/离群点检测...原创 2019-03-12 22:18:53 · 267 阅读 · 0 评论 -
【深度学习】积累与发现
深度学习(Deep Learning)神经网络基础一文看懂25个神经网络模型前馈神经网络与反向传播算法(推导过程)⊙\odot⊙指的应该是两个形状相同的向量,把位置相同的项进行乘积A Step by Step Backpropagation Example卷积神经网络(CNN)深度学习简介(一)——卷积神经网络卷积核的参数也是学出来的,但是又要考虑pooling,这个参数咋学...原创 2019-03-08 22:25:41 · 536 阅读 · 0 评论 -
【有监督学习】积累与发现
线性回归线性回归最小二乘法小结脊回归(Ridge Regression)Lasso Regression多重共线性的解决方法之——岭回归与LASSO感知机感知机原理小结在《统计学习方法》中,定义的方式有一些不同,如下图所示书中所提到了“不考虑1∥w∥\frac{1}{\|w\|}∥w∥1”,实际意思是说不会影响解,对于最小化问题−1∥w∥∑yi(wxi+b)-\frac ...原创 2019-08-13 23:38:54 · 631 阅读 · 0 评论 -
【机器学习综合】积累与发现
一、机器学习基础(Mechine Learning)机器学习基础理解 Bias 与 Variance 之间的权衡 var是不同训练模型之间的差别,好比K-fold之中,如果不同模型之间差别很大(var大),也就是说他们都和自己的训练集与其他训练集不接近,所以,不同模型之间var很大-&am原创 2018-03-28 14:25:33 · 698 阅读 · 0 评论 -
【推荐与广告】积累与发现
新坑推荐算法入门与科普推荐算法入门5类系统推荐算法,非常好使,非常全推荐系统中使用ctr预估模型的发展协同过滤协同过滤推荐算法的原理及实现基于用户的协同过滤:给相似的人推荐相同的物品;基于物品的协同过滤:把相似的物品推荐给相同的人。人与人之间的相似性通过给相同的物品的打分情况来判定,因为如果两个人都人为某一个物品好,那么这两个人就相似;物品与物品的相似性通过被相同的人的打分情况来...原创 2019-03-11 09:13:23 · 839 阅读 · 0 评论 -
【算法面试笔记】
特征工程特征归一化为啥要归一化书上那个例子我觉得不好以线性回归为例,w1x1+w2x2=yw_1x_1+w_2x_2=yw1x1+w2x2=y,损失就是L=Σin(w1xi1+w2xi2−yˉ)2L=\Sigma_i^n(w_1x_{i1}+w_2x_{i2}-\bar{y})^2L=Σin(w1xi1+w2xi2−yˉ)2,展开之后有w1,w2w_1,w_2w1,...原创 2019-07-28 21:13:47 · 358 阅读 · 0 评论 -
What makes LightGBM lightning fast?
墙外的一篇文章,讲得挺好的,转过来了,原文Understanding GOSS and EFB; The core pillars of LightGBMThe post is structured as follows :Basics of GBM.Computational bottlenecks of GBM.LightGBM’s optimisations over th...转载 2019-07-26 11:47:24 · 225 阅读 · 0 评论 -
【TensorFlow】理解TensorFlow计算图
博客TensorFlow基础知识:计算图中的Op,边,和张量中有一句话,对于我来说是醍醐灌顶,一下子明白了TensorFlow的计算模式计算图的定义和图的运算是分开的.tensorflow是一个’符号主义的库’.编程模式分为两类,命令式(imperative style)和符号式(symbolic style).命令式的程序很容易理解和调试,它按照原有的逻辑运行.符号式则相反,在现有的深度学习...原创 2019-06-13 19:06:02 · 4105 阅读 · 2 评论 -
【TensorFlow】
数据基础在tensorflow里,类型很重要Variable和get_variable的用法以及区别tf.reset_default_graph()a=tf.get_variable('13',shape=[],initializer=tf.constant_initializer(12))# 下一个语句报错# a=tf.get_variable('13',shape=[],ini...原创 2019-04-28 12:43:21 · 1206 阅读 · 0 评论 -
【深度学习】BP算法-误差逆传播算法详解
前些开始准备找实习找工作了,复习机器学习算法的时候发现BP算法又忘了,这次写博客记录一下,由于我矩阵知识不是很好,所以这篇文章没有以矩阵运算的方式来讲解。本文表面是原创,实际上参考了很多很多文章符号与神经网络结构说明LLL : 当前神经网络的总层数nln^{l}nl : 第lll层神经元拥有的神经元个数αil\alpha^{l}_{i}αil : 第lll层神经网络中的第iii个神经元...原创 2019-02-21 13:13:22 · 1204 阅读 · 0 评论 -
【Weka】Weka工具包
用久了scikitlearn,突然换回weka各种不适应weka的tree分类器输出的树后面的括号的含义调用API对样本进行分类在分类问题中,当调用如下代码对testInstance进行分类,输出的是一个double,预测的结果是一个index,假设预测结果为0.0double index = classifier.classifyInstance(testInstance)假如训练...原创 2018-09-18 20:48:21 · 1080 阅读 · 0 评论 -
Canopy Clustering
转载 原文链接:http://picksesame.blogspot.com/2011/05/canopy-clustering.htmlCanopy ClusteringLately I was introduced to a clustering algorithm called “canopy clustering”. In plain English, like all othe...转载 2018-06-30 10:43:44 · 459 阅读 · 0 评论