
机器学习
文章平均质量分 61
Luban250
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
关联规则及Apriori算法Python实例
关联规则学习概述在大型数据库中发现变量之间有趣关系的方法,目的是利用一些有趣的度量识别数据库中的强规则。基于强规则的概念,Rakesh Agrawal等人引入了关联规则以发现由超市的POS系统记录的大批交易数据中产品之间的规律性。例如,从销售数据中发现的规则{薄饼,鸡蛋}->{火腿肠},表明如果顾客一起买薄饼和鸡蛋,他们也有可能买火腿肠(这些顾客是想早饭吃手抓饼吧,哈哈),此类信息可以为大卖场商品组合促销或电商网站产品推荐等相关商业决策提供依据。除了上述的购物篮分析外,关联规则还被应用在许多领域中,转载 2021-07-17 18:33:52 · 1817 阅读 · 0 评论 -
机器学习开发者的现代化路径
转载: http://dataunion.org/25284.html机器学习算法的传统学习路径,是从统计学、概率论、线性代数、微积分等多种数学知识开始,但专业程序员、机器学习爱好者、MachineLearningMastery.com网站大拿Jason Brownlee博士认为这种自下而上的方法停留在算法层面,没有考虑到软件开发和交付,不适合专业程序员,他在一篇文章中面向程序转载 2016-07-29 16:42:37 · 841 阅读 · 0 评论 -
Jacobian矩阵和Hessian矩阵
转载:http://jacoxu.com/?p=1461. Jacobian在向量分析中, 雅可比矩阵是一阶偏导数以一定方式排列成的矩阵, 其行列式称为雅可比行列式. 还有, 在代数几何中, 代数曲线的雅可比量表示雅可比簇:伴随该曲线的一个代数群, 曲线可以嵌入其中. 它们全部都以数学家卡尔·雅可比(Carl Jacob, 1804年10月4日-1851年2月18日)命转载 2016-08-03 14:17:39 · 640 阅读 · 0 评论 -
linux系统下CRF++及GCC安装
转载: http://blog.sina.com.cn/s/blog_8e1edee90101pp6x.html折腾了好几天,但还未成功安装和应用,小抓狂,但做事情本不就是如此,总会走点弯路,但只要坚持,总会成功的,所以,一定要挺住,抓狂的时候放松放松,然后接着干! 1、起初自己PC上装的Ubuntu13.10,工作过程中总是出现死机情况,至今不知原因在哪里,不知转载 2016-10-23 20:13:57 · 4572 阅读 · 0 评论 -
百度开源深度学习框架PaddlePaddle安装配置(单机CPU版)
一、环境配置PC机一台+Windows 7 Homebasic 系统二、过程1、安装Ubuntu14.04.1 64位双系统如果你的PC机是windows系统,建议安装Linux双系统,以下以安装Ubuntu14.04.164位系统为例(这个版本比较稳定,众多软件支持,Paddle的三种安装方式都可以在Ubuntu14.04.1 64位系统上安装),如过你的系统是Linu原创 2016-09-25 15:48:13 · 27670 阅读 · 10 评论 -
半正定矩阵是闭凸锥
参考资料:http://www.ti.inf.ethz.ch/ew/lehre/ApproxSDP09/notes/conelp.pdf P20原创 2016-10-15 15:36:05 · 5293 阅读 · 0 评论 -
广义不等式及其性质,极小元与最小元
参考资料:http://wenku.baidu.com/view/df00e592551810a6f5248682.html?from=search广义不等式的性质:广义不等式的性质(续):转载 2016-10-16 10:50:32 · 3989 阅读 · 0 评论 -
LDA必读的资料
一个大牛写的介绍,貌似需翻墙http://tedunderwood.wordpress.com/2012/04/07/topic-modeling-made-just-simple-enough/David M.Blei主页:http://www.cs.princeton.edu/~blei/publications.html,上面有布雷最新的文章:Introduction to pr转载 2016-10-01 09:12:13 · 744 阅读 · 0 评论 -
通俗易懂地介绍梯度下降法(以线性回归为例,配以Python示例代码)
转载:https://spin.atomicobject.com/2014/06/24/gradient-descent-linear-regression/An Introduction to Gradient Descent and Linear RegressionGradient descent is one of those “greatest转载 2016-10-30 15:41:12 · 1633 阅读 · 0 评论 -
For A, B such that AB is square, prove trAB = trBA.
prove tr(AB) = tr(BA)转载 2017-01-11 09:37:43 · 2139 阅读 · 0 评论 -
实际工程中提升机器学习算法性能的建议
机器学习工程师Jason Brownlee提供的一份“ML Performance Improvement Cheat Sheet.” 点我下载Jason Brownlee主张在实践工程中“自顶向下”地学习机器学习,首先使用机器学习算法解决实际工程中的问题,得到初步结果,之后逐步深入学习背后的理论推导。Jason Brownlee的Machine Learning网站为初学者提供原创 2017-02-15 16:44:06 · 1003 阅读 · 0 评论 -
最大熵模型GIS算法的Python实现
最大熵模型GIS算法的Python实现最大熵模型工具包原创 2017-05-25 20:21:41 · 6224 阅读 · 3 评论 -
文本特征选择
转载:http://www.cnblogs.com/fengfenggirl/p/text_feature_selection.html在做文本挖掘,特别是有监督的学习时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍两种常用的特征选择方法:互信息 一个常用的方法转载 2016-06-14 20:46:37 · 2075 阅读 · 0 评论 -
python scikit-learn计算tf-idf词语权重
转载 :http://blog.youkuaiyun.com/liuxuejiang158blog/article/details/31360765 Python的scikit-learn包下有计算tf-idf的api,研究了下做个笔记1 安装scikit-learn包[python] view plain copys转载 2016-06-14 20:00:55 · 4056 阅读 · 2 评论 -
基本文本聚类方法
转自:http://blog.youkuaiyun.com/wangran51/article/details/7382258转自:http://hi.baidu.com/yaomohan/blog/item/e7b1c2c2516638110ef477cc.html经过N天的努力,我的第一个文本聚类小程序终于火热出炉了.真不容易啊,在网上看了很多程序才明白其中的核心原理。其实原理转载 2016-06-14 20:26:11 · 13219 阅读 · 0 评论 -
【Python】 sorted函数
转载自:http://blog.163.com/zhuandi_h/blog/static/1802702882012111284632184/我们需要对List、Dict进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序,在本地进行排序,不返回副本方法2.用built-in函数sorted进行排序(从2.4开始),返回副转载 2015-03-16 10:40:47 · 552 阅读 · 0 评论 -
用于机器学习的数据库--UCI数据库
数据库地址:http://archive.ics.uci.edu/ml/datasets.htmlUCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库目前共有187个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。UCI数据可以使用matlab的dlmread(或textread或者原创 2015-03-28 10:58:37 · 4448 阅读 · 1 评论 -
Windows下安装python2.7及数据挖掘模块套装
转载自:http://www.jb51.net/article/61810.htm这篇文章主要向大家介绍的是在windows系统下安装python 2.7以及numpy安装、six安装、dateutil安装、pyparsing安装、matplotlib安装和scipy安装的方法,分享给大家,需要的小伙伴可以参考下,相对来说,windows下的安装还是比较简单的。转载 2015-03-17 17:21:57 · 1005 阅读 · 0 评论 -
python numpy中nonzero()的用法
转载自:http://m.blog.youkuaiyun.com/blog/xiaolewennofollow/44985907#当使用布尔数组直接作为下标对象或者元组下标对象中有布尔数组时,都相当于用nonzero()将布尔数组转换成一组整数数组,然后使用整数数组进行下标运算。nonzeros(a)返回数组a中值不为零的元素的下标,它的返回值是一个长度为a.ndim(数组a的轴数)的元组,元转载 2015-07-18 23:25:21 · 1220 阅读 · 0 评论 -
python自动给数字前面补0的方法
转载:http://www.sharejs.com/codes/python/8037-python中有一个zfill方法用来给字符串前面补0,非常有用Pythonpython中有一个zfill方法用来给字符串前面补0,非常有用n = "123"s = n.zfill转载 2016-02-27 10:57:26 · 199090 阅读 · 7 评论 -
Python机器学习实战kNN分类算法
自学《机器学习实战》一书,书中的代码亲自敲一遍,努力搞懂每句代码的含义:今天将第一章kNN分类算法的笔记总结一下。# -*- coding: utf-8 -*-"""k-近邻算法小结:k-近邻算法是基于实例的学习,k-近邻算法必须保存全部数据集,如果训练数据集很大,必须使用大量的存储空间。由于必须对数据集中的每个数据计算距离值,实际使用时可能非常耗时。可修改的参数为:k,原创 2016-03-23 21:29:42 · 2996 阅读 · 0 评论 -
基于K-Means的文本聚类
http://blog.youkuaiyun.com/freesum/article/details/7376006何为聚类 “聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性。”转载 2016-06-10 15:43:19 · 5738 阅读 · 0 评论 -
初识聚类算法:K均值、凝聚层次聚类和DBSCAN
http://blog.sina.com.cn/s/blog_62186b460101ard2.html聚类分析就仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组(簇)。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差别越大,聚类就越好。先介绍下聚类的不同类型,通常有以下几种:(1)层次的与划分的:如果允许簇具有子转载 2016-06-10 16:02:03 · 1961 阅读 · 0 评论 -
协同过滤算法
http://blog.youkuaiyun.com/acdreamers/article/details/44672305今天要讲的主要内容是协同过滤,即Collaborative Filtering,简称CF。 Contents 1. 协同过滤的简介 2. 协同过滤的核心 3. 协同过滤的实现 4. 协同过滤的应转载 2016-06-11 11:18:57 · 554 阅读 · 0 评论 -
k-均值聚类算法;二分k均值聚类算法
根据《机器学习实战》一书第十章学习k均值聚类算法和二分k均值聚类算法,自己把代码边敲边理解了一下,修正了一些原书中代码的细微差错。目前代码有时会出现如下3种报错信息,这有待继续探究和完善。报错信息:Warning (from warnings module): File "F:\Python2.7.6\lib\site-packages\numpy\core\_methods.py",原创 2016-06-11 21:20:13 · 7287 阅读 · 3 评论 -
Python sklearn K-means算法及文本聚类实践
转载:http://www.ziliao1.com/Article/Show/B2F0AD01141F0D9ADC32D04B8A2AD6D1.htmlK-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-means算法需要事先指定簇的转载 2016-06-14 20:29:21 · 14617 阅读 · 1 评论 -
Python中怎样使用shape计算矩阵的行和列
转载自:http://www.w2bc.com/Article/119041 >>> a=mat([[1,2,3],[5,6,9]]);2 >>> a3 matrix([[1, 2, 3],4 [5, 6, 9]])5 >>> shape(a)[0]6 27 >>> shape(a)[1]8 3如上面的a矩阵,2行3列;计算行使用shape(a)[0]转载 2015-03-15 11:33:23 · 2608 阅读 · 0 评论