- 博客(65)
- 资源 (6)
- 收藏
- 关注
转载 从最大似然到EM算法浅解
From:http://blog.youkuaiyun.com/zouxy09 从最大似然到EM算法浅解 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引
2016-07-07 22:02:25
759
原创 Python机器学习数据挖掘工具sklearn安装和使用
在windows平台下每次安装sklearn都感觉到非常麻烦,各种问题。包括numpy以及scipy的安装,最大的问题就是各种版本和依赖问题。特别是官方没有给出win64系统下对应的安装文件。非常麻烦。本文介绍借助于esay_install 和pip安装sklearn whl文件的方法。
2015-12-11 02:54:59
7227
转载 MySQL命令行导入导出数据
MySQL命令行导出数据库:1,进入MySQL目录下的bin文件夹:cd MySQL中到bin文件夹的目录如我输入的命令行:cd C:\Program Files\MySQL\MySQL Server 4.1\bin(或者直接将windows的环境变量path中添加该目录)2,导出数据库:mysqldump -u 用户名 -p 数据库名 > 导出的文件名 如我输
2015-08-31 19:26:05
2928
转载 混合推荐策略
推荐系统中所使用的混合技术介绍2013年10月25日 ⁄ 字号 小 中 大 在推荐系统实际运用中,各种混合技术是其中一项极为重要的核心技术。在工程实践中我们发现,混合技术对提升推荐效果、改进推荐系统的性能等都有重要意义,因此本文对该专题进行如下的一些总结和介绍。引言在这个信息爆炸的时代,消费者面临众多选择、未知的领域、过载的信息时,往往无所适从;然而与此同时,内
2015-04-12 21:35:10
5233
原创 数据挖掘基础知识-矩阵(分解)
1. 矩阵知识://特征值,行列式,秩,对称矩阵,单位矩阵,正定半正定,雅可比等等!!正交矩阵:如果:AA'=E(E为单位矩阵,A'表示“矩阵A的转置矩阵”。)或A′A=E,则n阶实矩阵A称为正交矩阵, 若A为正交阵,则满足以下条件:1) AT是正交矩阵2) (E为单位矩阵)3) A的各行是单位向量且两两正交4) A的各列是单位向量且两两正交5) (Ax
2014-12-27 10:06:53
19697
1
转载 几种概率语言模型和参数学习方法
From:http://blog.youkuaiyun.com/yangliuy/article/details/8330640 http://blog.youkuaiyun.com/yangliuy/article/details/8302599
2014-11-21 09:28:17
4482
转载 马尔科夫链和马尔科夫随机场
1.什么是随机过程?在当代科学与社会的广阔天地里,人们都可以看到一种叫作随机过程的数学模型:从银河亮度的起伏到星系空间的物质分布、从分子的布朗运动到原子的蜕变过程,从化学反应动力学到电话通讯理论、从谣言的传播到传染病的流行、从市场预测到密码破译,随机过程理论及其应用几乎无所不在。人类历史上第一个从理论上提出并加以研究的过程模型是马尔科夫链,它是马尔科夫对概率论乃至人类思想发展作出的又一伟大贡献
2014-11-07 15:25:35
1116
转载 机器学习经典书籍
from:入门书单《数学之美》 PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories Behind
2014-10-23 18:48:28
808
转载 【综述】(MIT博士)林达华老师-"概率模型与计算机视觉”
from:距上一次邀请中国科学院的樊彬老师为我们撰写图像特征描述符方面的综述(http://www.sigvc.org/bbs/thread-165-1-1.html)之后,这次我们荣幸地邀请到美国麻省理工学院(MIT)博士林达华老师为我们撰写“概率模型与计算机视觉”的最新综述。这次我们特别增设了一个问答环节,林老师针对论坛师生提出的许多问题(如概率图模型与目前很热的深度神经网络的联系和区别)
2014-10-13 20:51:56
1016
转载 技术书是怎么写出来的
2014年4月份,我开始写作《深入浅出Qt on Android》一书,8月份的时候交稿,该书现在正在出版旅途中。8月份我开始了有关QML的入门书籍的写作,经过无数个日夜的奋战,到今天基本完稿了,正在校对中。 我想我能根据自己的经历来说说一本技术书籍是如何写就的。 我以为写书看起来是比较有气场的事情,在上大学时我就有写书的梦想,希望哪天哪个出版社能出版我的小说。那时候混迹于各个
2014-09-17 16:20:01
830
转载 概率图模型基础
以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。1、最大似然估计MLE
2014-09-17 16:12:46
4232
转载 Hadoop中使用压缩文件格式
hadoop中支持的压缩方式有多种,比如Gzip,bzip2,zlib等,其中Gzip是hadoop中内置就支持的一种压缩方式,这种压缩方式在平 时linux 的开发人员和管理 员中使用的比较广泛,压缩比也比较高,压缩速度也还不 错,所以很多人都喜欢第一趋向于使用这种压缩格式进行文 件 的压缩。 在hadoop中,要在mapreduce 的job中使用gzip压缩是比较容易的,
2014-08-25 15:54:20
1019
原创 PRML(Pattern Recognition And Machine Learning)学习【2】
本文是Pattern Recognition And Machine Learning学习第二章的学习笔记和心得。
2014-07-17 14:38:56
1035
转载 世上最伟大的十个公式
英国科学期刊《物理世界》曾让读者投票评选了“最伟大的公式”,最终榜上有名的十个公式既有无人不知的1+1=2,又有著名的E=mc2;既有简单的-圆周公式,又有复杂的欧拉公式……从什么时候起我们开始厌恶数学?这些东西原本如此美丽,如此精妙。这个地球上有多少伟大的智慧曾耗尽一生,才最终写下一个等号。每当你解不开方程的时候,不妨换一个角度想,暂且放下对理科的厌恶和对考试的痛恨。因为你正在见
2014-05-03 19:28:55
947
转载 为什么计算机类期刊的影响因子这么低?
影响因子(IF)是中国的CSer心中永远的痛!每当人家都说自己领域的IF=4,6的期刊的时候,CSer只能看看国内惟一的一个SCI检索的JCST-- IF=0.4,而某一网站曾统计,计算机方向最牛的SIGXXX会议的IF也仅为一点几。结果,招生最热的CS在学校成果评定的时候成了最尴尬的……事实果然如此吗? 先看看从Google上搜索的SCI的定义:JCR对包括SCI收录的3
2013-12-28 21:01:36
12656
原创 Matlab学习笔记1
1. 在命令窗口中,如果一条命令太长,希望能在下一行继续输入那么可以使用连行号...eg. >> s = 1+2+3+4+...5+6+7s = 28>>eg.(连字符并不是在任意位置或类型之后都可以)>> s = 1+2+3+4... s = 1+2+3+4... |Error: Unexpected MATLAB oper
2013-12-22 11:18:32
829
转载 几款开源的数据挖掘工具
come from:http://idmer.blog.sohu.com/106647744.html;http://blog.youkuaiyun.com/liygcheng/article/details/17187765 本文的主要内容编译自Blaz Zupan和Janez Demsar的一篇论文(Open-Source Tools for Data Mining)。我仅仅选择其中的要点
2013-12-20 20:57:06
5454
转载 关于程序员的59条搞笑但却真实无比的编程语录
come from:http://www.aqee.net/59-hilarious-but-true-programming-quotes-for-software-developers/程序员编程语录1. 一个好的程序员是那种过单行线马路都要往两边看的人。(Doug Linder)2. 程序有问题时不要担心。如果所有东西都没问题,你就失业了。(软件工程的Mosher定律)3.
2013-12-19 18:47:51
844
原创 windows shell语法及简单的例子
windows Shell 脚本语法扩展名是bat(在nt/2000/xp/2003下也可以是cmd)的文件就是批处理文件。==== 注 ======================================= .bat是dos下的批处理文件 .cmd是nt内核命令行环境的另一种批处理文件 从 更广义的角度来看,unix的shell脚本以及其它操作系统甚至应用程序中由
2013-12-18 22:48:10
4449
转载 ubuntu(Kubuntu)安装ns3
1. NS3安装预先设置Ubuntu环境,执行在终端以下命令sudo apt-get install gcc g++ pythonsudo apt-get install mercurialsudo apt-get install bzrsudo apt-get install gdb valgrind sudo apt-get install gsl-bin libgsl0-
2013-12-17 17:54:58
1046
原创 Linux系统基础1-基本命令行与操作
一..基本指令:1. cd: 基本用法:cd [dirName] 说明 : 变换工作目录至 dirName。 其中 dirName 表示法可为绝对路径或相对路径。cd ~ 跳到自己的 home directory ; cd 进入用户主目录home directory;cd ../.. 跳到目前目录的上上两层 cd - 返回进入当前目录前所
2013-12-17 14:39:58
621
原创 朴素贝叶斯
1.贝叶斯法则机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。2.先验概率和后验概率用P(h)表示在没有训练数据前假设h拥有的初始概率。P(h)被
2013-11-12 22:05:33
859
原创 统计学习方法-Logistic(逻辑斯蒂)回归
reference: http://f.dataguru.cn/thread-128261-1-1.html我们在做线性回归分析时,其实是用y=mx+b直线去拟合我们的样本点,如果样本点和直线拟合很好,我们就可以得出样本点的线性相关性很强,通常用决定系数R2来表示。在寻找拟合直线的方法是最小二乘法,其实质就是找样本点离直线距离的最小平方和。这个我在白话线性回归中已经讲到。前面我都参考KHA
2013-11-11 18:23:19
5556
转载 数据挖掘中所需的概率论与数理统计知识
come from:http://blog.youkuaiyun.com/v_july_v/article/details/8308762 向博主致敬! (关键词:微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布)导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分
2013-11-06 16:05:15
1814
转载 K-means聚类
come from:http://www.youkuaiyun.com/article/2012-07-03/2807073-k-means摘要:在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。在数据挖掘中,K-Means算法是一种cluster analysis的算法,其主要是来计算数据聚
2013-11-06 15:26:27
790
原创 话题模型-topic model
reference:http://blog.youkuaiyun.com/xianlingmao/article/details/70761651.话题模型(topic model)的提出及发展历史topic model 是一种应用十分广泛的产生式模型(generative model),在IR, NLP,ML都有广泛的应用,本文将对目前已有的topic model进行分类总结,然后选择几个代表性
2013-10-31 19:46:30
4709
转载 看懂信息检索和网络数据挖掘领域论文的必备知识总结
come from:http://blog.youkuaiyun.com/xianlingmao/article/details/7667042信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺
2013-10-31 19:38:25
1056
转载 在计算机领域做研究的一些想法
come from:http://blog.youkuaiyun.com/chl033/article/details/4795649本文关于米国CS计算机的介绍实在是太可爱了,不得不收藏,感谢 Xi Tan# 前言 #1. 讨论一下计算机领域的牛圈和‘带头大哥’;2. 讨论一下科研方法;3. 讨论一下计算机领域的学术论文(会议、期刊);# 第一章 #计算机的大牛90%以上都在
2013-10-29 15:56:10
2798
转载 数据挖掘领域大牛
OrganizationCountryAchim HoffmannUniversity of New South WalesAustraliaAd FeeldersUniversiteit UtrechtThe NetherlandsAda Waichee FuChinese University of Hong KongHong K
2013-10-29 15:35:47
3690
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人