- 博客(28)
- 资源 (12)
- 收藏
- 关注
原创 【python学习笔记】
如何查看math下的所有方法import math # Imports the math moduleeverything = dir(math) # Sets everything to a list of things from mathprint everything # Prints 'em all!
2014-09-09 20:29:09
2555
转载 数据挖掘书单
2014.2.1更新,由于经常接到私信要求在这个书单之内再推荐两三本,每个人的行业背景也不一样,所以就把下面的书单归类整理一下。入门读物:深入浅出数据分析 (豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。啤酒与尿布 (豆瓣) 通过案例来说事情,而且是最经典的例子。难易程度:非常易。数据之美 (豆瓣) 一本介绍性的书籍,每章都解决一
2014-07-21 14:04:48
2211
转载 机器学习书单
入门书单《数学之美》 PDF作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。《Programming Collective Intelligence》(《集体智慧编程》)PDF作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Soluti
2014-07-21 11:34:53
1448
转载 推荐几个机器学习算法及应用领域相关的中国大牛
李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性等问题的研究。曾在人大听过一场他的讲座,对实际应用的问题抽象,转化和解决能力值得学习。周志华
2014-07-15 16:38:01
1116
转载 一些自由的数据挖掘工具
R • R (http://www.r-project.org/) • Tinn-R(http://sourceforge.net/projects/tinn-r/)基于R语言环境的一个GUI。数据挖掘• Weka (http://www.cs.waikato.ac.nz/ml/weka/)– 一个数据挖掘的开源软件,和R一样产自新西兰。Weka是新西兰一种特产鸟类
2014-07-14 11:11:11
1529
原创 基于朴素贝叶斯分类器的文本分类算法的实现过程分析
基于朴素贝叶斯分类器的文本聚类算法 (上) http://www.cnblogs.com/phinecos/archive/2008/10/21/1315948.html 基于朴素贝叶斯分类器的文本聚类算法 (下)http://www.cnblogs.com/phinecos/archive/2008/10/21/1316044.html
2014-07-11 23:41:12
2559
转载 CSS选择器
CSS的基本选择器h1{color:blue; font-size:25px; text-decoration:underline;} /*标签选择器 */em{ color:red;} p span{ color:green;}p{font-weight:normal; font-size:55px;}.red{ color:red;
2014-07-10 20:57:07
720
原创 【读书笔记-数据挖掘概念与技术】数据立方体技术
基本概念:单元:基本方体的单元 聚集单元:非基本方体的单元 冰山立方体:部分物化的立方体 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围)∵冰山立方体仍有大量不感兴趣的单元需要计算∴引入——闭覆盖——一个单元没有后代或者它的后代的度量值与其不同 没理解 法2:只预计算涉及少数维的立方体,这些方体形成的数据立方体
2014-07-04 20:01:57
1935
1
转载 理解maven的核心概念
好久没进行java方面的开发了,最近又完成了一个java相关的任务,顺便重新体会了 maven 这一利器。在使用过程中发现以前对maven的理解不够深入,借此机会重新梳理了一下maven的核心概念。相信理解了这些核心概念, 即使长时间不使用,以后再重新上手也会非常容易。本文以类图的方式,介绍maven核心的12个概念以及相互之间的关系。Table of Contents
2014-07-02 22:28:55
5003
2
转载 机器学习算法汇总:人工神经网络、深度学习及其它
摘要:机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里我们将为您总结一下常见的机器学习算法,以供您在工作和学习中参考。【编者按】机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式根
2014-07-02 09:57:19
1312
转载 hadoop三个配置文件的参数含义说明
1 获取默认配置配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置可以生效,上网找的配置可能因为各个hadoop版本不同,导致无法生效。浏览更多的配置,有两个方法:1.选择相应版本的hadoop,下载解压后,搜索*.xml,找到
2014-07-02 09:51:11
1192
原创 MAC下配置maven
官方文档:Unix-based Operating Systems (Linux, Solaris and Mac OS X)Extract the distribution archive, i.e. apache-maven-3.2.2-bin.tar.gz to the directory you wish to install Maven 3.2.2. These in
2014-07-02 08:56:57
3982
原创 【JOB】
数据分析师职位描述工作职责: 1、负责业务数据采集整理,对数据进行深度分析、挖掘和建模; 2、对用户行为数据进行分析和挖掘,基于客观的分析结果找到可能的问题并给改进的意见; 3、基于网站的运营数据,设计用于统计分析的数据指标,从多个角度度量网站运营的状况,并制作各种反映运营状况的数据报表; 4、为公司运营决策、产品方向提供数据支持。 任职资格: 1、经济分析
2014-06-28 10:01:24
659
原创 【DP-最大子串和】PAT1007. Maximum Subsequence Sum
1007. Maximum Subsequence Sum (25)时间限制400 ms内存限制32000 kB代码长度限制16000 B判题程序Standard作者CHEN, YueGiven a sequence of K integers { N1, N2, ..., NK }. A continuous
2014-06-23 01:21:33
1825
2008EPL Effect of initial configuration on network-based Recommendation
2014-08-20
基于naive bayes英文分类器(利用HashMAP进行预处理)(java)
2014-07-31
libsvm开源软件包
2014-07-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人