
数据挖掘与大数据分析
欢迎大家一起学习,一起进步!
图解AI
致力于:机器学习、深度学习、数据分析、算法、架构、C/C++、Rust、HTML5/webApp、Go、Python、Lua...
展开
-
[人工智能]机器学习实践中数据和模型的选择
前言人工智能这一领域还是非常值得去做的,前言技术,今后将越来越多的智能化领域将运用这一技术,互联网领域将进行重新一次洗牌.搞算法的朋友们,大家都知道,最近特别火的机器学习和深度学习,尤其是深度学习,现在是相当的火爆,不管是正在学的还是即将入坑的朋友,搞算法离不开两样基本东西: 1.数据 2.模型不管是机器学习,还是深度学习那么我们在实践中所遇到的困惑有哪些呢?困惑1:数据从哪里来?困惑2:数据该原创 2017-05-13 14:42:26 · 8226 阅读 · 5 评论 -
[Spark机器学习]基于Spark 2.0 机器学习之推荐系统实现
1 什么是ALS ALS是交替最小二乘(alternating least squares)的简称。在机器学习中,ALS特指使用交替最小二乘求解的一个协同推荐算法。它通过观察到的所有用户给商品的打分,来推断每个用户的喜好并向用户推荐适合的商品。举个例子,我们看下面一个8*8的用户打分矩阵。 这个矩阵的每一行代表一个用户(u1,u2,…,u8)、每一列代表一个商品(v1,v2,…,v8)、用户的翻译 2017-01-18 16:15:05 · 17080 阅读 · 11 评论 -
[大数据]大数据框架Hadoop和Spark的异同
转载地址: http://mp.weixin.qq.com/s?__biz=MjM5ODE1NDYyMA==&mid=2653381212&idx=2&sn=be85119297e51e8764e1e8ac8b189680&scene=21#wechat_redirect 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并转载 2017-01-19 10:05:29 · 4913 阅读 · 2 评论 -
[机器学习]Python中Numpy,Pandas,Matplotlib,Scipy,Seaborn介绍
Python做数据挖掘很强大,最近几年很火的机器学习以及较为前沿的自然语言处理也会选用Python作为基础工具. 其中python做数据挖掘足够强大,不用怀疑。1. Numpy介绍Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。用它来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要原创 2017-04-20 15:15:12 · 11530 阅读 · 5 评论 -
[Python工具]anaconda 使用
下载anaconda 安装包,下面是使用的命名1.更新所有包:conda upgrade2.安装包例如;conda install pandas numpy3.卸载包conda remove 包名4.更新包coda update 包名5.列出已安装包conda list6.不同的项目创建不同的运行环境...原创 2018-04-15 18:30:58 · 4076 阅读 · 0 评论 -
[算法Rust,Go,Python,JS实现)]LeetCode之13-罗马数字转整数
题目罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做 II ,即为两个并列的 ...原创 2019-03-05 20:30:08 · 4895 阅读 · 3 评论 -
超详细的Python自学项目收集!
超详细的Python自学项目收集!原创 2016-11-13 18:15:29 · 8773 阅读 · 1 评论 -
[人工智能][转]机器学习之迭代法
浅说机器学习中“迭代法” 迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,跟迭代法相对应的是直接法(或者称为一次解法),即一次性解决问题。 迭代算法是用计算机解决问题的一种基本方法。它利用计算机运算速度快、适合做重复性操作的特点,让计算机对一组指令(或一定步骤)进行重复执行,在每次执行这组指令(或这些步骤)时,都从变量的原值推出它的一个新值。利用迭代算法解决问题,需要做好以下三个方面原创 2016-11-24 08:45:40 · 7776 阅读 · 1 评论 -
[人工智能]深入浅出机器学习
从机器学习谈起 参考:http://www.cnblogs.com/subconscious/p/4107357.html 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始转载 2017-01-05 10:49:43 · 8906 阅读 · 15 评论 -
[机器学习(转)]转AI方向应该注意什么
普通程序员如何转向AI方向 <div class="postBody"> <div id="cnblogs_post_body"><p class="p"> 眼下,人工智能已经成为越来越火的一个方向。普通程序员,如何转向人工智能方向,是知乎上的一个<a href="https://www.zhihu.com/question/510394原创 2017-01-05 11:07:27 · 7600 阅读 · 3 评论 -
[机器学习]KNN算法的理解与具体实现
K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法。其中的K表示最接近自己的K个数据样本。KNN算法和K-Means算法不同的是,K-Means算法用来聚类,用来判断哪些东西是一个比较相近的类型,而KNN算法是用来做归类的,也就是说,有一个样本空间里的样本分成很几个类型,然后,给定一个待分类的数据,通过计算接原创 2017-01-17 00:55:04 · 6086 阅读 · 6 评论 -
[机器学习]二分k-means算法详解
二分k-means算法 二分k-means算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。 分层聚类的策略一般有两种:聚合。这是一种自底向上的方法,每一个观察者初始化本身为一类,然后两两结合分裂。这是一种自顶向下的方法,所有观察者初始化为一类,然后递归地分裂它们 二分k-means算法是分裂法的一种。1 二分k-means的步骤翻译 2017-02-05 21:00:05 · 15893 阅读 · 10 评论 -
[机器学习]漫谈随机森林算法
目录1 什么是随机森林1.1 集成学习1.2 随机决策树1.3 随机森林1.4 投票2 为什么要用它3 使用方法3.1 变量选择3.2 分类3.3 回归4 一个简单的Python示例结语 前言: 随机森林是一个非常灵活的机器学习方法,从市场营销到医疗保险有着众多的应用。它可以用于市场营销对客户获取和存留建模或预测病人的疾病风险和易感性。 随机森林能够用于分类和回归问题,可以处理大量特征转载 2017-02-16 11:47:31 · 6140 阅读 · 2 评论 -
[机器学习]详解分类算法--决策树算法
前言 算法的有趣之处在于解决问题,否则仅仅立足于理论,便毫无乐趣可言; 不过算法的另一特点就是容易吓唬人,又是公式又是图标啥的,如果一个人数学理论知识过硬,静下心来看,都是可以容易理解的,纸老虎一个,不过这里的算法主要指的应用型算法;但是那些证明和研究算法理论堪称大牛. 现在给大家介绍一下分类算法中最常用的一种算法–决策树算法决策树原理 决策树(decision tree)是一原创 2017-02-18 20:30:54 · 6448 阅读 · 2 评论 -
[详解机器学习]机器学习之认知篇
前言接下来时间给大家系统讲讲,机器学习-深度学习–大数据分析相关知识,为了自己系统学习,同时也分享给大家一起学习! 主要内容 1.机器学习的种类 2.机器学习的任务分类 3.机器学习的方法 4.机器学习模型汇总1.机器学习的种类这里给大家介绍一下机器学习的种类,主要是根据处理的数据种类不同,可以把机器学习分为:1.1 监督学习1)官方解释监督学习就是分类,通过已原创 2017-02-28 13:13:59 · 6383 阅读 · 6 评论 -
[机器学习]机器学习之Python之NumPy数学库的介绍
NumPy-快速处理数据¶标准安装的Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。这样为了保存一个简单的[1,2,3],需要有3个指针和三个整数对象。对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。此外Python还提供了一个array模块,array对象和列表不同,它直接保存数值,和C语言的一维数组转载 2017-03-02 17:40:03 · 6138 阅读 · 0 评论 -
[机器学习篇]基于Python机器学习常用库
Python常用的机器学习库Python在科学计算中用途广泛:计算机视觉、人工智能、数学、天文等。它同样适用于机器学习也是意料之中的事。 这篇文章就列举并描述Python的最有用的机器学习工具和库。这个列表中,我们不要求这些库是用Python写的,只要有Python接口就够了。 我们的目的不是列出Python中所有机器学习库(搜索“机器学习”时Python包索引(PyPI)返回了139个结果),原创 2017-03-07 16:53:37 · 9142 阅读 · 6 评论