
数据挖掘
文章平均质量分 87
coding如逆水行舟
这个作者很懒,什么都没留下…
展开
-
游戏中的数据挖掘阅读文献小结
最近实习的公司是做游戏的大数据分析,前期的产品做得是游戏的舆情分析,网站是www.thinkinggame.cn ,有兴趣可与上去看一看。下一步的战略是挺进游戏内数据的分析,所以我在学习如何对游戏内的数据进行分析、建立模型。下面是我今天看的一些文章或帖子。原创 2016-05-25 20:19:08 · 4852 阅读 · 0 评论 -
Deep Learning:一、认识DL
从科学、技术和人工智能诞生之初,科学家们就在设想:机器如何能够像人类一样聪明。很多的作家通过文学作品描述这个场景,比如星球大战等等。而机器学习与深度学习是最有希望突破的两个方向。本文中我将主要介绍深度学习的简史、代表性人物、应用领域和相关的资料总结。原创 2016-08-11 21:44:53 · 2705 阅读 · 0 评论 -
DeepLearning:三、神经网络
从科学、技术和人工智能诞生之初,科学家们就在设想:机器如何能够像人类一样聪明。很多的作家通过文学作品描述这个场景,比如星球大战等等。而机器学习与深度学习是最有希望突破的两个方向。原创 2016-08-13 16:10:14 · 1411 阅读 · 0 评论 -
DeepLearning:四、BP神经网络
前面简单的认识了一下神经网络,这里我要与大家分享的是神经网络中的大明星:BP算法。下面的内容主要是来自斯坦福大学的教程,这篇教程是我看过的所有BP相关教程中最好的,其中补充了一些内容。原创 2016-08-25 08:53:30 · 2641 阅读 · 0 评论 -
DeepLearning:二、t-SNE(Stochastic Neighbor Embedding )降维方法
t-distributed stochastic neighbor embedding(t-SNE)是一种机器学习中的降维方法,是由Laurens van der Maaten 和Geoffrey Hinton提出的。这是一种将高维数据降维到两维后者三维的非线性降维方法,并且可以通过点可视化出来。原创 2016-08-11 10:27:18 · 5797 阅读 · 0 评论 -
学习spark:五、Spark SQL, DataFrames and Datasets Guide
Spark SQL是一个用作结构数据处理的一个模块。不像Spark RDD中的API,Spark SQL提供给Spark更多关于数据和计算的信息。从内部来说,Spark SQL提取信息的接口经过额外的优化。有很多方法使用Spark SQL,包括SQL, DataFrames的API和Datasets的API。Spark SQL的计算引擎与语言或者API是独立开的。这种统一意味着开发人员可以很容易在不同的APIs之间来原创 2016-06-06 17:54:13 · 984 阅读 · 0 评论 -
常用的数据挖掘&机器学习知识(点)
看到了一遍对常用数据挖掘&机器学习知识点的文章,转载过来,并将布局重新整理了一下转载 2016-08-11 11:56:57 · 1082 阅读 · 0 评论 -
MachineLearning:一、什么是机器学习
什么是机器学习......原创 2016-08-29 15:20:25 · 14041 阅读 · 0 评论 -
MachineLearning:四、逻辑回归in python
前面讲了logistic的理论部分,这里我参照《机器学习实战》写了logistic的实现部分。如果对logistic不清楚,请看逻辑回归。我建立了一个逻辑回归的类,类中包含三个主要函数:fit:拟合模型.predict:进行预测score:求错误率原创 2016-08-29 15:41:38 · 762 阅读 · 0 评论 -
MachineLearning:三、聊聊逻辑回归
在Machine Learning中,逻辑斯蒂回归(Logistic Regression)是十分经典的方法,简称LR,虽然名字叫回归,但是这是线性分类模型而不是回归模型。这里面涉及到一些知识点,包括极大似然估计,损失函数,梯度下降,正则化等这篇文章的主要目的,就是通过理论与实践相结合的方式分享LR模型。原创 2016-08-29 15:25:54 · 1288 阅读 · 0 评论 -
MachineLearning:二、感知器perception算法
感知机对DL有着重要的启发意义原创 2015-10-08 16:58:50 · 5060 阅读 · 0 评论 -
DeepLearning:五、BP神经网络in python
下面这段代码来自IMPLEMENTING A NEURAL NETWORK FROM SCRATCH IN PYTHON – AN INTRODUCTION中的代码,将上一章节中的BP神经网络实现出来。代码并没有考虑效率,但是代码很容易理解整个BP过程,这里我将我的理解记录下来并分享出来,加深印象。原创 2016-08-29 14:56:51 · 4026 阅读 · 0 评论 -
“第一届腾讯高校算法大赛”初赛失败总结
经过一个月的无用功,竟然都没有走进复赛,失望的心情难以平复。在知道这个消息的时候立即写一篇失败总结,让自己获取一些经验。这篇总结我将按照《精进》这本书里面提到的几个方面进行总结:信息,预期,结果,进度,工具,情绪,阻碍,优势,缺憾,意义。赛题腾讯社交广告高校算法大赛是面向高校大学生的算法大赛,作为腾讯核心的广告业务单元,腾讯社交广告通过对海量社交数据进行深入分析,构建多样广告场景,与8亿用户连接对话原创 2017-06-07 15:37:23 · 6298 阅读 · 1 评论