
数据科学
isuccess88
https://github.com/pchao6
展开
-
数据降维知识40题(附答案)
数据降维知识40题(附答案)2017-04-28 PPV课大数据摘要: 本文例举了一个针对数据科学家的数据降维测试,测试总共有40道题,涉及的内容主要有PCA、t-SNE以及LDA降维技术。想检验下自己对降维技术掌握的情况就赶快测测吧。作者介绍Ankit Gupta:数据科学家、IIIT Allahabad研究助理,热爱解决复杂的数据挖掘问题、了解更转载 2017-04-30 22:53:50 · 6956 阅读 · 0 评论 -
数据科学的完整学习路径—Python版(转载)
数据科学的完整学习路径—Python版(转载)Python 数据挖掘数据科学的完整学习路径—Python版(转载)步骤0:热身步骤1:设置你的机器环境步骤2:学习Python语言的基础知识步骤3:学习Python语言中的正则表达式步骤4:学习Python中的科学库—NumPy, SciPy, Matplotlib以及Pandas步骤5:有用的数据可视化步骤6:学习Sci转载 2017-04-16 11:11:02 · 600 阅读 · 0 评论 -
Python的数据可视化:对比7种工具包
Python的数据可视化:对比7种工具包Python 的scientific stack(一个介绍Python科学计算包的网站)已经完全成熟,并且有各种各样用例的库,包括机器学习(链接:machine learning),数据分析(链接:data analysis)。数据可视化是探索数据和清晰的解释结果很重要的一部分,但是Python在过去却相对于其他工具比如R落后一点。幸运的转载 2017-04-20 21:44:40 · 2058 阅读 · 0 评论 -
从数据挖掘经典算法PageRank入门
从数据挖掘经典算法PageRank入门GraphenePageRank是Google研发的主要应用于评估网站可靠度和重要性的一种算法,是进行网页排名的考量指标之一。本文将对PageRank的原理进行讲解,并以此为出发点介绍如何利用Transwarp Data Hub的Graphene在实际中满足相关分析需求。在开始PageRank原理介绍之前,请读者先阅读下面这则案例:转载 2017-04-21 21:43:27 · 6387 阅读 · 0 评论