
python
文章平均质量分 65
成鹏
关注数据分析
展开
-
Python学习笔记(1)
Python教程笔记 Python简介 优点:应用范围广、优雅、明确、简单 缺点:运行速度慢、代码不能加密 安装Python 对于完全没写过程序的人来说,安装Python也是一个技术活。我安装的是Windows 2.7版,有一段时间我发现我根本不会打开Python,直到后来我才明白可以从“开始”键 + R ——输入cmd——输入Python打开Python。 Python解释器原创 2015-04-26 16:18:20 · 643 阅读 · 0 评论 -
Pandas数据探索与实践
Pandas数据探索与实践介绍只要我们要用Python来做数据分析,就避免不了用到Pandas。Python有很多用于数据清洗和数据准备的库,但是很少有数据分析和数据建模的库。Pandas的出现,使得我们能在Python中解决大多数数据分析的问题,而不用切换到一些特殊语言如R中,这样就减少了我们许多的工作量。内容 Pandas下载与基本教程 Pandas数据探索的基本流程 用Pandas对Titan原创 2015-08-27 22:51:13 · 2608 阅读 · 0 评论 -
各种相似度计算的python实现
各种相似度计算的python实现(一)前言在数据挖掘中有很多地方要计算相似度,比如聚类分析和协同过滤。计算相似度的有许多方法,其中有欧几里德距离、曼哈顿距离、Jaccard系数和皮尔逊相关度等等。我们这里把一些常用的相似度计算方法,用python进行实现以下。如果是初学者,我认为把公式先写下来,然后再写代码去实现比较好。欧几里德距离几个数据集之间的相似度一般是基于每对对象间的距离计算。最常用的当然是原创 2015-07-04 10:54:22 · 21360 阅读 · 3 评论 -
机器学习scikit-learn(一)
机器学习scikit-learn在数据分析过程中,我们经常会碰到各种各样的问题。如何获取外部数据?如何处理脏数据?如何处理缺失值?若有许多特征,我们减少特征?建立各种模型中算法的细节?到最后,面对多种模型,我们该如何选择?这些问题,都将在此文中得到解答。此文分为五个部分: 建立模型的之前的工作 建立线性模型 聚类分析 分类 建立模型之后的工作 建立模型前的工作如何从外界获取数据?获取外界数据原创 2015-08-15 14:38:16 · 5397 阅读 · 0 评论 -
PYTHON数据可视化
介绍由于经常需要用Python进行数据数据分析,但经常碰到这样的情况:想做一个图,看看数据的趋势,但是以前记住的代码,在许久没有用后,一下载突然忘了如何去写。这篇cheatsheet是从Analytic Vidhya中找到的,打算自己好好熟悉一遍,然后作为以后的参考。内容 为什么数据可视化非常重要? 数据可视化python库的介绍 cheatsheet用于可视化的数据 导入数据 直方图 箱形图 风琴原创 2015-08-20 13:28:18 · 4376 阅读 · 0 评论