
python
文章平均质量分 56
dushenzhi
个人主页:http://dushenzhi.top
展开
-
用Python编写MapReduce的WordCount实例程序
条件,假设hadoop环境和python环境已经安装好,且hadoop已正常启动Hadoop Streaming为python的语言提供了编写MapReduce程序的map和reduce的方法,下面介绍如何用Python编写一个WordCount实例程序。map过程的python源文件wc_map.py:#!/usr/bin/env pythonimport sysfor line原创 2013-07-15 18:05:01 · 3817 阅读 · 2 评论 -
Python下的机器学习工具scikit-learn(学习笔记2--官方实例程序)
本文参考官方网站:http://scikit-learn.org/stable/tutorial/basic/tutorial.htmlscikit-learn工具包自带一些标准数据集(包括iris和digits两个数据集),可以进行测试。(1)首先导入模块数据集:from sklearn import datasetsiris = datasets.load_iris()digi原创 2013-07-02 11:46:00 · 8592 阅读 · 1 评论 -
地理信息可视化——Python之matplotlib Basemap简介
在数据可视化过程中,我们常常需要将数据根据其采集的地理位置在地图上显示出来。比如说我们会想要在地图上画出城市,飞机的航线,乃至于军事基地等等。通常来说,一个地理信息系统都会带有这样的功能。今天我们讨论如何在Python上实现,并且使用免费的工具包。 matplotlib是python上常用的一个数据绘制包。它基于numpy(numpy是python用于数组运算的一个包)。matplotli转载 2013-06-28 12:39:55 · 16966 阅读 · 2 评论 -
Python下的机器学习工具scikit-learn(学习笔记3--数据预处理)
(1)数据标准化(Standardization or Mean Removal and Variance Scaling)进行标准化缩放的数据均值为0,具有单位方差。scale函数提供一种便捷的标准化转换操作,如下:>>> from sklearn import preprocessing #导入数据预处理包>>> X=[[1.,-1.,2.], [2.,0.,0.]原创 2013-07-04 11:54:06 · 10003 阅读 · 1 评论 -
Python下的机器学习工具scikit-learn(学习笔记4)
啊啥发达股份原创 2013-07-03 16:38:28 · 2768 阅读 · 0 评论 -
Python下的机器学习工具scikit-learn(学习笔记1--安装)
软件工具包获取方式: scikit-learn的官方网站:http://scikit-learn.org (肯能需要科学上网) github网址:https://github.com/scikit-learn/scikit-learnscikit-learn需要依赖:Python (>= 2.6), NumPy (>= 1.3), SciPy (>= 0.7),原创 2013-07-02 10:56:16 · 14550 阅读 · 1 评论