
python
文章平均质量分 50
邵露露
让每一天都有收获
展开
-
python argparse模块小练习--Python脚本实现linux命令的功能
很简单,下面是我写的代码,实现了 ll -a ll -h 的功能: 这个脚本可以实现: Python test.py –a (+任意路径) Python test.py –h (+任意路径)import osimport argparseparser=argparse.ArgumentParser() #创建实例parser.add_argument("--a",nargs='?',de原创 2017-12-22 12:15:25 · 538 阅读 · 0 评论 -
《机器学习实战》学习笔记——K-近邻算法(KNN)(二)海伦约会网站匹配实战
《机器学习实战》中KNN算法实例一:关于这个实战的故事背景可以搜索“海伦 约会网站”基本上就可以了解。 这个实验的目的是根据已有的海伦整理出来的约会对象的资料和海伦对约会对象的评价,构造分类器,使对新的约会对象进行自动分类(不喜欢的人,魅力一般的人,极具魅力的人)。数据准备海伦准备的约会数据datingTestSet.txt,我已上传github 我们可以先看一下截图: 文件一共有四列,每原创 2017-12-18 01:03:13 · 1772 阅读 · 0 评论 -
《机器学习实战》学习笔记——K-近邻算法(KNN)(一)分类器的简单实现
KNN的工作原理是:存在一个样本数 据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据 与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的 特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们 只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。 最后,选择k原创 2017-12-16 16:17:00 · 800 阅读 · 0 评论 -
pandas 选取子集的操作
前段时间学习了pandas,也做了一些练习,今天做一下梳理。 pandas 中对于axis的理解在对dataframe操作的时候,很多时候涉及到了axis的设置,我找到一幅图很好的能理解axis: 数据准备读取otu.txt表并且选取5行5列import pandas as pddf = pd.read_csv("otu_taxon.txt",header=0,index_col=0,sep="\原创 2017-12-11 13:26:49 · 16816 阅读 · 0 评论 -
使用python计算方差——pandas.series.std()
这篇博客简单展示一下pandas里怎么计算方差: 官方文档: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.std.htmldef def_std(df): for ix,row in df.iterrows(): std = row.std() df.loc[ix,"std"] = s原创 2017-12-08 22:34:12 · 15852 阅读 · 0 评论 -
python里使用iterrows()对dataframe进行遍历
假设我们有一个很简单的OTU表: 现在对这个表格进行遍历,一般写法为:import pandas as pdotu = pd.read_csv("otu.txt",sep="\t")for index,row in otu.iterrows(): print index print row这里的iterrows()返回值为元组,(index,row) 上面的代码里,for循环定义了原创 2017-12-06 23:10:29 · 143529 阅读 · 0 评论