
python
t156xxxx4671
你的小宝贝上线了
展开
-
交互式数据可视化在Python中用Bokeh实现
文章转载自:http://www.zuimoban.com/jiaocheng/python/6615.htmlBokeh是一个专门针对Web浏览器的呈现功能的交互式可视化Python库。这是Bokeh与其它可视化库最核心的区别。正如下图所示,它说明了Bokeh如何将数据展示到一个Web浏览器上的流程。 正如你所看到的,Bokeh捆绑了多种语言(Python, R, lua和Julia)。这些转载 2017-09-04 20:34:55 · 6755 阅读 · 1 评论 -
Python中的分组函数(groupby、itertools)
转载自:https://www.cnblogs.com/dreamer-fish/p/5522687.htmlfrom operator import itemgetter #itemgetter用来去dict中的key,省去了使用lambda函数from itertools import groupby #itertool还包含有其他很多函数,比如将多个list联合起来。。d1={'name'转载 2017-11-23 14:09:36 · 2967 阅读 · 0 评论 -
使用K-S检验一个数列是否服从正态分布、两个数列是否服从相同的分布
转载自:https://www.cnblogs.com/chaosimple/p/4090456.html 假设检验的基本思想: 若对总体的某个假设是真实的,那么不利于或者不能支持这一假设的事件A在一次试验中是几乎不可能发生的。如果事件A真的发生了,则有理由怀疑这一假设的真实性,从而拒绝该假设。实质分析: 假设检验实质上是对原假设是否正确进行检验,因此检验过程中要使原假设得到维护,使之转载 2017-12-11 10:36:07 · 3706 阅读 · 2 评论 -
Python的字典的items(), keys(), values(),时间类型处理
转载自:https://www.cnblogs.com/qinxiaoqin/p/7204648.html Python的字典的items(), keys(), values()都返回一个list dict = { 1 : 2, ‘a’ : ‘b’, ‘hello’ : ‘world’ } dict.values() [‘b’, 2, ‘wo转载 2017-11-16 11:41:17 · 976 阅读 · 0 评论 -
《机器学习实战》第五章梯度上升算法的直观理解
转载自:http://www.jianshu.com/p/eb94c60015c7第五章讲的是Logistic 回归,作者提出了梯度上升算法,本文是对该算法的一个通俗易懂的解释,不需要任何梯度的知识就能理解简单描述问题给定一个样本集,每个样本点有两个维度值(X1,X2)和一个类别值,类别只有两类,我们以0和1代表。数据如下所示:样本 X1 X2 类别1 -1.4 4.7 1 2转载 2017-11-20 15:58:05 · 1804 阅读 · 1 评论 -
【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
转载自:https://www.cnblogs.com/chaosimple/p/4153167.html一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.prep转载 2017-11-12 03:37:27 · 437 阅读 · 0 评论 -
使用Python完成公司名称和地址的模糊匹配
本来之前一直是用R的,好歹有3,4个月的经验了。。。。没想到现公司没一个用R,想想python听起来似乎是比R要强大一些,于是又没有原则地去学python了。正如题目中说的一样,这次的程序是为了实现公司名及公司地址的模糊匹配,也可以迁移到房产信息、电话号码之类的字段上。本来的应用场景是反团伙欺诈以及失联客户的修复,大概的意思就是说多个相同公司的同事都在我公司借贷的欺诈可能性要高于其他客户,以及造假的原创 2017-07-06 21:34:58 · 51850 阅读 · 34 评论 -
python数据框基本操作
DataFrame行数:len(data) DataFrame列数:len(data.ix[1]) 数据类型:type(data)原创 2017-08-07 17:29:33 · 11406 阅读 · 0 评论 -
Python实现逻辑回归(Logistic Regression in Python)
转载自:http://www.powerxing.com/logistic-regression-in-python/本文基于yhat上Logistic Regression in Python,作了中文翻译,并相应补充了一些内容。本文并不研究逻辑回归具体算法实现,而是使用了一些算法库,旨在帮助需要用Python来做逻辑回归的训练和预测的读者快速上手。逻辑回归是一项可用于预测二分类结果(binary转载 2017-09-15 16:11:46 · 6895 阅读 · 2 评论 -
python使用h5py库存取GB级别数据
经过处理的中间数据大小为几十GB,如果存为npy格式,效率低下,存取都要占用大量内存,而且速度很慢,故将存储格式改为h5格式。1、数据保存a = h5py.File('E:/Alibaba/add_data.h5', 'w')a.create_dataset('data', data=add_data)f.close()2、读取数据b = h5py.File('E:/Alibaba/...原创 2018-12-20 14:00:51 · 1930 阅读 · 1 评论