
数据分析
文章平均质量分 83
你欲何为R
千好万好,不如你好。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 数据分析 | 机器学习 必备
数学运算:mo,isodd,iseven,count,counta,countblank,sum,sumif,sumifs,average,averagea,averageif,averageifs,stdev,round,sqrt,trunc,int,randbetween,rand,product,sumproduct,sumsq,sumx2py2,sumx2my2,sumxmy2,max,min,row,column,offset,subtotal;游标对象(创建对象、对象的方法、对象的属性);原创 2023-09-26 09:41:46 · 203 阅读 · 0 评论 -
一起啃西瓜书
机器学习西瓜书笔记原创 2023-09-25 10:00:00 · 166 阅读 · 0 评论 -
Python 基础合集 2023-08-01
python语法基础原创 2023-08-01 19:16:03 · 232 阅读 · 0 评论 -
通过手机号解析出手机号归属地的省、市、运营商、邮编、区号
首先需要pip安装 phone 第三方模块通过 phone.Phone.find() 函数解析from phone import Phonedef get_mobile_location(phoneNum): """ """ info = Phone().find(phoneNum) try: province = info['province'] city = info['city'] zip_code原创 2020-08-21 16:38:39 · 1336 阅读 · 0 评论 -
【python 可视化】2 seaborn笔记
Seaborn 基于matplotlib且数据结构与pandas统一的统计制图库功能:计算多变量间关系的面向数据集接口 可视化类别变量的观测与统计 可视化单变量或多变量分布并与其子数据集比较 控制线性回归的不同因变量并进行参数估计与作图 对复杂数据进行易行的整体结构可视化 对多表统计图的制作高度抽象并简化可视化过程 提供多个内建主题渲染matpotlib的图像样式 提供调色板...原创 2019-12-09 20:27:29 · 1775 阅读 · 1 评论 -
【python 时间】datetime、time、date
import timeimport datetimefrom dateutil.relativedelta import relativedeltaimport pytzimport pandas as pd国际时间、本地时间"""国际时间 和 本地时间utc time: 国际时间(伦敦 格林威治时间)lacaltime: 本地时间(北京时间)"""# 国际时间ti...原创 2019-12-02 17:49:28 · 523 阅读 · 0 评论 -
【python pandas】重塑、透视、交叉:stack,unstack,pivot,pivot_table,crosstab
使用多层索引进行重塑stack、unstackdf = pd.DataFrame(np.arange(6).reshape((2,3)), index=pd.Index(['ohio','colorado'], name='state'), columns=pd.Index(['one','two','three'...原创 2019-11-25 19:20:13 · 870 阅读 · 0 评论 -
python 判断路径是文件还是文件夹、判断是否存在、获取文件大小
判断是文件夹还是文件import osif os.path.isdir(path): print "it's a directory"elif os.path.isfile(path): print "it's a normal file"else: print "it's a special file(socket,FIFO,device file)"判...原创 2019-04-01 16:11:26 · 1609 阅读 · 0 评论 -
读取json,做日志解析
# -*- coding: utf-8 -*-"""Created on Fri Feb 15 14:38:09 2019@author: yangshijin"""import pandas as pdimport numpy as npimport mathimport osimport json# 警告处理import warningswarnings.filte...原创 2019-12-02 19:21:53 · 344 阅读 · 0 评论 -
pandas set_index和reset_index
1.set_indexDataFrame可以通过set_index方法,可以设置单索引和复合索引。 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) append添加新索引,drop为False,inplace为True时,索引将会还原为列df_a = p...原创 2019-01-10 11:26:48 · 628 阅读 · 0 评论 -
pandas.DataFrame.columns.format()和pandas.DataFrame.columns的区别
import pandas as pddf_a = pd.DataFrame(data=[['A', 'B', 'C'], ['A1', 'B1', 'C1']])df_a.columnsdf_a.columns.format()原创 2019-01-10 11:01:35 · 3141 阅读 · 0 评论 -
python numpy生成等差数列、等比数列
import numpy as np# 等差数列print(np.linspace(0.1, 1, 10, endpoint=True))print(np.arange(0.1, 1.1, 0.1))"""总结: arange 侧重点在于增量,不管产生多少个数 linspace 侧重于num, 即要产生多少个元素,不在乎增量"""# 等比数列np.logspace...原创 2019-01-08 18:14:49 · 14801 阅读 · 0 评论 -
pandas合并数据
1.mergepd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False)...原创 2019-01-09 19:30:07 · 222 阅读 · 0 评论 -
pandas操作数据库
使用sqlite3# 从数据库中读取数据。import sqlite3# sqlite3连接参数指定的数据库。如果数据库不存在,则会创建该数据库,然后再进行连接。# 存在则直接进行连接。该方法返回数据库的连接。con = sqlite3.connect("ttd.db")# 通过数据库连接对象的execute方法执行sql语句。con.execute("create table ...原创 2019-01-09 19:18:52 · 3217 阅读 · 1 评论 -
python数据处理之OneHot
1.OneHot变换import pandas as pd df1=pd.DataFrame({'key':['a','b','c'],'data1':[1,2,3]}) print(df1)df2=pd.get_dummies(df1['key'])print(df2)df3=pd.get_dummies(df1)print(df3) 2.OneHot编码手动实...原创 2019-01-09 18:47:11 · 8467 阅读 · 0 评论 -
python dataframe分箱操作一:cut分箱
1.等宽分箱# ===========================方法一===============================def binnings(data_res, b_for_filename): a = 'bins_by' # 分箱依据 b = 'used_to_count' # 分箱之后用来统计数量的字段 test_result_out = ...原创 2019-12-02 19:22:03 · 1409 阅读 · 0 评论 -
pandas dataframe 提取行和列
import pandas as pddata = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})提取列单列data['a']多列data[['a', 'b']]使用 .loc或者 .iloc 提取第一个参数是行,第二个参数为列.loc为按标签提取, .iloc为按位置索引提取data...原创 2019-01-11 11:27:09 · 156367 阅读 · 6 评论 -
pandas修改列名
pandas读取数据之后经常需要修改列名,那么该怎么修改呢??import pandas as pda = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})1.简单粗暴a.columns = ['第一列', '第二列', '第三列']a 2.温柔一点的上面的方法修改列名必须是修改所有列名,在列比较少的情况下...原创 2019-01-11 10:25:53 · 9162 阅读 · 2 评论