
pandas'
happy_wealthy
这个作者很懒,什么都没留下…
展开
-
with_open打开csv文件成pandas格式
方法一:方法二:原创 2021-10-12 09:58:48 · 594 阅读 · 0 评论 -
pandas新增一行
1、pd.concat()df2=pd.DataFrame([[33,44,55]],columns=['a','b','c'])df1 a b c0 1 4 71 2 5 82 3 6 9df2=pd.DataFrame([[33,44,55]],columns=['a','b','c'])df2 a b c0 33 44 55pd.concat([df1,df2],ignore_index=True) a b c0 1 4 71 2 5 8原创 2021-06-29 14:20:02 · 607 阅读 · 0 评论 -
读取文本文件,将其边问pandas表格
# 一个空的dfdf = pd.DataFrame(columns=['A'])with open('/Users/zhgi/Desktop/sys_data/android_1k.log') as f: file_lines = f.readlines()for i in file_lines: # 注意这里每次都在复制 df = df.append({'A': i}, ignore_index=True)#方法二:用pandas读取import pandas as p原创 2021-06-22 16:52:22 · 100 阅读 · 0 评论 -
pandas总结
一、pandas读取数据1、使用pd.read_csv读取数据1.1 读取CSV,使用默认的标题行、逗号分隔符ratings = pd.read_csv(fpath)# 查看前几行数据ratings.head()# 查看数据的形状,返回(行数、列数)ratings.shape# 查看列名列表ratings.columns# 查看索引列ratings.index# 查看每列的数据类型ratings.dtypes1.2 读取txt文件,自己指定分隔符、列名fpath =原创 2021-06-21 16:17:21 · 107 阅读 · 0 评论 -
.fillna 在DataFrame里面直接进行填补
pandas缺失值处理data_.loc[:,"Age"] = data_.loc[:,"Age"].fillna(data_.loc[:,"Age"].median())#.fillna 在DataFrame里面直接进行填补原创 2021-06-14 23:28:18 · 243 阅读 · 0 评论 -
pandas直接读取mysql数据库里的数据
import pymysqlconn = pymysql.connect( host='', user='root', password='y', database='', charset='utf8' )mysql_page = pd.read_sql("select * from ``", con=conn)原创 2021-06-15 00:18:59 · 421 阅读 · 0 评论 -
pandas删除某列包含特殊字符的行
df=df[ ~ df['service_name_metric'].str.contains('cpu_0')] #删除某列包含特殊字符的行原创 2021-06-10 12:55:21 · 1373 阅读 · 0 评论 -
创建新的pandas
pd.Dataframe(rows,columns=[‘hi’])原创 2021-03-03 09:49:07 · 361 阅读 · 0 评论 -
pandas._libs.tslibs.timestamps.Timestamp数据类型转化为13位时间戳
原创 2020-12-14 15:40:38 · 9122 阅读 · 0 评论 -
pandas如何分组统计数据量是多少条
import pandas as pddf = pd.read_csv('/home/becky/服务器数据处理/meta_info.csv')df.groupby(['company']).count()原创 2020-12-14 12:02:06 · 1731 阅读 · 0 评论 -
‘1970-01-01 00:25:37.459216‘时间类型的格式
time.strptime('1970-01-01 00:25:37.459216','%Y-%m-%d %H:%M:%S.%f')原创 2020-12-12 10:48:57 · 133 阅读 · 0 评论 -
dataframe更改某一列
def hh(q): if q>10: q='大于10' return(q) else: q='小于10' return(q)da["a"]=da["a"].apply(hh)原创 2020-12-11 19:13:25 · 1267 阅读 · 1 评论 -
pandas某一列是否全部为空
df_column[column].isnull().any()原创 2020-12-09 17:55:08 · 3512 阅读 · 2 评论 -
pandas替换列名
df.rename(columns={‘timestamp’:‘time_list’}, inplace = True)原创 2020-12-04 15:17:04 · 1815 阅读 · 0 评论 -
选取pandas中的特定数据
import pandas as pdfrom pandas import Series, DataFrameimport numpy as npdata = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])data a b c d e原创 2020-09-07 11:40:06 · 2531 阅读 · 0 评论 -
pandas写入_读取csv文件
# 导入实验常用的python包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# pandas数据写入到csv文件中:names = ['Bob','Jessica','Mary','Mel']births = [968,155,77,973]DataSet = list(zip(names,births))df = pd.DataFrame(data = DataSet ,columns=['Nam原创 2020-09-07 10:13:30 · 313 阅读 · 0 评论