
Python高级
pandas,matplotlib...
HJZ11
记录学习之路,欢迎交流
展开
-
python爬取弹幕读取csv文件制作弹幕热点词云图-万恶之源马老师-后裔弃兵
文章目录1.后裔弃兵2.万恶之源弹幕python3.8jupyter notebook1.后裔弃兵《后翼弃兵》豆瓣短评数据集import pandasimport csvimport jiebaimport numpyfrom PIL import Imagefrom wordcloud import WordClouddef getDataFromCsv(): # 设置星级等级,根据等级来定位提取弹幕 stars = ("1","2","3","4","5")原创 2020-12-09 11:47:17 · 2421 阅读 · 1 评论 -
groupby().agg()-python3 关于agg函数的用法(一般与groupby函数连用)
Market_sales = df.groupby(["Market"]).agg({"Sales":"sum"})Market_Year_Sales = df.groupby(["Market","year"]).agg({"Sales":"sum"}).reset_index().rename(columns={"Sales":"Sales_amounts"})#pandas引入了agg函数,它提供基于列的聚合操作。而groupby可以看做是基于行,或者说index的聚合操作...原创 2020-06-02 10:07:45 · 2715 阅读 · 0 评论 -
dataframe表格实现累加,某列按种类拆分成多列表格
1.df表格一列按内容拆分成多列采用onehot拆分df1 = pd.get_dummies(df_test['product_category'])df_test = pd.concat([df_test,df1],axis=1)for cg in range(1,19): df_test[cg] = df_test[cg]*df_test['click_times']df_test=df_test.drop(['product_category','click_times'], 1,原创 2020-05-31 00:17:11 · 2297 阅读 · 0 评论 -
verbose=True
df_log.info(verbose=True,null_counts=True)显示dataframe表格时,可以设置参数,verbose=True:表示设置运行的时候显示详细信息,可选Falsenull_counts=True:缺失值显示,常用原创 2020-05-30 21:29:20 · 4845 阅读 · 0 评论 -
numpy基本使用方法
numpy-中文教程https://www.yiibai.com/numpy/原创 2020-05-26 14:00:44 · 271 阅读 · 0 评论