
2020mcm
TriAzure
靡不有初,鲜克有终。
展开
-
pandas对重复日期取均值合并再放回dataframe里
参考:pandas找出重复行后取均值并合并import pandas as pdimport numpy as npimport matplotlib as mpl%matplotlib inlinefrom ggplot import *theme_bw()ggplot麻烦的很,内部用的是老pandas的东西,比如sort之类的,还有一个date啥啥也有问题。如果要解决只能手动...原创 2020-03-11 20:04:16 · 3869 阅读 · 0 评论 -
pandas求协方差、相关系数、显著性检验
通过列索引值筛选内容的写法。pcfr = pd.read_excel('hair.xlsx')df = pcfr# '=='后面替换品牌名字即可m = df[df['product_title']=='remington ac2015 t|studio salon collection pearl ceramic hair dryer, deep purple']情感分析函数。def...原创 2020-03-11 19:38:59 · 2597 阅读 · 0 评论 -
pandas根据日期求某一列的年平均值
对于这种,读进来日期不是日期格式,并且有时候一天有很多条数据,一天没有数据的情况,根据年份合并求star_rating这一栏的平均值。读入数据并删除无关列pcfr = pd.read_excel('microwave.xlsx')df = pcfr[['review_date','star_rating']]df.head(3)会警告,无视之。df['review_date'] =...原创 2020-03-11 18:58:16 · 10750 阅读 · 2 评论 -
读入数据+使用snownlp进行情感分析
读入数据tsv与csv读入相同,只是加一个sep=’\t’,指定分隔符就好。(csv以’,'分割)pcfr = pd.read_csv('pacifier.tsv', sep='\t', dtype={'review_body':str, 'review_headline':str})dataframe按列名提取,注意是两层[]df = pcfra = df[['review_head...原创 2020-03-11 18:15:53 · 8595 阅读 · 0 评论