
python数据分析常用小技巧
dbf666
这个作者很懒,什么都没留下…
展开
-
Python wordcloud自定义背景图片方法及mask无效的解决方案
准备导入必要的库from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator生成mask/mask transform总的来说:就是通过导入自己相要的图片作为mask遮罩mask遮罩其实是一个代表形状的二维数组,所以我们要通过np.array()将图片转化为二维数组。有些朋友会发现即使np.array()后mask依旧未生效,因为mask的格式不同结果往往不太一样,这时候需要transform一下(如果我们看下生成的矩阵,矩阵的原创 2021-11-18 04:14:19 · 8692 阅读 · 1 评论 -
pandas apply自觉无误却一直报类型相关错误的可能原因 XX is not subscriptable/iterable
先说结论pandas内空值nan的类型是float,apply因为类型出bug大概率就是有脏数据或者空值没处理好!!!Background我在做的一个影片数据的分析,genre列是一组以list为元素,list里的内容是该影片的电影题材标签。我准备apply一下拿到column里每个列表的题材类型,但是一直报错,明明是list呀,为什么提醒我float对象的bug呢?我以为是因为dataframe中该列的dtype是object所以才出现此类型错误,然而!pandas是无法将column的dt原创 2021-10-25 04:23:56 · 3325 阅读 · 0 评论 -
解决方案:pandas列存在空值的情况下,用ast.literal_eval转换
错误描述由于pandas column中存在NaN,在用ast.literal_eval进行,出现ValueError: malformed node or string错误原因ast模块是帮助Python应用来处理抽象的语法解析的,如果输入不是合法的Python数据类型,则ast.literal_eval将引发异常。根据文档,ast.literal_eval()仅在字符串结构中存在字符串、数字、元组、列表、字典或布尔值及None的情况下才有效,而pandas的NAN实质是float类型。解决方原创 2021-10-20 19:09:29 · 1889 阅读 · 0 评论 -
正则表达式 匹配美元等多种货币符号的超简单方法
\p{Sc} #带小数点也不怕SymbolMeaning\pa character with the xx propertyScCurrency symbol原创 2021-11-26 04:02:22 · 5757 阅读 · 0 评论 -
UnicodeDecodeError: ‘ascii‘ codec can‘t encode character ‘\xe9‘
今天准备通过塞尔达的人物名扒网页时遇到了这样的问题,看样子和python的编码有关。交代下背景,首先我写了一个方法去拿对应人物名字的query语句,再利用urllib去访问query地址的内容。本来下载的挺顺利,突然报了上述错误。后来发现是因为有个人物名Granté的‘é’是特殊字符,python编码不出来。解决方案:通过urllib.parse.quote_plus(name)修改对应query语句中出现特殊字符的部分(不要编码整个query),然后就run成功了。...原创 2021-09-24 22:31:40 · 320 阅读 · 2 评论 -
Python转换字典为dataframe
假设有以下字典,目的转化为下方的dataframe。方法1:从字典中获取键值对(items)方法2:利用Series构造器参考:https://stackoverflow.com/questions/18837262/convert-python-dict-into-a-dataframe原创 2022-06-20 19:19:33 · 861 阅读 · 1 评论