python
sisiel
厚积薄发
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python装包报错:无法定位程序输入点OPENSSL_sk_new_reserve于动态链接库
刚开始在cmd 用conda install selenium 安不上搜索看到别的博主是替换Anaconda3\DLLs和Anaconda3\Library\bin其中一个libssl-1_1-x64 dlls文件到另一个文件夹在我的机子上没起作用最终解决:换成conda prompt命令窗口执行conda install selenium就安上了...原创 2020-03-20 16:50:57 · 1492 阅读 · 0 评论 -
pandas 中dataframe,groupby后得到的Series转换成dataframe
方法是先将整个结果使用dict形式创建dataframe,再用reset_index转换列名psdt1=df3.groupby(['id_number', 'prod_name'])['active_days'].sum()psdt2=pd.DataFrame({"active_sum":psdt1}).reset_index()psdt2...原创 2020-01-15 16:17:23 · 4679 阅读 · 0 评论 -
faiss:AssertionError: assert x.flags.contiguous
Faiss是Facebook AI团队开源的针对聚类和相似性搜索库用自己数据跑faiss示例代码报错:%time index = faiss.IndexFlatL2(d) # build the indexprint(index.is_trained)index.add(xb1) 搜了一下是因为faiss要求输入数据必须是连续数据,所以先要对数据进行连续化处理:np.asco...原创 2020-01-08 17:24:33 · 1624 阅读 · 1 评论 -
基于不完整数据集进行用户行为周期发掘(python)
本文主要算法阅读《ePeriodicity: Mining Event Periodicity from Incomplete Observations》这篇论文,进行了python的代码实现,并做出了相应改进,该算法的主要功能是,可以无监督地得到用户针对某事件(可以是使用某个APP,也可以是去某个实体地点)的行为周期和置信度;该算法的特点是,即使数据缺失较多,也能得到较好的结果。使用的场景可以是...原创 2019-11-22 15:23:48 · 1071 阅读 · 1 评论 -
ValueError:not enough values to unpack/ too many values to unpack
当pandas中对每一列进行apply操作,如果输出变量设置有问题,会报错ValueError:not enough values to unpack/ too many values to unpackdef mono_bin_replace_woe(Y,X,n=20): # 最优分箱 r = 0 good = Y.sum() bad = Y.count() - ...原创 2019-10-28 13:58:15 · 1416 阅读 · 0 评论 -
Python 中dict 字典方法小结
Python 中字典用法小结原创 2017-09-19 10:56:22 · 1177 阅读 · 0 评论 -
pandas MultiIndex重新整理列
pandas中对dataframe进行groupby+统计操作后会生成MultiIndex如对df4的'prod_label_name2'进行聚合后,对'm_up_flow'列进行describe操作df55=df4.groupby(['prod_label_name2'])[['m_up_flow']].describe().fillna(0).reset_index()print(...原创 2019-10-09 16:56:29 · 946 阅读 · 0 评论 -
Joining multiple DataFrames only supported for joining on index
pandas中多个dataframe想进行按列操作时,需要用join函数,根据函数参数列表DataFrame.join(self,other,on=None,how='left',lsuffix='',rsuffix='',sort=False)当指定了on等于某一列后,报错:Joining multiple DataFrames only supported for jo...原创 2019-10-10 14:51:11 · 1271 阅读 · 1 评论 -
A value is trying to be set on a copy of a slice from a DataFrame
最初想把df1中第i列不等于-1的值都赋值为1,代码如下:df1[df1['体育资讯_m_visit_cnt_std_1m']!=-1].loc[:,'体育资讯_m_visit_cnt_std_1m']=1发现并没有得到转换,并且得到了A value is trying to be set on a copy of a slice from a DataFrame的warning...原创 2019-10-10 15:04:04 · 262 阅读 · 0 评论
分享