
小技术
文章平均质量分 93
pit_man
Dig value from big data in the Internet.
展开
-
python实现分词和词云制作
python实现分词和词云一、下载wordcloud安装二、wordcloud的使用2.1 分词2.2 制作词云2.3 运行输出三、踩坑记录制作词云的目的是找出物联网专业职位所需技能的关键词,首先爬去了boss直聘和智联招聘上的物联网专业职位的技术要求,爬取方法参考链接。一、下载wordcloud安装下载链接,根据系统类型和python版本选择下载合适的wordcloud版本安装命令:pip install wordcloud-1.8.1-cp36-cp36m-win_amd64.whl二、wo原创 2021-08-13 00:40:16 · 3851 阅读 · 0 评论 -
pandas的dataframe更新index
在使用pandas进行数据操作时遇到了如下问题: 首先对数据进行了抽取: equ_data = equ_data[equ_data["link_id"] == link_id] 抽取完之后equ_data的index变成了乱序的,如下: log_time ratio16626 2018/2/25 18:44:06 0.0016650 ...原创 2018-07-26 14:26:07 · 8895 阅读 · 1 评论 -
时间序列预测总结
一、数据预处理1.1 异常值清理由于设备故障或计算错误,时序数据中会有一些异常值,这些异常值会对时间序列的预测造成不好的影响,所以先进行平滑处理,去除异常值。平滑处理的方式可以采用取前后均值的方法,代码如下:def diff_smooth(ts): dif = ts.diff().dropna() # 差分序列 td = dif.describe() # 描...原创 2018-07-26 16:12:34 · 3918 阅读 · 0 评论