
python
huobumingbai1234
路漫漫其修远兮,吾将上下而求索
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
阿里云数据读取做桑基图
主要自己做个记录吧,流程:pyodps读取数据源-->pandas-->pyecharts;每天调度会计算好数据落到odps,这边再加个自动发送就好了。桑基图个人觉得某些场景还是蛮适合的,图像的表征能力还是很强的。画图部分主要参考了这个https://blog.youkuaiyun.com/akenseren/article/details/103416477,中间细节部分还是看了下官方文档。# -*- coding: utf-8 -*-import pandas as pdfrom py原创 2020-08-03 22:23:04 · 720 阅读 · 0 评论 -
基于pyodps读本地文件上传到odps
本地文件有传输到odps的需要,虽然阿里云dataworks有这样的操作界面,但是文件内容有个逗号啥的就会有问题,所以专门写个脚本处理这一步。处理逻辑: pandas_read_csv ---->pyodps的dataframe------>odps代码如下,简单方便:# -*- coding: utf-8 -*-import pandas as pdfrom odps import ODPSfrom odps.df import Dat...原创 2020-08-03 20:56:44 · 2855 阅读 · 0 评论 -
Python登录微信分析好友数据
使用环境本人使用的是jupyter,没有在pycharm中尝试过,有时候可能会出现登录二维码弹不出来的情况,还有就是出来的二维码尺寸过大,无法识别原创 2018-06-03 20:30:42 · 759 阅读 · 0 评论 -
时间序列型的数据做预测
最近在公司有做一个 快递中转中心<--->另一个快递操作中心 操作量预测的项目,有一些方法和感想总结一下一、问题背景1、主要目的是为了预测T+7日内快递某操作中心到其他操作中心的发件量,即中心的操作量2、T+1日的预测精度高对实际工作帮助较大二、主要思路1、做仿真系统,把实际影响的因素都考虑进去,读快递网点实时的收件数据,然后和快递中心的人、车等影响因素相匹配,...原创 2018-06-03 22:19:36 · 3943 阅读 · 0 评论 -
线性回归算法的简单实现
最近在看慕课网BOBO老师的机器学习入门课程,之前有看过很多的相关课程,讲数据原理推导及sklearn使用较多,顺便推荐一波,看过的课程中,个人觉得邹博老师讲的就蛮好(也看过吴恩达的斯坦福的课程,数学推导看的时候多看几遍也看的懂,过一会儿就忘了,哎),文章的话可以参照https://www.cnblogs.com/pinard/category/894692.html这位的博客,觉得写得清楚明了,...原创 2018-07-16 21:25:03 · 853 阅读 · 0 评论 -
降维算法--PCA理论、公式推导
一、降维算法的主要的目的 1、降维可以减少数据共线性,减少冗余特征,提高算法运行效率 2、可视化需要二、主要的降维算法三、降维算法的主要思想 在高维数据中,有一部分特征是不带有有效信息的,还有一部分特征之间存在共线性(特征间有线性关系),我们需要过滤掉这一部分特征。 PCA算法中,我们用方差表示特征是不是包含更多的信息...原创 2018-12-08 17:55:23 · 2245 阅读 · 0 评论 -
计算文本相似度并将文件写到文本文件
工作中有一个小需求找相近的颜色,就用文本相似度做了,包是直接找的一个包,大概是交集/并集的计算形式,然后将计算结果写到txt文件中import difflibA = B = ['纯白', '纯黑色', '白红色Hi', '棕色/白色Hi', '白色/蓝色Hi', '白色/棕色Hi', ...原创 2018-12-30 00:30:28 · 348 阅读 · 0 评论