
python
数据分析,实用技能
WandaWang0822
喜欢瞎倒腾、不靠谱的数据小白
展开
-
时间序列-预测口罩人数(ARIMA)
使用时间序列模型预测口罩变化趋势。原创 2022-09-07 09:53:58 · 449 阅读 · 1 评论 -
时间序列-平稳性
1)平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时间内仍能顺着现有的形态“惯性”地延续下去。1)严平稳:严平稳表示的分布不随时间的改变而改变。如:白噪声(正态),无论怎么取都是期望为0,方差为1.未来某时刻的t值Xt就要依赖于它的过去信息,所以需要依赖性。2)弱平稳:期望与相关系数(依赖性)不变。1)时间序列在t与t-1时刻的差值。2)代码块(pandas)2)平稳性要求序列的。原创 2022-09-07 09:51:19 · 1294 阅读 · 0 评论 -
MAC安装tensorflow
因为电脑安装的anaconda是python3.9版本,下意识的安装tensor flow的定义python版本就下了3.9(这里有一个坑)报错如下,大概是说不支持python版本3.9,支持的版本包括2.7,3.7,3.6,3.5。相比较网上的其他教程,这个安装方法亲测有效,且比较简单,只需要4步。第四步,将python版本降级,我是从3.9改成了3.6。第三步安装tensor flow (问题来了)第一次在mac上安装tensorflow。第二步激活tensor flow环境。第五步,再来一次安装。原创 2022-09-07 09:50:25 · 3835 阅读 · 1 评论 -
python 获取数据基本步骤
#加载模块import requestsimport re import jsonimport csvimport pandas as pd #身份伪装,其实没必要headers={ 'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.82 Safari/537.36' }#请求地址u.原创 2022-04-01 20:02:15 · 2146 阅读 · 0 评论 -
常见的python error及解决方法,我不是coder,只是mover
1.ImportError: cannot import name cross_validationsolution & answer:This happens because there is nocross_validationobject insklearn. You're likely looking for something more like thecross_validatefunction. You can access that throughfrom s...原创 2020-09-14 15:55:31 · 506 阅读 · 0 评论 -
KNN算法(python)K近邻法
KNN分类原理:局部学习方法:思想:K-NN算法的核心:在训练集中选取距离输入的数据点最邻近的K个邻居,根据这个K个邻居中出现次数最多的类别(最大表决规则),作为该数据点的类别。 计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等); 对上面所有的距离值进行排序; 选前k个最小距离的样本; 根据这k个样本的标签进行投票,得到最后的分类类别; KNN的修正:1.经典k邻域的样本点对预测结果的贡献度是相等的。2.而一个简单的思.原创 2020-08-30 21:45:51 · 326 阅读 · 0 评论 -
数据分析案例:多元线性回归预测房价(python实现)
数据:sklearn中的datasets的California——housing方法:使用多元线性回归进行房价预测知识点:matplotlib绘图,相关系数,数据标准化处理##载入所需要的模块from __future__ import print_functionimport numpy as npimport pandas as pd##matplotlibimport matplotlibimport matplotlib.pyplot as plt##加载数据fr原创 2020-08-31 10:15:09 · 8386 阅读 · 3 评论 -
python基于原始文件进行批量重命名
批量修改文件名原始文件中含有中文信息+英文信息,希望生成另一种标准格式但是要包含中文姓名。举个例子就是,下图是原始文件名:code如下:###rename filesimport osimport repattern=re.compile(u'[\u4e00-\u9fa5]+') #正则表达式匹配中文path='C:\\Users\\wan...原创 2019-09-05 17:30:58 · 333 阅读 · 0 评论 -
如何使用python批量生成以excel名单命名的HTML文件
看到我的题目就知道这是多么磨人的需求,无论是中文还是英文社区,使用必应还是谷歌都没有人准确回答,硬逼着我这个废柴东拼西凑了一些code,然后就成了。。。。。。。哈哈哈哈,话不多说,先贴上代码,有缘人会搜到的。import importlib,syeimportlib,reload(sys)import pandas as pdimport numpu as npdf= pd...原创 2019-09-03 23:57:27 · 594 阅读 · 0 评论 -
DC数据清理(pandas、seabron)
格式转换数据的原始储存形式未必适合Python的数据处理例如:时间,字符串转其他缺失数据每条数据都可能在某些属性值上缺失怎样应对缺失数据忽略有缺失数据的记录直接把值标记成未知利用平均值、最常出现的值等去填充(有很多复杂的方法。)异常数据出现不符合常识的数据(异常挖掘)处理方式类比缺失数据数据标准化US、USA、united states-----...原创 2018-11-12 14:26:16 · 640 阅读 · 0 评论 -
利用Python对iris数据集进行查询
利用Python对iris数据集进行查询查询id为3的行import pymysql.cursorsconnection=pymysql.connect(host='___',user='___',password='___',db='iris',charset='utf8mb4',cursorclass=pymysql.cursors.DictCursor)try: with c...转载 2018-11-02 14:24:48 · 2528 阅读 · 0 评论 -
专门存放Python里面基础函数
1求绝对值abs()2四舍五入round()round(1.235)1round(1.235,2)#保留小数点后两位1.243幂函数pow()pow(2,3)84余数%5math模块import mathmath.floor(32.6)#取整并不是四舍五入32math.sqrt(4)#开方2.0还有很多 6numpy模块中函数7函数...原创 2018-08-24 14:49:51 · 305 阅读 · 0 评论 -
绘制统计图形展示数据
数据分析的三大类型:探索型(图表可视化)、验证性(假设检验)、预测型(机器学习)探索型数据分析1数据清理相辅相成。--->2根据图形用验证或预测支持验证数据分析及预测型数据分析:该建立怎样地假设,该使用什么特征和模型进行预测。常用图表:条形图、直方图、饼图、折线图、散点图、箱线图程序语句:seaborn.barplot(x="day",y="total_bill",data=ti...原创 2018-08-09 19:25:14 · 1935 阅读 · 0 评论 -
笔记(二)网络爬取的高级技巧:使用代理和反爬虫机制
一设定程序停止一段时间import timetime.sleep(n)#n是秒,sleep for n secondsimport randomtime_interval = random .uniform(1,5) time.sleep(time_interval)#时间也可以设置成随机停止,如例子所示为在1到5秒之间随机停止 二通过代理爬虫#使用urllib.r...转载 2018-07-31 16:04:19 · 536 阅读 · 0 评论