自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 chromeDriver下载地址

chromedriver

2022-11-04 14:15:36 911

原创 python代码实现数据可视化

对数据进行可视化展现,包含常用柱状图,折线图,散点图,堆积图等

2022-07-06 11:56:12 2835 1

原创 机器学习——建筑能源得分预测

机器学习实战项目——建筑能源得分预测

2022-06-01 23:39:39 1791 2

原创 机器学习——用户流失预警

文章目录前言一、 数据清洗与格式转换二、 探索性数据分析前言客户流失预警提示:以下是本篇文章正文内容,下面案例可供参考一、 数据清洗与格式转换import warningswarnings.filterwarnings('ignore') #忽视import pandas as pdimport numpy as np# 加载数据集churn_df = pd.read_csv('churn.csv')col_names = churn_df.columns.tolist() #所

2022-05-22 23:05:55 1132

原创 机器学习——SVM线性分类原理及代码应用

支持向量机线性分类原理及异常值检测应用方法

2022-05-21 22:46:41 5067

原创 机器学习——时间序列分析(三)

时间序列的趋势性,周期性以及随机性查看

2022-04-11 08:00:00 314

原创 机器学习——时间序列(二)

在使用时间序列模型进行预测时,首先需要判断数据是否有异常值,数据是否符合随机性,检查平稳性与周期性,本文对于这写方法给与了代码示例

2022-04-10 20:44:59 1719 1

原创 机器学习——K近邻算法

机器学习系列文章目录机器学习——XGBoost算法介绍及代码实现机器学习——时间序列分析机器学习——模型融合文章目录机器学习系列文章目录前言一、KNN算法原理二、K-Nearest Neighbors算法特点2.工作原理3.K值得选择4.代码实现前言K近邻算法的介绍以及代码实现过程一、KNN算法原理二、K-Nearest Neighbors算法特点优点:精度高对异常值不敏感无数据输入假定缺点计算复杂度高空间复杂度高适用数据范围数值型和标称型2.工作原理

2022-04-08 12:01:34 1285

转载 csdn如何转载别人的文章

csdn如何转载别人的文章

2022-04-08 11:25:12 212

原创 机器学习——时间序列分析

机器学习——时间序列分析使用两种方式进行预测统计学方法:ARIMA模型深度学习:MLP,LSTM,GRU本文将使用ARIMA模型进行时间序列问题的预测,后续会出深度学习的方法。时序分析流程代码及流程待补充...

2022-04-02 23:20:00 1625

原创 使用python进行自动化整理输出报表数据

报表数据整理对于日常工作中的一些周报日报数据,存在一些重复性的计算或者汇总需求,对于这种可以用python对excel进行自动化的一些操作,包括对列进行拆分,对日期进行筛选,对特定值进行汇总,以及对数据进行求和,列的更名import randomimport pandas as pd import numpy as npimport base64import osdata=pd.read_csv('单元.csv') res = data["计划名称"].str.split('_',expa

2022-04-02 23:01:32 1221

原创 数据建模——模型融合

数据建模——模型融合在建模预测过程中,使用单模型的得到的预测准确率及auc值可能不是很高,这时候我们可以使用模型融合的办法,将多个模型进行融合,从而提升模型效果,本篇使用的方法为投票法策略。除此之外,模型融合的办法还有平均法以及学习法/Stacking一、软投票与硬投票软投票:用各自分类器的概率值进行加权平均硬投票:使用预测分类概率高的,少数服从多数二、使用步骤1.软投票代码如下(示例):from sklearn.ensemble import RandomForestClassifi

2022-04-02 22:51:50 1379

原创 特征工程——异常特征样本清洗

特征工程——异常特征样本清洗

2022-03-30 11:15:28 1526

原创 特征工程——如何处理不平衡数据

针对建模过程中数据存在不平衡的情况应该如何处理?

2022-03-30 11:11:37 1632

原创 特征工程——归一化处理不适用情况

python进行建模特征处理过程中归一化处理注意事项

2022-03-30 11:05:49 1615

原创 XGBoost算法介绍及代码实现

XGBoost算法介绍以及代码实现

2022-03-08 23:56:34 2905

原创 pyspark dataframe使用方法汇总

Pyspark dataframe

2022-02-18 18:14:16 2126

原创 爬虫B站任意视频 弹幕文字+时间

import pandas as pdimport reimport requestsfrom bs4 import BeautifulSouptime_nature=[]comments=[]url = input('请输入B站视频链接: ')res = requests.get(url)cid = re.findall(r'"cid":(.*?),', res.text)[0] #其中cid是弹幕对应的idurl = f'https://comment.bilibili.c

2021-09-23 20:46:57 2017 2

原创 python——dataframe基本操作

取指定的几列df = df[0:(len(df) - 1)] # 取df的前n-1行df[[column1,column2]] #取某两列df.iloc[:,0:200] #不指定列名取前200列df.describe() #描述性统计(对数值型数据列而言)df.dtypes #查看各行的数据格式df['列名'].astype(int)#转换某列的数据类型res_df['T'] = res_df['T'].apply(int)#切片操作df.iloc[1:.

2021-08-30 14:44:24 2638 1

原创 机器学习-XGBoost算法

1、集成算法中主要分为bagging算法与boosting算法BaggingBoosting随机有放回的取样每一轮训练的样本是固定的,改变的是买个样的权重均匀取样,每个样本的权重相同根据错误率调整样本权重,错误率越大的样本权重会变大预测函数权值相同误差越小的预测函数其权值越大各个预测函数可以并行生成各个预测函数必须按照顺序迭代生成2、为什么XGBoot算法这么流行运行速度快且效率及准确率较高使用并行化计算比其他算法强可调节的参数多3、部分参

2021-08-15 22:51:00 564 1

原创 python爬虫-request库的使用

首先确保已经安装了request库pip install request调用get()方法实现与urlopen()相同的操作,得到一个response对象,然后分别输出1、response的类型2、状态码3、响应体的类型4、内容5、以及cookiesimport requestsr=requests.get('https://www.baidu.com/')print(type(r))print(r.status_code)print(r.text)print(r.cookies

2021-08-15 20:15:41 132

原创 python爬虫-股吧

import requestsfrom bs4 import BeautifulSoupimport timeheaders={ "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36" }def parse_onepage(page): global count

2021-08-14 23:01:54 733 1

原创 python爬虫-京东商品评论

对京东某商品的评论进行爬虫并保存import randomfrom selenium import webdriverfrom selenium.webdriver import ActionChainsfrom selenium.webdriver.support.ui import WebDriverWaitimport timefrom bs4 import BeautifulSoupimport pandas as pdfrom selenium.webdriver.common.k

2021-08-14 22:59:22 456

转载 使用 python pyautogui实现鼠标键盘控制功能

pyautogui是一个可以控制鼠标和键盘的python库,类似的还有pywin32。这篇文章主要介绍了python中的pyautogui实现鼠标键盘控制功能,需要的朋友可以参考下 pyautogui是一个可以控制鼠标和键盘的python库,类似的还有pywin32。 pyauto...

2021-08-14 22:47:48 504

转载 python函数 _init_ 函数作用

python中__init__函数的理解 在创建类的时候往往会用到__init__函数 这一类两边带有下划线的函数往往是私有函数,只能在该类的内部使用。 init 的本意就是初始化的意思,一般出现在程序创建类中的第一个函数 。例如: 其实也可以不用初始化。比如: 这样的话,我们初始化的类中也会有一个name参数,但这个参数已经固定了赋值为“red” 如果我们运用__init__函数,则声明了一个可以动态变化的参数name 例如: 结果就是"red2" ,当然,你也可以传递不同的参数。 我的理解

2021-08-14 22:45:13 13843

原创 python将电脑路径中某文件夹的所有excel文件合并为一个文档

import pandas as pd import osimport pandas as pdmulu = r'C:\Users\Desktop\数据' # 获取文件目录# 新建列表,存放文件名file_list = []# 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建DataFrame)dfs = []for root, dirs, files in os.walk(pwd): # 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。

2021-08-14 22:26:24 414

原创 python-高级数据可视化(动态可视化)

数据源为某竞赛网站获得的球员俱乐部信息数据主要使用Plotly Express库•Plotly Express 是一个新的高级 Python 可视化库•为复杂的图表提供了一个简单的语法•内置大量实用、现代的绘图模板,•只需调用简单函数,即可快速生成漂亮的互动图表import plotlyimport plotly.offline as pypy.init_notebook_mode(connected=False)import plotly.express as pximport pan

2021-08-14 22:00:01 1933 1

原创 python-处理异常

在运行程序中,可能会因为网络问题或其他的一些问题导致程序运行出现异常,程序会因此报错运行失败,但如果加上处理异常的代码就会避免这个问题from urllib import request,errortry: response=request.urlopen('https://shanlin.com/index.htm') #网址不存在except error.URLError as e: print(e.reason) #reason返回错误的原因捕获URLError异常,运行如

2021-08-14 21:39:52 78

原创 python爬虫——添加代理

在进行爬虫的时候,可能会需要添加代理from urllib.error import URLErrorfrom urllib.request import ProxyHandler,build_openerproxy_handler=ProxyHandler({ 'http':'http://127.0.0.1.8041', 'https':'https://127.0.0.1.8041',})opener=build_opener(proxy_handler)try:

2021-08-14 21:28:54 646

原创 支持向量机的优缺点及参数调整

支持向量机的优缺点及参数调整核支持向量机是非常强大的模型,在各种数据集上的表现都很好。SVM 允许决策边界很复杂,即使数据只有几个特征。它在低维数据和高维数据(即很少特征和很多特征)上的表现都很好,但对样本个数的缩放表现不好。在有多达10 000 个样本的数据上运行SVM可能表现良好,但如果数据量达到100 000 甚至更大,在运行时间和内存使用方面可能会面临挑战。SVM 的另一个缺点是,预处理数据和调参都需要非常小心。这也是为什么如今很多应用中用的都是基于树的模型,比如随机森林或梯度提升(需要很少的预

2021-08-11 15:50:32 3917

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除