自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (2)
  • 收藏
  • 关注

原创 excel数据脱敏>排序以及vlookup函数使用

数据安全

2025-04-13 21:59:46 311

原创 pytorch版本的lstm搭建

欢迎多多交流

2024-02-18 23:04:56 599

原创 续第九届泰迪杯【缺失值处理&过采样&baseline训练】

快速入门数据挖掘

2024-02-16 19:34:10 387 1

原创 城市公交车交通分析【python爬虫/R语言绘图】【2】

一篇可视化的博文分享,未经允许不得转载

2023-08-24 19:38:25 278

原创 城市公交车交通分析【python爬虫/R语言绘图】【1】

探究惠州市特定线路的公交停靠信息以及步行信息,通过对数据分析来尝试改善用户体验。

2023-08-11 15:29:05 450 1

原创 pandas实战

通过数据进行pandas内置函数的使用展示

2022-11-17 23:12:03 389 1

原创 时序arima

arima模型是结合ar模型,ma模型,差分的模型。

2022-11-09 00:47:33 5095 4

原创 自然语言库pyhanlp和pyltp的安装

nlp相关库下载

2022-10-06 20:03:08 956 1

原创 python辅助u盘数据恢复

u盘数据恢复+python辅助提取文件

2022-08-24 18:37:01 1569

原创 python爬虫连接数据库【附上源码】

python数据写入mysql

2022-08-09 20:23:11 1513

原创 引自其他博客的java代码改进【基本方法的使用】

在网上看到一篇java语法的博客,看到代码有不完善的地方进行了一些改进

2022-07-03 21:59:10 190

原创 利用python进行基础绘图

画图目录:柱状图热力图气泡图柱状图import matplotlib.pyplot as plt# a和b是数字# 显示中文plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']plt.figure(figsize=(6,5))# 画柱状图plt.bar(['下雨天','非下雨天'],[a,b],color=['dimgray','royalblue'],width=0.6)# 加标签plt.title('白天天气状况',f

2022-05-01 16:43:25 1283

原创 jupyter notebook中的kernel管理【附虚拟环境配置】

让jupyter notebook运行需要的kernel和conda创建的虚拟环境互通,对kernel的管理

2022-03-19 12:36:02 4667 1

原创 pytorch详细安装

pytorch详细安装打开annaconda自带的annaconda prompt进入虚拟环境安装pytorch把pytorch在annaconda prompt安装到annaconda 里面的jupyter notebook中进入notebook查看打开annaconda自带的annaconda prompt创建虚拟环境,这里以python=3.9.7为例。不知道自己安装的是什么版本的小伙伴可以去cmd输入python查看,创建一个名为pytorch的虚拟环境conda create -n pyt

2022-01-17 22:15:59 1559

原创 数据预处理--数据标准化(5)

分析:先标准化在进行随机森林的填充,避免随机填充时填充的数据太大影响标准化先分析一下特征间数据差异过大,过大需要进行归一化(一般都要)#量纲可视化 #量纲分析#指标数据化#求出各指标中位数并且保存下来import pandas as pddata=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makenomal_flag.csv',encoding='utf-8',index_col=None)df=data.median().T

2021-08-14 23:00:15 292

原创 数据预处理--异常值检验(4)

利用ks检验:检验数据是否满足正态分布,如果不满足的用空值代替下一步有对缺失值的填充# 设置cell多行输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = 'all' #默认为'last'# 导入相关库import numpy as npimport pandas as pdimport matplotlib.pyplot as plti

2021-08-14 22:52:38 903

原创 数据预处理--行业划分(3)

把全部数据拆分成有标签的制造业,有标签的其他行业,无标签的制造业,无标签的其他行业4个文件。根据题干再把D2分为制造业和非制造业。

2021-08-14 22:25:14 529

原创 数据预处理(2)

#缺失值可视化 import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltD=pd.read_csv(r'D:\挑战杯\flag.csv',encoding='gbk')#统计原表中的总列数D1,空值占全部数据的80%以下的列数D1=D.iloc[::].count()/D.shape[0]D2=D1[D1>0.2]D=D[D2.index]print(D1.shape[0],D2.shap.

2021-08-14 22:06:28 289

原创 第九届泰迪杯A题(1)

分析:统计出造假和非造假的个数并作图正负样本可视化import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 查看0/1的占比data=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makeflag.csv',encoding='gbk')count_classes = pd.value_counts(data['是否在当年造假'], sort = True

2021-08-14 21:38:00 1754 2

原创 python进阶之函数式编程

高阶函数#高阶函数#高阶函数概念:可以将其他函数作为参数或者返回结果的函数。def lazy(*args): def sum(): ax=0 for n in args: ax=ax+n return ax return sumlazy(1,2,3)()'''在这个例子中lazy()中又定义了函数sum()因为lazy的返回值是函数sum所以在执行lazy的时候只是起到了把参数传递到了sum上面故而必须再

2021-06-29 17:13:29 104

原创 python基础第五弹--简单内置函数以及模块的简单创建和介绍

简单的内置函数enumerate,string,I/O函数创建简单的模块fibo(不完善的斐波那契数列)涉及模块内容math,calendar,datatime,cmath#format的常见用法print('hello {0} i am {1}'.format('world','python'))hello world i am python#在同时需要index和value值的时候可以使用 enumerate'''enumerate有两个参数,1个是可迭代对象,另一个是指起始位置

2021-06-29 16:18:18 162

原创 python基础第四弹--函数def与匿名函数lambda

'''lambda表达式:lambda是用来声明一个匿名函数''''lambda表达式:lambda是用来声明一个匿名函数'#小试牛刀f=lambda x,y,z:x+y+zprint(f(1,2,3))6'''匿名函数的列表定义:列表名=[(lambda表达式1),(lambda表达式2),......]调用:列表名[索引](Lambda表达式的参数列表)'''#for exampleL=[(lambda x:x**2),(lambda x:x**3)]print(L[

2021-06-29 16:11:53 540

原创 python进阶--闭包和函数的递归调用

闭包和函数的递归调用闭包:在python中闭包指的是函数的嵌套。函数的递归调用:函数在执行的过程中直接或间接调用自己本身,称为递归调用⬇️ ◀️f()函数 ⏫⬇️ ⏫调用f()函数⤴️​ 直接调用从图中可以看出递归调用都是无终止地调用自己。所以可以使用if语句来控制,当满足某一条件时递归调用结束递归调用的执行过程分为两个部分1.递推过程2.回归过程这两个过程由递归终止条件控制。即逐层递推、直到递归终止条件、然后逐层回归栈递归时要用到栈**栈也称为后进

2021-06-28 17:02:17 241

原创 python基础第三弹--浅谈random模块

random模块是一个增添乐趣的模块因为随机这项活动会出现在课堂上老师说:“我们现在随机抽取一个人。”相信这句话一直带给人一种刺激感。还有在各种活动中,随机这个字眼也经常听到,它或多或少给人一种公平性。再python中实现随机是一件轻松的事情,只要大家掌握了以下几个基础的命令!先来几个常用的命令random.random() 生成一个0到1的随机浮点数random.randint(1,50) 在范围内生成一个随机整数random.uniform(1.1,50.1) 在范围内生成一

2021-06-28 14:56:23 185 1

原创 python基础第二弹--浅谈字符串

'''字符串的切片'''var='hello world'var[0],var[1:5] #不包括第五个('h', 'ello')'''转义符'''print('表示换行''1\n12')print('表示纵向制表:''1\v12')print('表示横向制表:','1\t12')print('表示换页:','1\f12')'''\e没看出什么效果'''print('转义:','\e')print('e')表示换行112表示纵向制表:1 12表示横向制表: 1 12表示

2021-06-26 17:04:01 151

原创 python基础第一弹--浅谈repr和str;eval和print

在学习到python字符串格式化符的时候想必很多小伙伴都会接触到%r和%s这两个格式化那么它们分别有什么区别和联系呢?%s是格式化字符串%r是给对象加上引号’’举个例子print(type('%r'%5))print(type('%s'%5))#它们的输出都是<class 'str'>所以如果作用的对象本身不是字符串的话,那么是没有区别的,但是!b='nihao'print('%r'%b)print('%s'%b)'''它们的输出结果如下'nihao'nihao

2021-06-26 15:15:55 655 1

原创 python多线程threading

碎碎念在学习python的多线程之前我一直很纳闷多线程有什么用?毕竟学习一门东西你知道了它的用途了之后就更加有动力去学习它然后我去了解了它的优点有以下几个: 使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。程序的运行速度可能加快。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。每个独立

2021-06-25 17:39:54 119

原创 python3.8虚拟环境的安装及其使用【virtualenv】

conda换源因为python是国外的一款编译器,所以我们在安装python的一些库时如果没有连接到国内的镜像源的话,在速度方面下载会很慢。所以我先换好源是接下来进行虚拟安装的加速器。这里我就列举了清华镜像源#查看是否已经安装镜像源conda config --show channels#如果没有的话进行安装conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/simple/pip换源pip config set gl

2021-06-25 16:24:45 7903 1

原创 matplotlib箱型图详细介绍【代码】

箱线图是分析数据,将数据可视化的一个重要工具,在论文中可以用到。直接上箱型图代码#导入数据all_data = [np.random.normal(0, std, size=100) for std in range(1, 4)]labels = ['x1', 'x2', 'x3']#创建一个画布,两个子图分别为ax1和ax2fig, (ax1, ax2) = plt.subplots(nrows=1, ncols=2, figsize=(9, 4))# 对箱型图的设置bplot1 =

2021-05-31 23:38:04 699

原创 pandas reshape(n,-1)的理解

pandas reshape(n,-1)的理解import numpy as np#-1在这里应该可以理解为一个正整数通配符,它代替任何正整数。a = np.arange(4).reshape(-1,2)#输出结果是[[0,1],[2,3]]根据numpy库的官网介绍,这里的-1被理解为unspecified value,即未指定的,未给定的。如果我只需要特定的行数,列数我无所谓多少,我只需要指定行数,列数用-1代替就行了,计算机帮我算应该有多少列,反之亦然。所以-1在这里应该可以理解为一个正整

2021-05-31 17:41:42 654

银行贷款拖欠率的五行数据

银行贷款拖欠率的五行数据

2022-06-02

hadoop集群配置笔记

在hadoop集群配置中边搭边记录的小白,一起学习!

2022-04-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除