
python
a尼
虚心学习!
展开
-
续第九届泰迪杯【缺失值处理&过采样&baseline训练】
快速入门数据挖掘原创 2024-02-16 19:34:10 · 393 阅读 · 0 评论 -
pandas实战
通过数据进行pandas内置函数的使用展示原创 2022-11-17 23:12:03 · 391 阅读 · 2 评论 -
时序arima
arima模型是结合ar模型,ma模型,差分的模型。原创 2022-11-09 00:47:33 · 5126 阅读 · 4 评论 -
自然语言库pyhanlp和pyltp的安装
nlp相关库下载原创 2022-10-06 20:03:08 · 957 阅读 · 1 评论 -
python辅助u盘数据恢复
u盘数据恢复+python辅助提取文件原创 2022-08-24 18:37:01 · 1576 阅读 · 0 评论 -
python爬虫连接数据库【附上源码】
python数据写入mysql原创 2022-08-09 20:23:11 · 1520 阅读 · 0 评论 -
利用python进行基础绘图
画图目录:柱状图热力图气泡图柱状图import matplotlib.pyplot as plt# a和b是数字# 显示中文plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']plt.figure(figsize=(6,5))# 画柱状图plt.bar(['下雨天','非下雨天'],[a,b],color=['dimgray','royalblue'],width=0.6)# 加标签plt.title('白天天气状况',f原创 2022-05-01 16:43:25 · 1287 阅读 · 0 评论 -
jupyter notebook中的kernel管理【附虚拟环境配置】
让jupyter notebook运行需要的kernel和conda创建的虚拟环境互通,对kernel的管理原创 2022-03-19 12:36:02 · 4686 阅读 · 1 评论 -
pytorch详细安装
pytorch详细安装打开annaconda自带的annaconda prompt进入虚拟环境安装pytorch把pytorch在annaconda prompt安装到annaconda 里面的jupyter notebook中进入notebook查看打开annaconda自带的annaconda prompt创建虚拟环境,这里以python=3.9.7为例。不知道自己安装的是什么版本的小伙伴可以去cmd输入python查看,创建一个名为pytorch的虚拟环境conda create -n pyt原创 2022-01-17 22:15:59 · 1565 阅读 · 0 评论 -
数据预处理--数据标准化(5)
分析:先标准化在进行随机森林的填充,避免随机填充时填充的数据太大影响标准化先分析一下特征间数据差异过大,过大需要进行归一化(一般都要)#量纲可视化 #量纲分析#指标数据化#求出各指标中位数并且保存下来import pandas as pddata=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makenomal_flag.csv',encoding='utf-8',index_col=None)df=data.median().T原创 2021-08-14 23:00:15 · 294 阅读 · 0 评论 -
数据预处理--异常值检验(4)
利用ks检验:检验数据是否满足正态分布,如果不满足的用空值代替下一步有对缺失值的填充# 设置cell多行输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = 'all' #默认为'last'# 导入相关库import numpy as npimport pandas as pdimport matplotlib.pyplot as plti原创 2021-08-14 22:52:38 · 912 阅读 · 0 评论 -
数据预处理--行业划分(3)
把全部数据拆分成有标签的制造业,有标签的其他行业,无标签的制造业,无标签的其他行业4个文件。根据题干再把D2分为制造业和非制造业。原创 2021-08-14 22:25:14 · 531 阅读 · 0 评论 -
数据预处理(2)
#缺失值可视化 import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltD=pd.read_csv(r'D:\挑战杯\flag.csv',encoding='gbk')#统计原表中的总列数D1,空值占全部数据的80%以下的列数D1=D.iloc[::].count()/D.shape[0]D2=D1[D1>0.2]D=D[D2.index]print(D1.shape[0],D2.shap.原创 2021-08-14 22:06:28 · 292 阅读 · 0 评论 -
第九届泰迪杯A题(1)
分析:统计出造假和非造假的个数并作图正负样本可视化import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 查看0/1的占比data=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makeflag.csv',encoding='gbk')count_classes = pd.value_counts(data['是否在当年造假'], sort = True原创 2021-08-14 21:38:00 · 1766 阅读 · 2 评论 -
python进阶之函数式编程
高阶函数#高阶函数#高阶函数概念:可以将其他函数作为参数或者返回结果的函数。def lazy(*args): def sum(): ax=0 for n in args: ax=ax+n return ax return sumlazy(1,2,3)()'''在这个例子中lazy()中又定义了函数sum()因为lazy的返回值是函数sum所以在执行lazy的时候只是起到了把参数传递到了sum上面故而必须再原创 2021-06-29 17:13:29 · 106 阅读 · 0 评论 -
python基础第五弹--简单内置函数以及模块的简单创建和介绍
简单的内置函数enumerate,string,I/O函数创建简单的模块fibo(不完善的斐波那契数列)涉及模块内容math,calendar,datatime,cmath#format的常见用法print('hello {0} i am {1}'.format('world','python'))hello world i am python#在同时需要index和value值的时候可以使用 enumerate'''enumerate有两个参数,1个是可迭代对象,另一个是指起始位置原创 2021-06-29 16:18:18 · 163 阅读 · 0 评论 -
python基础第四弹--函数def与匿名函数lambda
'''lambda表达式:lambda是用来声明一个匿名函数''''lambda表达式:lambda是用来声明一个匿名函数'#小试牛刀f=lambda x,y,z:x+y+zprint(f(1,2,3))6'''匿名函数的列表定义:列表名=[(lambda表达式1),(lambda表达式2),......]调用:列表名[索引](Lambda表达式的参数列表)'''#for exampleL=[(lambda x:x**2),(lambda x:x**3)]print(L[原创 2021-06-29 16:11:53 · 541 阅读 · 0 评论 -
python进阶--闭包和函数的递归调用
闭包和函数的递归调用闭包:在python中闭包指的是函数的嵌套。函数的递归调用:函数在执行的过程中直接或间接调用自己本身,称为递归调用⬇️ ◀️f()函数 ⏫⬇️ ⏫调用f()函数⤴️ 直接调用从图中可以看出递归调用都是无终止地调用自己。所以可以使用if语句来控制,当满足某一条件时递归调用结束递归调用的执行过程分为两个部分1.递推过程2.回归过程这两个过程由递归终止条件控制。即逐层递推、直到递归终止条件、然后逐层回归栈递归时要用到栈**栈也称为后进原创 2021-06-28 17:02:17 · 246 阅读 · 0 评论 -
python基础第三弹--浅谈random模块
random模块是一个增添乐趣的模块因为随机这项活动会出现在课堂上老师说:“我们现在随机抽取一个人。”相信这句话一直带给人一种刺激感。还有在各种活动中,随机这个字眼也经常听到,它或多或少给人一种公平性。再python中实现随机是一件轻松的事情,只要大家掌握了以下几个基础的命令!先来几个常用的命令random.random() 生成一个0到1的随机浮点数random.randint(1,50) 在范围内生成一个随机整数random.uniform(1.1,50.1) 在范围内生成一原创 2021-06-28 14:56:23 · 187 阅读 · 1 评论 -
python基础第二弹--浅谈字符串
'''字符串的切片'''var='hello world'var[0],var[1:5] #不包括第五个('h', 'ello')'''转义符'''print('表示换行''1\n12')print('表示纵向制表:''1\v12')print('表示横向制表:','1\t12')print('表示换页:','1\f12')'''\e没看出什么效果'''print('转义:','\e')print('e')表示换行112表示纵向制表:112表示横向制表: 1 12表示原创 2021-06-26 17:04:01 · 152 阅读 · 0 评论 -
python基础第一弹--浅谈repr和str;eval和print
在学习到python字符串格式化符的时候想必很多小伙伴都会接触到%r和%s这两个格式化那么它们分别有什么区别和联系呢?%s是格式化字符串%r是给对象加上引号’’举个例子print(type('%r'%5))print(type('%s'%5))#它们的输出都是<class 'str'>所以如果作用的对象本身不是字符串的话,那么是没有区别的,但是!b='nihao'print('%r'%b)print('%s'%b)'''它们的输出结果如下'nihao'nihao原创 2021-06-26 15:15:55 · 659 阅读 · 1 评论 -
python多线程threading
碎碎念在学习python的多线程之前我一直很纳闷多线程有什么用?毕竟学习一门东西你知道了它的用途了之后就更加有动力去学习它然后我去了解了它的优点有以下几个: 使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。程序的运行速度可能加快。在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。每个独立原创 2021-06-25 17:39:54 · 121 阅读 · 0 评论 -
python3.8虚拟环境的安装及其使用【virtualenv】
conda换源因为python是国外的一款编译器,所以我们在安装python的一些库时如果没有连接到国内的镜像源的话,在速度方面下载会很慢。所以我先换好源是接下来进行虚拟安装的加速器。这里我就列举了清华镜像源#查看是否已经安装镜像源conda config --show channels#如果没有的话进行安装conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/simple/pip换源pip config set gl原创 2021-06-25 16:24:45 · 7945 阅读 · 1 评论 -
matplotlib箱型图详细介绍【代码】
箱线图是分析数据,将数据可视化的一个重要工具,在论文中可以用到。直接上箱型图代码#导入数据all_data = [np.random.normal(0, std, size=100) for std in range(1, 4)]labels = ['x1', 'x2', 'x3']#创建一个画布,两个子图分别为ax1和ax2fig, (ax1, ax2) = plt.subplots(nrows=1, ncols=2, figsize=(9, 4))# 对箱型图的设置bplot1 =原创 2021-05-31 23:38:04 · 705 阅读 · 0 评论