python
农夫左三拳
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python try-except-else 异常捕捉
try-except-else代码块的工作原理大致如下:Python尝试执行try代码块中的代码,只有可能引发异常的代码才需要放在try语句中。有时候,有一些仅在try代码块成功执行时才需要运行的代码,这些代码应该放在else代码块中。except代码块告诉python,如果它尝试运行try代码块中的代码时引发了指定的异常,该怎么办。通过预测可能发生错误的代码,可编写健壮的程序,它们即便面临无效数据或缺少资源,也能继续运行,从而能够抵御无意的用户错误和恶意的攻击。print("Give me tw原创 2021-03-30 17:32:08 · 280 阅读 · 0 评论 -
pycharm 运行和终端运行的运行目录不一样?
RT可以通过os.chdir()将终端运行的目录和pycharm文件运行目录保持一致原创 2021-03-30 10:51:34 · 1712 阅读 · 0 评论 -
python 知识点汇总
在学习python 过程中,很多用法,大家都知道可以这样用,不能那么用,但是很多时候,为啥么不能那么用,关心的人不多,知其所以然,对于学习是很有必要的,有助于我们加深理解。多了解总没有坏处的。1.自定义函数时,有默认值的形参应放在无默认值的形参之后在定义函数时,如果有默认值的形参放在无默认值的形参之前,在函数调用时,python依然会将带入函数的实参作为位置实参传递给第一个形参,这样,会导致无默认值的形参得不到实参传入。因此,有默认值的形参需要在无默认值的形参之后,否则将会有如下报错信息。...原创 2021-01-19 11:37:43 · 277 阅读 · 0 评论 -
python coding 规范
在很多项目上,随着编写的程序越来越长,很有必要对一些代码格式设置约定,有一个良好的coding规范,是极好的。让你的代码尽可能易于阅读;让代码易于阅读有助于你掌握程序是做什么的,也可以帮助别人理解你编写的代码。要成为专业程序员,应从一开始就遵循以下指南,养成良好的习惯。缩进:建议每级缩进都使用四个空格,这既可以提高可读性,又留下了足够的多级缩进空间。行长:很多Python 程序员都建议每行不超过80个字符,PEP8建议注释的行长都不应超过72个字符,因为有些工具为大型项目自动生成文档时,会在每行注释开原创 2021-01-15 16:34:15 · 1179 阅读 · 3 评论 -
python LabelEncoder()编码时的排序问题
在处理数据时,一些变量的值是非数值型的,如区间、中文汉字或者英文等等,在python中,很多时候,上述的数据类型是不能带入模型的,这就需要我们进行处理。常见的处理方式有两种,一种是独热编码,即python里面sklearn.preprocessing的OneHotEncoder;另一种是sklearn.preprocessing的LabelEncoder来打标签编码。第一种方法本文暂不说,主要说一下第二种方法中,LabelEncoder的排序问题。将非数值型变量进行编码,首先要考虑的问题,编码肯定不是原创 2020-06-19 17:15:16 · 4645 阅读 · 7 评论 -
python pandas.set_option()详解
一、简介set_option是pandas里的一个函数,用法为pandas.set_option(pat, value),主要作用是设置一些指定参数的值。供设置的选项如下,后面会逐一进行介绍compute.[use_bottleneck, use_numexpr]display.[chop_threshold, colheader_justify, column_space, date_...原创 2020-02-26 17:28:12 · 21856 阅读 · 0 评论 -
《计量经济学 张晓峒著》学习笔记
一、一般过程:确定研究对象 → 收集数据 → 画变量散点图 → 设计、估计、诊断、检验模型、分析回归参数、预测。1.确定研究对象:略2. 收集数据:略3. 画变量散点图:一定要养成习惯,画变量散点图。4. 设计、估计、诊断、检验模型、分析回归参数、预测:本书重点二、一元线性回归模型1.模型的建立及假定条件一元线性回归模型:2.最小二乘估计(OLS)注意:残差是对随机误差项的...原创 2020-02-21 14:57:49 · 756 阅读 · 0 评论 -
validation_curve验证曲线与超参数
validation_curve()的位置在之前,此函数位置在sklearn.learning_curve.validation_curve(),现在,此函数的位置在sklearn.model_selection.validation_curve()。validation_curve()的作用我们知道误差是由偏差(bias)、方差(variance)、噪声(noise)组成。偏差:模型对于...原创 2020-02-20 16:58:32 · 6748 阅读 · 0 评论 -
机器学习中对变量数据进行Log变化
机器学习算法中,一些算法要求数据符合正态分布,但是对于一些标签和特征来说,分布不一定符合正态分布,这个要怎么处理呢?一个现在比较常见的方式是将数据进行Log变,即取对数,这样可以使得数据在一定程度上符合正态分布的特征。效果如下图所示:(转换前)(转换后)...原创 2019-12-26 09:38:14 · 9912 阅读 · 0 评论 -
Python GBDT+LR
此文主要根据scikit-learn官方文档而来, 中间插入了一些个人比较容易理解的注释。通过roc-auc曲线来比对不同算法组合的效果,算法包括:RT+LR、RF、RF+LR、GBDT、GBDT+LR,结果表明,通过GBDT算法fit后,进行OneHot transformation,然后再进行LR Classification的效果是最好的。在工业生产上,也有多家企业将GBDT+LR最为生...原创 2019-12-09 13:51:24 · 737 阅读 · 0 评论 -
python 集成学习
Bagging分类器组合:sklearn.ensemble.bagging.BaggingClassifierBagging回归器组合:sklearn.ensemble.bagging.BaggingRegressorAdaBoost分类器组合:sklearn.ensemble.AdaBoostClassifierAdaBoost回归器组合:sklearn.ensemble.AdaBoost...原创 2019-11-12 09:52:35 · 421 阅读 · 0 评论 -
《统计学习方法》笔记第五章(未完)
决策树是一种基本的分类与回归方法。本章主要讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合 ,也可以认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3个步...原创 2019-07-09 14:26:54 · 469 阅读 · 0 评论 -
《统计学习方法》笔记第四章
朴素贝叶斯(naive Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习/输出的联合概率分布;然后基于此模型,对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法。本章叙述朴素贝叶斯法,包括朴素贝叶斯法的学习与分类、朴素贝叶斯法的参数估计法。朴素贝叶斯法通过训练数据集...原创 2019-06-27 16:45:50 · 226 阅读 · 0 评论 -
《统计学习方法》笔记第二章
感知机是二类分类的线性分类模型,其输入为实例多多特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负梁飞的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习...原创 2019-06-17 17:21:26 · 244 阅读 · 0 评论 -
python 用法小结
apply用法根据关键字 sortDICT+map 快速映射原创 2019-06-11 11:29:03 · 519 阅读 · 0 评论
分享