自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 数据预处理

数据预处理 归一化 当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization,又称Min-Max Scaling)。注意,Normalization是归一化,不是正则化,真正的正则化是regularization,不是数据预处理的一种手段。 标准化 当数据(x)按均值(μ)中心化后,再按标准差(σ)缩放,数据就会服从为均值为0,方差为1的正态分布(即标准正态分布),而这个过程,就

2022-05-05 15:50:00 306

原创 2随机森林

集成算法 本身不是一种单独的机器学习算法,而是通过在数据上构建多个模型,继承所有模型的建模结果,以此来获取比单个模型更好的效果。 通常有三类继承算法,袋装法(Bagging),提升法(Boosting),Stacking 袋装法是构建互相独立的评估器,对其预测进行平均或多数表决的原则来决定最终的结果。 提升法中,基评估器是相关的,是按顺序一一构建的,其思想是结合弱评估器的力量一次次对难评估的对象进行提升,如梯度提升。 n_estimators 森林中决策树的数量,值越高,模型效果往往越好,但是达

2022-05-02 13:13:31 203

原创 sklearn 决策树

# 决策树 ## 决策树参数: ### criterion: entropy:信息熵\ gini:基尼系数 二者没有太大的的区别,但在十几应用中,信息熵对不纯度更加敏感,计算也更缓慢(涉及对数),但决策树生长也会更加精细。因此对于高维数据或者噪音很多的数据,因此信息熵非常容易发生过拟合的现象(高维度数据、噪音很多的数据),不是绝对的。 criterion如何影响模型:是确定不纯度的方法、帮忙找出最佳节点和最佳分枝,不纯度越低,决策树的拟合越好。 ### 决策树基本流程

2022-04-27 21:56:02 479

原创 python基础知识 Chapter11

Day20 python基础知识 模块化程序设计理念 程序越来越复杂——同一个功能的语句封装到函数中——函数诞生 函数和变量多了——同一类型对象的数据和行为统一管理、调用——“类”诞生 函数和类多了——类似功能的函数和类统统放到一个模块中——模块诞生 python程序由模块组成,一个模块对应一个.py文件 标准库模块 标准库提供了系统操作、网络通信、文本处理、文件处理、数学运算等基本功能 如random math time file os sys 等 另外还提供海量第三方模块 模块化

2021-11-11 22:01:37 585

原创 2021-11-08

Day18 python基础知识 文件操作技术(IO) 数据存放在数据库中,而数据库的底层仍是IO技术 文件分为文本文件和二进制文件两种 1.文本文件 储存字符,可以用记事本打开,默认为unicode(两个字节表示一个字符)字符集(注,word这种软件编辑的文档不是文本文件) 2.二进制文件 把数据内容用字节存储,无法用记事本打开,必须使用专用软件解码,如Mp4、doc等 文件相关模块操作 创建文件对象open() 基本语法格式如下: open(文件名[,打开方式]) 如果只

2021-11-08 15:50:15 124

原创 python基础知识Chapter9

Day17 python基础知识 异常的本质_调试核心理念 异常指程序软件运行过程中出现的不正常现象,例如用户输入错误、除数为零、需要处理的文件不存在、数组下标越界等。 异常处理,指程序在出现问题时依然可以正确执行剩余的程序,而不会因为异常而终止程序执行。 python中引进了很多用来描述和处理异常的类 BaseException——Exception——NameError、ValueError、AttributeError 遇到异常:1.定位错误 2.百度并查看十个相关帖子,尝试解决

2021-11-04 22:44:46 359

原创 pyhton基础知识Chapter8

Day15 python基础知识 方法没有重载 在其他语言中,可以定义多个重名的方法,只保证方法签名唯一即可,方法签名包含:方法名、参数数量、参数类型 python中,方法的参数没有类型(调用时确定类型),参数的数量也可以由可变参数控制。因此,Python中的方法是没有重载的 若定义了多个重名的方法,只有最后一个生效 方法的动态性 python是动态语言,可以动态地给类添加新方法,或修改类已有方法。(方法、函数也是对象,一切都是对象) 私有属性和私有方法(实现封装) python中对于类

2021-11-02 22:28:26 130

原创 Python基础知识 Chapter7

Day13 python基础知识 嵌套函数 在函数内部定义的函数,出了函数范围无法调用 功能:1.封装-数据隐藏,外部无法访问 2.贯彻DRY,降低重复代码 Nonlocal关键字 nonlocal 用来声明外层的全局变量 global 声明模块中的全局变量 LEGB规则 python在查找”名称“时,是按照LEGB规则查找的: Local-->Enclosed-->Global-->Built in Local指函数或者类的方法内部 Enclosed指的是嵌套

2021-10-31 21:16:19 171

原创 Python基础知识Chapter6

函数内存底层分析 函数也是对象 运行def后,会在堆里创建一个函数对象(参数、函数名等),栈中保存了一个函数名对象,值为该函数的地址 函数名+括号(),表示调用。创建一次后可以多次调用。 def test01() >>>c=test01 赋值后c也拥有test01函数的地址 可以直接调用,如c(),且print(type(c))=function 变量的作用域 变量起作用的范围称作作用域,分为全局变量和局部变量 全局变量需要用(global)声明,尽量不使用,二者冲突时

2021-10-16 17:10:49 151

原创 Python基础知识Chapter 5

Day8 python基础知识 嵌套循环 for x in range(5): for y in range(5): print(x,end="\t") print("\n") 打印99乘法表 for m in range(1,10): for n in range(1,m+1): print("{0}*{1}={2}".format(m,n,(m*n)),end="\t") print() break 语句 break用于结束...

2021-10-08 22:22:56 515

原创 Python基础知识Chapter4

字典 字典是"键值对"的无序可变序列,字典中的每一个元素都是一个'键值对',包含"键对象"和"值对象" 字典通过"键对象"找到对应的"值对象",键是任意不可变数据:数字、字符串、元组,但列表、字典、集合这些可变对象不能作为键。 键不可重复 字典的创建 1.花括号{} 如a={"name":"gaoqi","age":"18"} a={} 空的字典对象 2.dict() 空的字典对象 b=dict(name='gaoqi',age='18') 3.dict[] a=dict[("na

2021-09-27 21:37:14 291

原创 python基础知识Day5

python基础知识Day5 序列 序列是一种数据存储方式,用来存放一系列的数据。 常用的序列结构有L字符串、列表、元组、字典、集合 列表:用于存储任意数目、任意类型的数据集合 如:a=[10,20,‘abc','True'] 常用方法:list.append(x) 增加元素 list.extend(aList)将alist所有元素增加 list.insert(index,x)在index处插入元素x list.remove(x)删除首次出现的x list.clear()清楚列表内容

2021-09-24 22:24:44 375

原创 Python基础知识.Chapter2

python基础知识Day3 链式赋值 用于同一个对象赋值给多个变量 x=y=123 即 x=123;y=123 系列解包赋值 系列数据赋值给对应相同个数的变量(个数必须一致) a,b,c=4,5,6 即:a=4;b=5;c=6 使用系列解包赋值实现变量交换 a,b=1,2 a,b=b,a print(a,b) 常量 Python不支持常量,只能通过逻辑控制 内置数据类型 整形 浮点型(小数) 布尔型(TRUE,FALSE) 字符串型 数字运算 加减乘除(+-*/)

2021-09-23 21:45:53 243

原创 Python基础知识.Chapter1

Day1 Python基础知识 IDE——integrated develop environment 进入:命令行——python 推出:Ctrl+Z回车/quit()命令/关闭窗口 中断程序执行:Ctrl+C 运行:F5/run moduel 注意缩进,避免中文标点 程序基本格式 1.注意缩进,严格遵守缩进规则 2.区分大小写 3.注释:行注释#+stuff 段注释三个单引号’‘’ Day2 Python基础 如何学习 守 破 离 建立体系,不要追求之前的基础完美才敢往后学.

2021-09-18 22:53:32 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除