- 博客(65)
- 收藏
- 关注
原创 循环中的continue和break | python
1.continue的作用是:中断所在循环的当次执行,直接进入下一次2.break的作用是:直接结束所在的循环3.注意事项:continue和break,在for和while循环中作用一致在嵌套循环中,只能作用在所在的循环上,无法对上层循环起作用参考链接。
2024-01-10 14:07:20
576
1
原创 isin() | python
isin()是pandas中一个用于筛选数据的函数,它接受一个可迭代对象作为参数,并返回一个布尔值序列,表示数据是否匹配给定的条件。以下是isin()表示要应用函数的列名或Series。iterable是包含要检查的值的可迭代对象,如列表、元组、集合等。isin()函数会遍历列中的每一个值,并检查它是否存在于iterable中。如果存在,则返回True,否则返回False。以下是一个使用isin()
2024-01-04 15:38:03
1048
原创 激活函数 | 神经网络
深度学习往往需要大量时间来处理大量数据,模型的收敛速度是尤为重要的。所以,总体上来讲,训练深度学习网络尽量使用zero-centered数据 (可以经过数据预处理实现) 和zero-centered输出。所以要尽量选择输出具有zero-centered特点的激活函数以加快模型的收敛速度;如果使用 ReLU,那么一定要小心设置 learning rate,而且要注意不要让网络出现很多 “dead” 神经元,如果这个问题不好解决,那么可以试试 Leaky ReLU、PReLU 或者 Maxout;最好不要用
2023-07-11 14:57:34
687
原创 拉格朗日松弛 | 运筹优化
由于大规模整数规划/混合整数规划往往是NP-hard的,所以我们很难直接对这些问题求解。每当遇到这些复杂问题的时候,一个基本思路就是对复杂的优化问题进行分解(decomposition)。拉格朗日松弛便是其中一种常见的分解方式。松弛的意思即为放松约束,松弛方法主要有以下四种:1)线性规划松弛(将整数约束松弛至实数约束)2)对偶规划松弛(求解对偶规划,根据弱对偶定理,求 max \text{max}max 的对偶问题提供了求 min \text{min}min 的原问题的一个下界)
2023-05-29 10:48:38
2555
2
原创 PCA主成分分析 | 机器学习
1 主成分分析概述PC:找到的每个新特征向量,降低特征个数,降维找出数据中最主要的,用最主要的代替原始数据。非监督的降维方法信息衡量指标: 样本方差,方差越大,特征所带信息量越多。2 算法流程输入:n维样本集D=(x(1),x(2),…,x(m)),要降维到的维数n’.输出:降维后的样本集D′1 对所有样本进行中心化(样本-均值)2 计算协方差矩阵XXT3 对矩阵特征值分解4 取出n个特征值对应的特征向量(w1,w2,…,wn′),将所有向量标准化后,组成特征向量矩阵W5矩阵分解:
2023-05-28 17:16:32
774
原创 apply函数 | pandas
apply()`可以应用于Pandas中的Series和DataFrame对象。在Series对象上,`apply()`将会对Series中的每个元素应用指定的函数并返回一个新的Series对象;在DataFrame对象上,`apply()`将会对每一行或者每一列应用指定的函数并返回一个新的DataFrame对象。
2023-05-11 13:13:55
869
原创 Conda pack 环境打包 | Python
工作中涉及到模型固化部署工作,需要将本地的环境移植到新的离线的机器上。conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack 进行conda 环境打包和分发。
2023-04-26 10:16:36
14366
2
原创 linux常见操作命令(解压缩常见命令tar、zip)
Linux常见操作命令。可以使用多种命令对文件夹进行压缩,如 gzip、bzip2、zip、tar 等
2023-04-18 14:17:23
871
原创 神经网络参数初始化方法 | 深度学习
神经网络参数的初始值会影响网络的拟合能力和优化效果,如果初始值过大或过小,可能会使得模型的梯度爆炸或梯度消失,导致网络无法收敛或训练效率低下。因此,合适的参数初始化可以提高模型的收敛速度和泛化能力。
2023-04-14 09:27:01
1142
原创 dropout | 深度学习
它的主要作用是增加模型的泛化能力,并提高网络的精度。dropout 的概率在 0.1 到 0.5 之间,dropout的概率为0.1表示在每次训练时,对于每个神经元(或节点)来说,有10%的概率被随机删除,不参与该次训练。提高模型鲁棒性:dropout可以随机地破坏参数之间的相关性,促进网络中参数的独立性,从而提高模型的鲁棒性,使得模型对于噪音和扰动的容忍能力更强。增强模型泛化能力:通过dropout操作,模型学习到的特征会更加丰富和多样化,这可以增强模型的泛化能力,提高模型在未见过数据上的表现。
2023-04-14 09:09:26
1312
原创 字符串拼接方法 join()
join()`是一个字符串方法,接受一个可迭代的对象(如列表)作为参数,将可迭代对象中的字符串元素拼接成一个字符串,并使用调用该方法的字符串作为分隔符。
2023-04-13 15:07:32
2001
原创 链表基础 | 数据结构
链表通过指针串联在一起的线性结构,每一个节点由两部分组成,一个是数据域一个是指针域(存放指向下一个节点的指针),最后一个节点的指针域指向null(空指针的意思)
2023-04-13 10:46:56
186
原创 One-Hot独热编码
One-Hot编码通常用于处理类别间不具有大小关系的特征,是一种常见的将分类数据转换成数值型数据的方法。它将每个类别映射为一个唯一的数值,并且将该数值表示为该类别所在维度为1,其他维度均为0的向量。
2023-04-12 09:09:21
1710
原创 异常值检测方法 | 数据分析
DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise)的输入和输出如下,对于无法形成聚类簇的孤立点,即为异常点(噪声点)。如果对于参数Eps和MinPts,所选取的数据对象点p为核心点,则找出所有从p密度可达的数据对象点,形成一个簇;IQR 为四分位数间距,是上四分位数QU与下四分位数QL的差值,包含了全部观察值的一半;如果选取的数据对象点 p 是边缘点,选取另一个数据对象点;从数据集中任意选取一个数据对象点p;
2023-04-10 15:20:02
371
原创 range()函数 | python
用于生成一个整数序列,一般形式为range(start, stop[, step]),其中start表示序列开始的值(默认为0),stop表示序列结束的值(不包括该值),step表示序列中相邻两项之间的差(默认为1)。0123413579。
2023-04-10 10:50:55
335
原创 蚁群算法 | 运筹优化
信息素是蚂蚁之间交流的工具之一,当有蚂蚁走过时,它将会在它行进的路上释放出信息素,并且这种信息素会议一定的速率散发掉。每只蚂蚁在选择路径时,会考虑当前信息素浓度和距离等因素,计算出每条路径的选择概率。蚂蚁从起点出发根据信息素浓度,有一定的概率性选择路段,浓度越高,概率越大,逐步回到终点;当有蚂蚁走过,它后面的蚂蚁通过路上信息素的浓度,做出决策,往左还是往右;蚂蚁在路径上释放信息素,并根据路径长度更新信息素浓度。很明显,沿着短边的的路径上信息素将会越来越浓,从而吸引了越来越多的蚂蚁沿着这条路径行驶;
2023-04-07 15:22:37
1569
原创 粒子群算法 | 启发式优化算法
是一种群体智能算法,通过模拟鸟群觅食寻找目标的过程来进行优化,利用群体中的个体对信息的共享,算法通过不断地更新算法中每个粒子的速度与位置来逼近最优解。每个粒子根据自己的历史最优解和群体的最优解来更新速度和位置,从而在搜索空间中寻找最优解。
2023-04-06 14:58:34
3213
原创 类的私有方法 | python
考虑一个类中需要进行某些较为复杂的操作,如果直接将这些操作暴露给外部,可能会导致外部代码直接修改内部状态,进而破坏类的一些内部逻辑。私有方法的存在可以把复杂的逻辑封装在类的内部,对于外部代码来说,只需要关注类对外公开的接口,而不需要关心内部实现细节。私有方法是指在类中定义的方法,它只能在类的内部被访问和调用,而不能在类实例化之后被外部代码访问和调用。在面向对象编程中,私有方法主要用于封装类的实现细节,避免外部代码直接访问和修改内部状态,从而保证类的封装性和安全性。
2023-04-06 14:49:56
1258
原创 模拟退火 | 启发式算法运筹
模拟退火算法的思想借鉴于固体的退火原理,当固体的温度很高的时候,内能比较大,固体的内部粒子处于快速无序运动,当温度慢慢降低的过程中,固体的内能减小,粒子的慢慢趋于有序,最终,当固体处于常温时,内能达到最小,此时,粒子最为稳定。模拟退火算法的核心是温度下降,随着温度的降低,接受劣解的概率逐渐降低,最终趋于0。如果当前解是一个局部最优解,即在附近的解中没有比它更好的解,那么一般情况下,该算法仍然会接受这个解,并以一定的概率接受更劣的解,这样就有可能跳出局部最优解并进一步找到全局最优解。这是一种贪心的思想。
2023-04-03 15:37:44
2508
原创 遗传算法 |运筹优化
借鉴了生物学中的遗传学和进化论的思想,将待优化问题的解看作进化中的个体,通过基因重组、突变和选择等遗传操作来实现逐代进化,最终找到最优解。
2023-04-03 15:30:16
5571
1
原创 合并merge pandas
函数用于将两个或多个数据集按照一定的方式合并起来。举个例子,假设我们有两个数据集。现在我们想要将这两个数据集按照。执行上述语句后,得到的。
2023-03-30 14:29:53
229
原创 list列表生成式 | python
是在一个中括号里包含一个表达式,然后是一个for语句,然后是0个或多个for或者if语句。下面通过例题来对列表生成式进行深入的理解。
2023-03-24 10:23:24
234
原创 Python之count函数
原文链接:https://blog.youkuaiyun.com/qq_61210648/article/details/126691890。end — 字符串中结束搜索的位置,字符中第一个字符的索引为0,。默认为字符串的最后一个位置。start — 字符串开始搜索的位置,默认为第一个字符,第一个字符索引值为0。返回值 — 返回子字符串在字符串中出现的次数。统计子字符串在总字符串里边的出现次数。sub — 搜索的子字符串。count函数的主要作用。
2023-03-17 14:10:43
335
原创 Series、list | pandas
一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。# 左侧为索引,右侧是数据创建 创建一个具有标签索引的Series。
2023-02-21 09:55:58
311
原创 交叉验证 | 机器学习
交叉验证**目的:**交叉重复的使用数据集分为训练集和测试集,这次用于训练集,下次可能用于测试集。一般用在数据量不是很充条件下,评估模型好坏。如果样本大于一万条的话,我们一般随机的把数据分成三份,一份为训练集(Training Set),一份为验证集(Validation Set),最后一份为测试集(Test Set)。用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集,最终决定使用哪个模型以及对应参数。简单:30%测试集,70%训练集(2)s折交叉
2023-02-20 10:32:36
2643
原创 Mysql | Error Code: 1153 - Got a packet bigger than ‘max_allowed_packet‘ bytes
max_allowed_packet 参数限制了Mysql服务能够接受的数据包大小,数据包超过设置的值时,则会报错
2023-02-17 10:33:35
772
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人