- 博客(132)
- 资源 (2)
- 收藏
- 关注
原创 LASSO回归、岭回归和elastic回归
lasso和岭回归分别是在损失函数上加上L1正则项和L2正则项Elasticnet回归叫做弹性网络回归,同时结合了以上两种正则项Sklearn库中有sklearn.linear_model.ElasticNetCV和sklearn.linear_model.ElasticNet两个函数可供选择,前者可以通过迭代选择最佳的 λ 1 \lambda_1λ1和λ 2 \lambda_2λ2(当然你可以指定一组值),后者需要你指定λ 1 \lambda_1λ1和λ 2 \lambda
2021-07-20 09:37:10
520
原创 二叉树的两种遍历方式
# 二叉树的遍历可分为两种'''1.广度优先遍历分层把元素放到 队列中,进行遍历2.深度优先遍历前序,中序,后序遍历,使用堆栈和递归的方式'''# 广度优先遍历一颗二叉树def bfsTree(self): if sele.root =None: return None queue =[] queue.append(self.root) while queue: node=queue.pop(0) print(node.element,end =',') if.
2021-07-14 18:07:02
545
原创 贪婪算法的集合覆盖问题
#贪婪算法 以寻找局部最优解来找全局最优解,是一种近似算法,基于集合# 广播台分别覆盖的州stations = {}stations["kone"] = set(["id", "nv", "ut"])stations["ktwo"] = set(["wa", "id", "mt"])stations["kthree"] = set(["or", "nv", "ca"])stations["kfour"] = set(["nv", "ut"])stations["kfive"] = set([
2021-07-14 16:29:40
272
原创 迪克斯特拉算法python有向无环图
#迪克斯特拉算法#处理有向无环图,在加权途中寻找最短路径,不能将狄克斯特拉算法用于包含负权边的图#查询消费最小的节点def find_lowst_node(costs,process): lowest_cost = float('inf') lowest_cost_node = None for node in costs: cost = costs[node] if cost<lowest_cost and node not in process: lowest_co
2021-07-14 15:55:42
473
原创 广度优先搜索bfs
# 广度优先搜索 bfs#图的查找方法,可回答两种问题1.从A出发有前往B的路径吗?2.从A前往B的最短路径是哪条?# 寻找朋友中以m结尾的人from collections import deque# who is the person def whoperson(name): return name[-1] ='m' # bfs # deque是一个双向链表,提供了两端都可以操作的序列 def bfs(graph,name): search_queue =deque() s
2021-07-14 15:33:58
129
原创 二分查找,选择排序,快速排序,归并排序,冒泡排序
# 二分查找 平均时间复杂度logndef bianryfind(list,item): low =0; high= len(list)-1 while low <= high: mid = int((low+high)/2) guess= list[mid] if guess == item: return guess else if guess>item: high = mid-1 else: low =mid+1 return None
2021-07-14 14:45:03
140
转载 标准化/归一化方法
sklearn 的preprocessing提供了可以满足需求的归一化方法。1.standardScalar标准化数据通过减去均值然后除以方差(标准差),这种标准化方法经过处理后,数据符合标准正态分布,即均值为0,标准差为1.适用于,数据的分布本来就符合正态分布 x =(x - ?)/?。通常这种方法基本可用于有outlier的情况,但是,在计算方差和均值的时候outliers仍然会影响计算。所以,在出现outliers的情况下可能会出现转换后的数的不同feature分布完全不同的情况。2.min
2021-07-13 18:04:38
1543
原创 pandas求偏度skew
偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。偏度(Skewness)亦称偏态、偏态系数。表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。定义上偏度是样本的三阶标准化矩:DataFrame.skew(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)参数:axis : {index (0), columns (1)}定义计算
2021-07-13 17:13:32
1918
转载 离散型特征的编码方式one-hot编码
转自one-hot 编码pandas 对one-hot编码的函数为:pd.getdummies()sklearn中的one-hot编码;sklearn中的不同编码方式one -hot编码又称为有效一位编码,主要由N位状态寄存器对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,只有一位有效。one-hot编码是分类变量作为二进制向量的表示,首先要求分类值映射到整数值,然后每个整数值表示为二进制向量,除了整数索引之外,都是零值,其他被标志为1....
2021-07-12 14:27:44
425
转载 BOX-COX变换
box-cox变换是统计建模中的一项常用变换。即方差稳定变换。用于连续的因变量不满足正态分布的情况。先说一下泊松分布:泊松分布是一种重尾分布,它的方差等于均值。因此均值越大,方差就越大,重尾程度就越大,,box-cox可以改变变量的分布,使得方差不再依赖于均值。例如:假设随机变量X符合泊松分布,如果通过他的平方根对它进行变换,则X’ =根号x 的方差就接近于一个常数,而不与均值相等。box-cox的变换一般形式为:式中为经Box-Cox变换后得到的新变量,y为原始连续因变量,为变换参数。以
2021-07-12 12:10:23
12375
原创 python中的shape[0]和shape[1]
import numpy as npk = np.matrix([[1, 2, 3, 4,6],[5, 6, 7, 8,9],[9, 10, 11, 12,13]])print(np.shape(k)) # 输出(3,5)表示矩阵为3行5列print(k.shape[0]) # shape[0]输出3,为矩阵的行数print(k.shape[1]) # 同理shape[1]输出列数5...
2021-07-12 10:35:22
4755
原创 Axure动作总结
Axure动作总结:(1)LINKSopen link / current window : 当前页打开页面或外部urlopen link/new window/tab: 新窗口打开页面或外部urlopen link / popup window : 弹出窗口打开页面或urlopen link /parent window :在parent window 里打开页面或urlclose window :关闭当前窗口open link in frame /inline frame : 在fra
2021-04-22 01:00:35
982
原创 Axure事件总结
Axure事件总结onClick-鼠标点击时触发onMouseEnter - 鼠标进入部件区域时触发onMouseOut - 鼠标移出部件区域时触发onDoubleClick - 双击时触发onContextMenu - 在部件点击右键时触发onMouseDown - 鼠标键按下时触发,注意和点击的区别,点击是松开了之后才触发onMouseUp - 鼠标键抬起时触发onMouseMove - 鼠标在部件范围内移动时触发onMouseHover - 鼠标在部件上悬停一段时间后触发onLo
2021-04-20 23:41:27
1394
原创 索引的应用场景
什么时候不要用索引,什么时候要用索引(1)什么场景不要用索引:1>数据更新性能比查询性能要求要高的情况下不要使用索引,因为数据的更新的同时索引也要进行维护和更新(加了索引查询快但更新就会慢);2>不要盲目的给表建太多索引,因为索引本身的存储也要占用存储空间,一旦更新操作频繁反而降低新性能;3>不要给不经常使用的列建索引,不怎么查询还建索引干嘛;4>不要给高重复值的列建索引,索引本身就是为了提高查询速度,然而数据值高度重复,数据区别性不高,索引起不了效果)(比如说:性别);
2021-01-14 16:46:53
2266
1
原创 人间四月天
转眼间,人间四月至,芳菲尽,却还残留着冬天的些许寒气,不能让人尽情享受这春光无限。我也一样,新一年立下的flag也迟迟没有启动,像一个被滞留在冬天的大树,虽孕育新生,但看上去却依然干枯。 我做事可能真的有点三分钟热度,上班一年就想辞职,上班3天就想休息,上班8小时就想下班,喝不了鸡汤,迎合不了领导,经不起无聊扯淡,受不了敷衍,就这样,可能真的成不了一个合格听话的员工,其实自己也是比较煎熬痛苦的...
2020-04-01 16:18:21
282
原创 java builder模式
java builder模式主要是用一个内部类去实例化一个对象,避免一个类出现多个构造函数,并且构造函数如果出现默认参数,就比较容易出错。不直接生成想要的对象,而是让客户端利用所有必要的参数调用构造器,得到一个builder对象,然后客户端在builder对象上调用类似于setter的方法,来设置每个相关的可选参数,最后客户端调用无参数的build方法来生成不可变的对象。public clas...
2019-03-21 15:57:42
321
转载 mybatis动态创建表
转自:https://www.cnblogs.com/Joanna-Yan/p/9187538.html 项目中业务需求的不同,有时候我们需要动态操作数据表(如:动态建表、操作表字段等)。常见的我们会把日志、设备实时位置信息等存入数据表,并且以一定时间段生成一个表来存储,log_201806、log_201807等。在这里我们用MyBatis实现,会用到动态SQL。动态SQL是Mybatis的...
2019-03-06 15:10:46
15947
7
转载 Kaggle爆文:一个框架解决几乎所有机器学习问题
转自https://blog.youkuaiyun.com/gh13uy2ql0N5/article/details/78293745
2019-01-24 14:43:34
356
转载 决策树--信息增益,信息增益比,Geni指数的理解
转自:https://www.cnblogs.com/muzixi/p/6566803.html决策树 是表示基于特征对实例进行分类的树形结构 从给定的训练数据集中,依据特征选择的准则,递归的选择最优划分特征,并根据此特征将训练数据进行分割,使得各子数据集有一个最好的分类的过程。 决策树算法3要素: 特征选择 决策树生成 决策树剪枝 部分理解:...
2019-01-18 15:18:33
1967
转载 【集成学习】sklearn中xgboost模块的XGBClassifier函数
转自:https://www.cnblogs.com/pengwang52/p/9623093.html# 常规参数booster gbtree 树模型做为基分类器(默认) gbliner 线性模型做为基分类器 silent silent=0时,不输出中间过程(默认) silent=1时,输出中间过程 nthread nthread=-1时,使用全部CPU进行并...
2019-01-18 10:10:27
1258
转载 超全的机器学习&深度学习资料汇总,惠存!
转自:http://blog.sina.com.cn/s/blog_53a510ad0102vl7o.html
2018-12-22 12:22:02
443
原创 批量合并TXT文件为一个文件
import importlib,sysimportlib.reload(sys)import osimport os.pathimport timetime1=time.time()##########################合并同一个文件夹下多个txt################def MergeTxt(filepath,outfile): k = open(fi...
2018-12-20 11:51:52
1420
1
原创 python3 reload(sys)错误提示
python2.x中:import sys reload(sys) sys.setdefaultencoding(‘utf-8’) python3.x中:import importlib,sys importlib.reload(sys)
2018-12-20 11:49:16
13780
2
转载 关于Maven项目build时出现No compiler is provided in this environment的处理
关于Maven项目build时出现No compiler is provided in this environment的处理很详细,很有效,赞
2018-10-15 15:44:48
437
转载 解决Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1:compile (default-compile
解决Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1:compile (default-compile) on project autotest_fchtgl: Compilation failure的方法https://www.cnblogs.com/shenrong/p/7129210.html...
2018-10-15 15:40:42
2986
原创 数据结构--树
(1)树的简介 树是一种非线性数据结构,是由n(n>=0)的结点组成的有限集合。 当n==0时,为空树 当n>0,树包含根节点和子树,根节点只有后继没有前驱。 ...
2018-07-27 10:06:51
200
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人