自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 2020-12-10---类型转换

类型转换 注意点 不能对布尔值进行转换 不能把对象类型转换为不相干的类型 在把高容量转换到低容量的时候,强制转换 转换的时候可能存在内存溢出,或者精度问题 System.out.println((int)23.7); // 23 System.out.println((int)-45.89f); //-45 char c = 'a'; int d = c+1; System.out.println(d);//98 System.out.println((char)d);//b // 操作比较大的数的时

2020-12-13 10:03:24 239

原创 一些ML的经验

特征比数据量还大时,选择什么样的分类器? 线性分类器,因为维度高的时候,数据一般在维度空间里面会比较稀疏,很有可能线性可分 对于维度很高的特征,你是选择线性还是非线性分类器? 理由同上 对于维度极低的特征,你是选择线性还是非线性分类器? 非线性分类器,因为低维空间可能很多特征都跑到一起了,导致线性不可分 下面是吴恩达的见解: 如果Feature的数量很大,跟样本数量差不多,...

2019-06-09 15:59:57 776

原创 过拟合

原因 样本数据问题 样本数量太少; 抽样方法错误,抽出的样本数据不能有效足够代表业务逻辑或业务场景。比如样本符合正态分布,却按均分分布抽样,或者样本数据不能代表整体数据的分布; 样本里的噪音数据干扰过大; 模型问题 模型复杂度高 、参数太多; 训练过度; 权值学习迭代次数足够多(Overtraining),拟合了训练数据中的噪声和训练样例中没有代表性的特征. 解决方式 数据方面 增加训练...

2019-06-09 15:25:45 190

原创 特征工程

特征工程 https://blog.youkuaiyun.com/qq_39521554/article/details/78877505 https://blog.youkuaiyun.com/u010358304/article/details/80693541 数据的预处理 为什么需要数据的预处理? 不属于同一量纲:即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。 信息冗余:对于某些定...

2019-06-05 18:07:54 185

原创 1、二维数组中的查找

note:从最右上角开始。大于:row=row+1,小于:col = col-1 public class Solution { public boolean Find(int target, int [][] array) { // 获取数组的shape int row = array.length-1; int col = array...

2019-06-04 19:33:31 164

原创 堆内存和栈内存

为什么有堆内存和栈内存? 如何让垃圾回收机制回收一个数组所占的内存空间? 数组长度发生变化? public class test{ public static void main(String[] args){ //静态初始化数组a int[] a = {5,7,20}; //动态初始化数组b int[] b = new int[4]; System.o...

2019-06-04 16:12:08 225

原创 面向对象

面向对象的三种特性: 1、继承(java不支持多继承) 实现软件复用的重要手段。当子类继承父类后,子类作为一种特殊的父类,将直接获得父类的属性和方法。 2、封装 将对象的实现细节隐藏起来,然后通过一些公用方法来暴露该对象的功能。 3、多态 子类对象可以直接赋给父类变量,但运行时依然表现出子类的行为特征。这意味着同一类型的对象在执行同一个方法时,可能表现出多种行为特征。 面向对象对于软...

2019-05-30 11:33:08 157

原创 Java运行机制

由Java语言编写的程序需要经过编译步骤,但是这个编译步骤并不会生成特定平台的机器码,而是生成一种与平台无关的字节码(××.class文件),这种字节码不是可执行的,必须使用java解释器来解释执行。先编译,后执行。 ...

2019-05-30 09:13:15 160

原创 排序

总结: 插入、冒泡排序的速度较慢,但参加排序的序列局部或整体有序时,这种排序能达到较快的速度。反而在这种情况下,快速排序反而慢了。 当n较小时,对稳定性不作要求时宜用选择排序,对稳定性有要求时宜用插入或冒泡排序。 若待排序的记录的关键字在一个明显有限范围内时,且空间允许是用桶排序。 当n较大时,关键字元素比较随机,对稳定性没要求宜用快速排序。 当n较大时,关键字元素可能出现本身是有序的,对稳定...

2019-05-30 09:11:55 183

原创 ML模型特点以及区别

线性回归 优点: 1、简单,运算速度块 2、可以根据系数对变量做出解释 缺点: 1、对异常值敏感 LR 优点: 1、形式简单,可解释性好 2、模型效果好 3、训练速度快 4、资源占用少,尤其是内存 5、方便输出结果的调整(人工设定阈值) 缺点: 1、准确率可能并不是很高 2、很难处理数据不平衡的问题 3、处理非线性数据麻烦 4、LR本身无法筛选特征 5、对异常值敏感 SVM 优点: ...

2019-05-30 09:09:59 5819

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除