- 博客(29)
- 资源 (2)
- 收藏
- 关注
转载 每日一学 kappa系数
1.定义 Kappa系数用于一致性检验,也可以用于衡量分类精度,kappa系数的计算是基于混淆矩阵的。2.具体例子3.具体指标的分析kappa计算结果为-1~1,但通常kappa是落在 0~1 间第一种分析准则--可分为五组来表示不同级别的一致性:0.0~0.20极低的一致性(slight)0.21~0.40一般的一致性(fair)0.41~0.60 中等的一致性(moderate)0.61~...
2018-04-21 23:53:29
37352
4
原创 每日一学 Scale和Normalization
kaggle上的数据清洗教程第二天---Scale和Normalization(不知道如何翻译会比较好,参考了其他博客,scale为缩放,normalization 为正则化)1.Scale1.1 粗略理解 将数据转为为特定范围的数据,比如(0,1)或者(0,100)1.2 例子 a.对于SVM和KNN方法,由于涉及数据点之间的距离度量,则需要对数据进行scale,使得任何特征中的“1...
2018-04-15 17:31:50
3535
转载 归一化的好处及归一化,标准化的处理方法
归一化后有两个好处1. 提升模型的收敛速度 如下图,x1的取值为0-2000,而x2的取值为1-5,假如只有这两个特征,对其进行优化时,会得到一个窄长的椭圆形,导致在梯度下降时,梯度的方向为垂直等高线的方向而走之字形路线,这样会使迭代很慢,相比之下,右图的迭代就会很快(理解:也就是步长走多走少方向总是对的,不会走偏)2.提升模型的精度 归一化的另一好处是提高精度,这在涉及到一些距离计算...
2018-04-15 17:00:59
63675
3
原创 每日一学--如何处理缺失值
https://www.kaggle.com/rtatman/data-cleaning-challenge-handling-missing-values今天学习kaggle上的缺失值处理课程,学习记录,可能不太严谨,请指正。1.观察观察几个样本数据或者所有数据有无NaN 或者None 1.1读取数据,显示数据,肉眼观察1.2 python中用下列方法 a.data.isnull( ...
2018-04-14 22:09:19
4142
原创 找不到OneNote2016怎么办?
问题:在设置里输入OneNote2016,只找到OneNote,没有OneNote2016解决方案:1.如果没有安装过,或者系统没有自带OneNote2016的话,可以到360安装宝库下载OneNote2016,安装之后再搜索栏可以搜到,如下图2.如果系统自带,并且使用过,只是暂时找不到OneNote2016图标的话,可以采用快捷键呼出OneNote2016 【win+N】会出现OneNote20...
2017-12-30 10:03:16
9493
原创 《机器学习实战》第十章
import numpy as np# read datadefloadData(filename): fr = open(filename) dataMat = [] for line in fr.readlines():readlines readline 是读下一行 readlines 是遍历所有行
2017-12-24 11:42:24
980
2
转载 python3 中map和python2中 map的区别,超级实用
Python3中map函数在Python2中map函数会返回一个list列表,如代码:[python] view plain copy>>> def f(x, y): return (x, y) >>> l1 = [ 0, 1, 2, 3, 4, 5, 6 ] >>> l2 = [ 'Sun', 'Mon', 'Tue', 'We
2017-12-14 11:11:30
5371
原创 attributeerror :module ‘numbers’has no attribute integral
attributeerror:module ‘numbers’has no attribute integral原因在于在同一个文件下生成numbers.py文件,执行操作的时候就调用numbers.py文件,而非python工具包里的模块【折腾了好久呢~—~】import matplotlib.pyplot as plt input_values = [1,2,3,4,5]squ
2017-12-06 19:50:05
2274
3
原创 python安装的一个小技巧
python安装,不需要在cmd里找到文件路径,通过安装包所在的文件路径下进行操作文件---打开windows powershell(个人觉得相当于打开cmd)---是否以管理员身份打开,就根据安装要求了打开windows powershell后,直接输入 pip3 install XXXXXX非常方便!
2017-12-06 15:43:53
272
原创 小白学习ppt---珞珈carlos
1.ppt封面1.1其实我个人觉得最简单的封面最动人,作者说的地球海构成的背景封面觉得略复杂,审美疲劳喔1.2他说的封面标题倒是挺好的,字体 微软雅黑,排版,重点信息放大字体,加粗,最后加个方框,再来一行英文,看上去真的好看多了!1.3推荐的网站和书籍
2017-11-23 15:58:50
6395
原创 《算法图解》第九章 动态规划
第九章 动态规划用表格法进行找最优方案背包问题的最优方案出去玩带东西的最优方案对于字典查词的话,如果输入有误的话,比较俩个单词的相似性,可以用最长公共子串,不同的为零,相同的把左上方的值再加1导入当前的格子里,(为什么要引入最长公共子串呢及接着引出最长公共子序列呢),最长公共子序列,字母不同的话,就选择左边和上边格子里数值大的那个,相同的话,就是选完左边和上边格子里值大的然后再加1
2017-11-16 10:43:05
897
原创 《算法图解》第六章 广度优先搜索
第六章 广度优先搜索 breadth first search BFS广度优先搜索让你能够找出两样东西之间的最短距离,不过最短距离的含义有很多!使用广度优先搜索可以: 编写国际跳棋AI,计算最少走多少步就可获胜; 编写拼写检查器,计算最少编辑多少个地方就可将错拼的单词改成正确的单词,如将READED改为READER需要编辑一个地方; 根据你的人际关系网络找到关系最近的医生。
2017-11-16 09:53:19
502
原创 第七章 狄克斯特拉算法
第七章 狄克斯特拉算法7.1使用狄克斯特拉算法7.2术语7.3换钢琴7.4负权边7.5实现7.6小结7.1使用狄克斯特拉算法从第六章的问题,引入,如果我们不只是算从A到B的最短路径,还要算最快到达,完成其中每一段路径都需要时间,我们给每段路径都加上时间,每条边乘上时间算最后的总和,才知道哪一条路径是最快的----图论里的问题就是从无全图变为有权图7.2术语
2017-11-16 08:57:40
1054
原创 《算法图解》第十章K近邻算法
第十章 k近邻算法例子讲解的非常到位,但是具体的算法并不详细,主要是兴趣引导过程10.1橙子还是柚子10.2创建推荐系统10.2.1. 特征抽取10.2.2回归10.2.3挑选合适的特征10.3机器学习简介1.ocr2.创建垃圾邮件过滤器3.预测股票市场10.4小结10.1橙子还是柚子根据水果个头和颜色去判断一个新的水果是橙子还是柚子,处于模
2017-11-15 20:25:51
543
原创 《算法图解》第八章 贪婪算法
第八章 贪婪算法目录8.1教室调度问题8.2背包问题8.3集合覆盖问题近似算法8.4NP-Hard完全问题8.4.1旅行商问题详解8.4.2如何识别NP-hard完全问题8.5小结8.1教室调度问题有很多门课,上课的时间和时长可能会交叉,那要怎么安排在某间教室的课程安排,且最大程度利用好这间教室呢?---按课程时间选出不冲突的,比如9:00--10:
2017-11-15 10:26:01
1662
原创 《算法图解》第五章散列函数和散列表
1.散列表能够快速地查找到要的数据,且不重复。1.1散列函数无论给散列函数什么,他都返回一个数字---将输入映射到数字a.必须是一致的,比如输入“apple”,输出“1”,就不会输出其他的了b.它将不同的输入映射到不同的数字,这是最好的情况c.散列函数知道数组有多大,只返回有效的索引,如果数组只包含5个数字,不可能返回无效索引1002.散列表--包含额外逻辑的数据结构使
2017-11-13 16:53:59
946
原创 《算法图解》第四章快速排序
1.先介绍了快速排序的思想:分而治之DC(divede and conquer)2.引入例子加强理解def quicksort(arr): if len(arr)基线条件 return arr else: pivot = arr[0] less=[i for i in range[1:] ifarr[i]
2017-11-13 10:07:43
485
原创 《算法图解》第三章选择排序
第三章 递归1.递归的思想,是调用自己的函数2.如果使用循环,程序的性能可能更高,如果使用递归,可能更容易理解,阶数,5!def fact(x): if x==1: return else x*fact(x-1)3.基线条件和递归条件每个递归函数分为两部分,基线条件和回归条件,基线条件是避免循环不停止(无限循环),不调用递归函数了,递归函数是调用
2017-11-12 17:50:12
388
原创 《算法图解》第二章数组和链表
1.数组和列表能够存储大量数据2.1链表中的元素可存储在内存的任何地方。 2.2使用链表时,根本就不需要移动元素 2.3在需要读取链表的最后一个元素时,你不能直接读取,因为你不知道它所处的地址,必须先访问元素#1,从中获取元素#2的地址,再访问元素#2并从中获取元素#3的地址,以此类推, 所以链表只能顺序访问,不能随机访问,即跳跃访问,而数组支持随机访问和顺序访问4.插入,读取
2017-11-12 15:47:45
288
原创 《机器学习》第七章笔记
第七章贝叶斯分类器1.贝叶斯决策论,是在概率框架下实施决策的基本方法2.对分类任务来说,贝叶斯决策论考虑如何基于这些概率和误判损失函数来选择最优的类别标记3.总体思想是让每一个分类器的风险最小,这样算期望的时候也最小4.贝叶斯分类器:h=argmin错误即损失λ×后验概率P(c|x)5.要估计后验概率有两种策略,判别式模型,给定x,对p(c|x)进行建模,常见的
2017-11-08 11:27:33
428
原创 matlab里svd(Y,'econ')
Y=randn(m,n)%m>n[u,s,v]=svd(Y)u:m*m s:m*nv:n*n[u1,s1,v1]=svd(Y,'econ')u1:m*ms1:m*mv1:n*m‘econ’economic size,相当于把多余的部分去除掉了、根据截图的结果能清楚地明白‘econ’的作用了
2017-10-23 11:09:22
8317
原创 《算法图解》第一章学习
第一章1.二分法查找其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步,而简单查找最多需要n步。(讲的非常详细,易于理解)
2017-10-23 08:47:48
1402
原创 凸优化学习笔记6.3
在正则化逼近的基本形式中,我们的目标是寻找向量x使得其值比较小(如果可能的话),同时使得残差Ax-b小,自然地,这可以描述为双目标的凸向量问题,这两个目标是||Ax-b||和||x||:这两个范数可能是不同的,第一个在R^m中,用以度量残差的规模,第二个在R^n中,用以度量x的规模 可以用多种方法找到两个目标之间的最优权衡,然后会
2017-10-10 16:26:11
460
原创 凸优化学习笔记6.1
第六章 逼近与拟合6.1范数逼近1)无约束问题min ||Ax-b||范数逼近问题的解有时又被称为Ax≈b在范数|| ||下的近似解r = Ax - b 称这个问题的残差逼近解释通常将Ax表示为Ax = x1a1+x2a2+x3a3+...+xnan,其中a1,...an是A的列,可以看出,范数的逼近问题的目标是用A的列线性组合,尽可能地逼近或拟合向量b,其偏差
2017-10-10 10:15:11
2277
1
原创 word在合并单元格后不能输入文字
1.https://support.microsoft.com/zh-cn/help/4011039/september-5-2017-update-for-word-2016-kb4011039点开第一个链接,先看下bug说明,有个更新程序出现问题2.然后往下看,有解决方法,点开链接https://support.microsoft.com/zh-cn/help/4011140/oc
2017-10-08 16:48:54
6781
原创 《PPT高手之路》学习1
类型注重点适用场景特点1.演讲型注重形式展现各式发布会,TED演讲或其他会议1)背景简洁,通常使用纯色或者同色系渐变为主2)信息明了。一般幻灯片只有1--2个信息点,整体结构大致由3--4部分组成3)字体也多以微软雅黑等非衬线字体为主2.阅读型注重信息呈现
2017-10-01 10:26:08
1099
原创 为什么要对信号加窗
最初的理解,加窗的话,因为实际中的信号是无限长的,这样的计算不可行也没有实际意义。因此会把信号分成许多一定长度的数据段,然后分段处理。如果把数据进行分段,相当于对信号进行了加矩形窗的处理,增大对高频分量的衰减。【不理解为什么要增大高频分量的衰减】网络上的问题:lz:我看到说加窗是为了截取信号的某一截问题一:如果我采集了32K的点,那不就已经是有限的点数了吗?问题二:原始数据*窗函数
2017-09-26 19:52:54
36322
5
现代通信系统使用matlab代码-约翰普罗克斯
2019-05-04
图像曲线拟合理论及其应用
2019-01-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人