- 博客(28)
- 收藏
- 关注
原创 PyCharm中DataFrame对象类不出代码提示
此代码的pd是给pandas包起的别名,我刚开始搜的一个解决方案要在外面添加‘’,试了一下不行。我又试了一下pandas.DataFrame,也还是不行,最后注意到代码中 pandas as pd,试了一下pd.DataFrame发现是可行的,解决不了的大家可以多试几次。最近在学习pandas,写代码时发现DataFrame对象后面不智能的出代码提示了,给写程序造成了困难,经过网上搜索以及多次实验,找到了解决办法。
2022-09-07 09:55:23
1406
1
原创 RANSAC(随机采样一致性)
如下图所示,由于最小二乘法拟合数据的时候是考虑所有的数据,所以最小二乘法的误差较大,而RANSAC算法是将那些噪声点设为离群点,就像下图中偏离中心的那些点,所以RANSAC得到的结果准确度较高,所以RANSAC的效果总是远优于最小二乘法。1、他计算参数的迭代次数没有上限,如果设置迭代次数的上限,得到的结果可能不是最优的结果,甚至可能得到错误的结果。RANSAC是一种思想,一个求解已知模型的参数的框架,它并不限定某一特定的问题。6、比较哪次计算中内群数量最多,内群最多的那次所建的模型就是我们所要求的解。...
2022-07-19 22:29:26
1519
原创 K-Means聚类算法
分类与聚类分类:分类其实是从特定的数据中挖掘模式,做出判断的过程。聚类:将数据集中在某些方面相似的数据成员放在一起,这些数据是没有标签的,是无监督学习。聚类的目的也是把数据分类,但是事先不知道如何去分的,完全是算法自己来判断各条数据之间的相似性,相似的就放在一起。聚类算法分为三类:原型聚类、层次聚类、密度聚类K-M...
2022-06-24 09:39:58
1310
原创 Canny边缘检测算法
Canny是目前最优秀的边缘检测算法,其目标为找到一个最优的边缘,其最优边缘的定义为:实现:1、对图像进行灰度化2、对图像进行高斯滤波:根据待滤波的像素点及其领域点的灰度值按照一定的参数规则进行加权平均。这样可以有效滤去理想图像中叠加的高频噪声高斯平滑高斯平滑水平和垂直方向呈现高斯分布,更突出了中心点在像素平滑后的权重,相比于均值滤波而言,有着更好地平滑效果。重要的是需要理解,高斯卷积核大小的选择将影响Canny检测器的性能:尺寸越大,检测器对噪声的敏感度越低,但是边缘检测的定位误差也将略有增加,一般5*5
2022-06-21 09:48:37
4260
原创 边缘检测原理
什么是边缘?图像的边缘是指图像局部区域亮度变化显著的部分,该区域的灰度剖面一般可以看作是一个阶跃,即从一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。边缘有正负之分,就像导数有正值也有负值一样:由暗到亮为正,由亮到暗为负求边缘幅度的算法:sobel,Roberts,prewitt,Laplacian,Canny算子...
2022-06-18 09:46:03
13065
1
原创 特征选择&特征提取
在一些实际问题中,我们得到的样本数据都是多个维度的,即一个样本是用多个特征来表征的。比如在房价预测的问题中,影响房价y的因素有房子面积x1,卧室数量x2等,我们得到的样本数据就是(x1,x2)这样一些样本点,这里的x1和x2又被称为特征。...
2022-06-16 09:39:22
1619
原创 滤波&&卷积的基本概念
线性滤波是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果。卷积的原理与滤波类似。但是卷积却有着细小的差别。卷积操作也是卷积核与图像对应位置的乘积和。但是卷积操作在做乘积前,需要先将卷积核翻转180度,之后再做乘积。...
2022-06-15 10:58:11
1742
原创 最邻近插值算法、双线性插值算法的原理及实现
上采样与下采样缩小图像(下采样或降采样)的主要目的有两个:1、使得图像符合显示区域的大小;2、生成对应图像的缩略图。放大图像(上采样)的主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。上下采样时,图像的放大与缩小,需要保持图像不失真,这时需要用到插值算法。...
2022-06-06 16:23:16
2318
原创 图像的灰度化和二值化
1、灰度化RGB模式的图片转化为灰度图的方式:需要注意的是下图中的第一种处理方法RGB的三个数值要对应,后面的代码用opencv时,图像导入的是BGR,这个时候就要注意乘的数值不要弄错。2、二值化二值化就是将RGB值转化为0或者1。完整代码:效果展示: 下图中的第一行的右边是灰度化的结果,第二行是二值化的结果。
2022-06-02 18:07:45
2331
原创 数字图像基础知识
1、图像像素:像素是分辨率的单位。像素是构成位图图像最基本的单元,每个像素都有自己的颜色。分辨率(解析度): 灰度:表示图像像素明暗程度的数值,也就是黑白图像中点的颜色深度。范围一般为0-255。白色为255,黑色为0。通道:把图像分解成一个或者多个颜色成分:对比度:指不同颜色之间的差别。对比度=最大灰度值/最小灰度值2、RGB模型色彩三原色(CMYK):品红、黄、青光学三原色(RGB):红、绿、蓝 3、RGB值转化为浮点数 opencv大坑之BGR:opencv对于读进来的图片的通道排列
2022-06-02 09:09:03
1266
原创 数据分析概述
数据分析流程:数据获取、数据处理、数据分析、数据可视化Excel分析优势:1、对单数据源(单表格)数据分析非常灵活,方便2、操作简单,分析方法可复制性强,对业务方指导性强Excel分析劣势:1、对多数据源(多表格)数据分析时较为麻烦,低效率2、对大数据量数据源分析时容易发生卡顿、报错Python分析优势:1、可读性文字编写的语言之一,学习难度较小2、数据可视化、数据分析的工具包丰富,分析效率高互联网数据分析的基本思路描述性分析通过计算数据的集中性特征和
2022-06-01 09:58:22
771
原创 SIFT(尺度不变特征变换)算法
下图中的金字塔分为好几组,最下面一组是用不同大小的高斯核对原图像进行卷积操作得到的一组图片,倒数第二组的图片是对刚才的第一组的第三层的图片进行降采样,降采样后图片尺寸缩小了,缩小后再用不同尺度的高斯核进行卷积操作,然后得到图中倒数第二组的一组图片。图像金字塔是一种以多分辨率来解释图像的结构,通过对原始图像进行多尺度像素采样的方式,生成N个不同分辨率的图像,把具有最高级别分辨率的图像放在底部,以金字塔形状排列,往上是一系列像素逐渐降低的图像,一直到金字塔的顶部只包含一个像素点的图像。...
2022-05-15 10:01:52
3244
原创 NLP(三)——语言模型
目录Language ModelUnigramBigramN-gram评估语言模型PerplexitySmoothingAdd-one SmoothingAdd-KSmoothingInterpolationGood-Turning SmoothingLanguage Model语言模型用来判断一句话是否从语法上通顺。UnigramUnigram模型假定各个部分相互独立,此种模型下概率计算会相对简单,但是存在问题:下图中的第二个概率和...
2022-05-10 20:59:39
3344
原创 NLP(二)——文本表示
接上文继续总结,上篇文章主要总结了文本的一些处理算法,这篇文章主要总结文本如何进行表示。目录一、Word Representation1、单词的表示one hot representation(one hot encoding)2、句子的表示1)boolean方法2)count based representation二、计算两个句子之间的相似度1、欧式距离2、余弦相似度3、tf-idf表示方法三、计算两个单词之间的相似度词向量(Word Em...
2022-05-06 09:58:46
1323
1
原创 NLP(一)——文本处理
近期在阅读跨模态检索相关论文时,碰到很多处理文本的网络结构以及一些名词不是很了解,通过我的学习现在将这些知识点记录总结。本文中出现的图片来自于我学习的视频截屏:https://www.bilibili.com/video/BV1BR4y1g7LM?p=25&spm_id_from=pageDriver文本处理的流程1、Word Segmentation(分词)分词工具:Jieba分词(常用),SnowNLP,LTP,HanNLP。当jieba本身词库中没有一些我们想要的词组的时候
2022-05-03 18:04:33
3736
原创 跨模态检索
目录一、定义二、分类基于特征表示方法基于图文匹配的方法三、相关概念四、相关网络结构五、相关文献一、定义通过一种模态样本来检索具有近似语义的另一种模态样本。 跨模态学习是多模态学习的分支。 跨模态检索训练过程中所有模态的数据都存在,但在测试过程中只有一种模态可用。 挑战:如何度量不同模态数据之间的内容相似性,也称之为异质鸿沟问题。二、分类基于实值表示学习:提升跨模态语义相关性,进而提高跨模态检索准确度。 基于二进制表示学习:提升跨模态图文检索效率,减少
2022-04-22 13:56:10
8084
原创 算法作业——ACM斐波那契博弈
总结算法汇报作业——取石子游戏 算法题目 取石子游戏1堆石子有n个,两人轮流取.先取者第1次可以取任意多个,但不能全部取完.以后每次取的石子数不能超过上次取子数的2倍。取完者胜.先取者负输出"Second win".先取者胜输出"First win".题目来自杭电ACM题库:http://acm.hdu.edu.cn/showproblem.php?pid=2516此题目的算法大背景是博弈论,这道题目是斐波那契博弈模型,之所以称作斐波那契博弈是因为这个模型的必败态是斐波那契数,也就..
2020-12-06 16:23:00
598
原创 模式识别作业-线性分类器设计总结
刚刚做完线性分类器的作业,趁热打铁做下总结。 摘要 模式识别的目的是要在特征空间中设法找到两类(或多类)之间的分界面。基于样本直接设计分类器需要确定三个基本要素:一是分类器即判别函数的类型,也就是从什么样的判别函数(函数集)中去求解;二是分类器设计的目标或准则,在确定了设计准则后,分类器设计就是根据样本从事先决定的函数集中选择在该准则下最优的函数,通常就是确定函数类中的某些待定参数;三是在前两个要素明确后,如何设计算法利用样本数据搜索到最优的函数参数(即选择函数集中的函数)。这次...
2020-12-05 19:52:33
3921
1
转载 Linux和win7双系统模式下 忘记win7开机密码的解决办法
亲测有效,故在此转载一下。转载自:https://blog.youkuaiyun.com/ningfuxuan/article/details/7513814 首先登陆linux系统,在linux 系统下找到win7系统的安装盘(比如为C盘), (1)进入到C://windows/system32下 找到osk.exe 文件,并将其剪切到其他的地方(记住这个地方,后面还会将此文件粘贴回来的) (2)将C://
2020-10-09 09:42:52
436
原创 本科毕业设计——基于云存储的物联网安全数据的爬取
本科毕设已经过去一年多,由于考研的原因,当时没有把做毕设的过程记录下来,这篇文章主要是对自己本科毕设的一个回顾和总结。题目:基于云存储的物联网安全数据的爬取当时看到题目,我就把毕设该做的工作分为了两个部分。设计爬虫,爬取网站上的数据。在还没有实现云存储的时候,暂时先将数据存储到非关系型数据库MongoDB上,至于为什么存储到非关系型数据库,后面再介绍。将数据存储到Hadoop平台上,实现云存储。当设计好爬虫,能爬取到网站上的数据时,搭建Hadoop环境,将爬取到的数据存储到Hadoop.
2020-10-08 14:47:40
1073
1
原创 Start again
许久没有打开博客,今天登录看到自己以前发表的博客,不禁很感叹时间流逝的飞快,而自己也没有坚持下来写博客的习惯。原因就是这两年一直在准备考研,2018年9月准备第一次考研,意料之中的失败了。紧接着2019年的5月份,我一边准备着毕业设计论文,一边准备着考研。本应在2020年3月份就出的考研录取结果,硬生生的被疫情拖到了7月份,然后就是紧接着的9月份入学,直到现在我坐在梦想院校的实验室里,才意识到原来都过去两年了,这两年过的是如此之快。两年一直都在为同一个目标努力着,忽略了很多事情,也抛弃了很多事情,不过还好我
2020-10-07 20:03:15
243
3
原创 BeautifulSoup模块的安装
BeautifulSoup是python的第三方库,用于从HTML或XML中提取数据。下面将介绍如何安装BeautifulSoup这个模块。官网:https://www.crummy.com/software/BeautifulSoup/官网中提供了一个pip的方法进行安装。1、首先打开Eclipse来测试一下这个模块是否存在打开Eclipse,在test(上个文章介绍了...
2019-03-29 09:36:08
771
原创 Eclipse中书写python程序
eclipse中也可以写python程序,但是首先要在eclipse中集成python的环境,至于怎么集成,请参考我上一篇文章。下面将重点介绍如何在eclipse中写python程序。点击File->new->Project,在弹出的对话框中点击PyDev Project,然后点击next,给程序起个名字,最后点击finish就完成了。完成后如下图...
2019-03-28 16:04:27
3093
原创 Eclipse中集成python环境
今天在学习python的时候,发现用Eclipse也可以写python语句,只不过需要在Eclipse中集成一下python的环境。详细步骤1、 安装python环境 首先确保你的电脑已经安装了python,在官网上下载,然后进行环境变量的配置,此步骤在百度上可以搜到详细的教程,故在此不再作详细介绍。2、安装eclipse 在官网进行下载,eclip...
2019-03-28 15:36:08
833
转载 java新手学习路线
Java学习新手,从网上看到这篇文章,觉得对自己很有用,所以就转载了下来,希望能帮助到和我一样正在学习中的人。转自:http://tieba.baidu.com/f?kz=692446591怎么学习Java,这是很多新手经常会问我的问题,现在我简单描述下一个Java初学者到就业要学到的一些东西: 首先要明白Java体系设计到得三个方面:J2SE,J2EE,J2ME(KJAVA)。J...
2018-07-20 18:40:40
221
原创 第一篇博客
今天刚开通了博客,记得从大一的时候就听老师讲过这个博客,说从现在起把你 每天的事情代码记录下来,等你毕业了,就是满满的经验和财富了。然而当时的我只是把这些话从左耳朵到右耳朵过滤了一遍,压根没放在心上。转眼间,我已经大三了,不考研的我从两个月前就开始准备找工作需要的各种东西,我不想比别人起点晚,可能现在已经晚了,但我想你尽早开始积累工作经验。 大学期间,虽然接触了许多计算机专业...
2018-05-17 17:42:13
199
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人