
【其他】
文章平均质量分 82
haoji007
机器学习爱好者
展开
-
避坑指南:Zotero的文件管理与同步zotfile、webdav
如果希望保留zotfile在第一步rename and move之后生成、只包含附件文件的文件夹,可以单独保存。如果没有该需求,可以在工具-管理附件-转换为已链接为已存储文件的后续命令中,勾选“存储后删除原始文件”。转载 2022-10-31 21:16:34 · 6240 阅读 · 0 评论 -
多分类-- ROC曲线和AUC值
方法2:首先,对于一个测试样本:1)标签只由0和1组成,1的位置表明了它的类别(可对应二分类问题中的‘’正’’),0就表示其他类别(‘’负‘’);在训练完成后,计算出每个测试样本的在各类别下的概率或置信度,得到一个[m, n]形状的矩阵P,每一行表示一个测试样本在各类别下概率值(按类别标签排序)。相应地,将每个测试样本的标签转换为类似二进制的形式,每个位置用来标记是否属于对应的类别(也按标签排序,这样才和前面对应),由此也可以获得一个[m, n]的标签矩阵L。print '超参数:', model.C_转载 2022-09-10 09:26:09 · 2163 阅读 · 0 评论 -
文献管理软件Zotero配置及常用插件安装使用
第二个是根目录的设置,这里的更目录选择的是Zotero文件夹的绝对位置,这里设置好以后之后的其他文件都会以该路径作为相对路径,而将这个绝对路径设置在OneDrive同步盘路径下就可以通过OneDrive盘实现同步(简而言之这个路径设置为OneDrive路径下的Zotero文件夹路径,需要先在OneDrive文件夹中创建”Zotero文件夹“)。在文献下载页面点击该插件可直接对文献进行下载,多篇文献出现时该插件图标变为下图文件夹形式,可选择自己需要的文献下载,单篇文献时直接下载,具体可自行体验。......转载 2022-08-28 15:16:39 · 13881 阅读 · 0 评论 -
免费GPU~Colab基本使用及配置(保姆级教程)
话不多说直接甩图,看看白嫖的GPU配置如何!!!这对没钱的学生可谓是天花板了把~~~跟着我一步一步操作,你也可以的!0.创建一个谷歌账号并且登录使用Colab之前需要有一个谷歌账号,并且可以上网,否则,哼,啥都别想!可关注公众号"蓝胖胖干货",按照菜单栏的指引操作(不要问我怎么知道的)(为什么不用电脑注册呢?也不用问了,都是自己亲身经历出来的) 此处略去一千个字!!!!1.登陆谷歌云盘确保可以上网之后,输入网址https://drive.google...转载 2022-05-23 23:09:21 · 3976 阅读 · 1 评论 -
机器学习中的kNN算法及Matlab实例
原文转自:http://blog.youkuaiyun.com/baimafujinji/article/details/6496222一、 引言K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。尽管kNN算法的思想比较简单,但它仍然是一种非常重要的机器学习(或数据挖掘)算法。在2006年12月召开的..转载 2022-01-17 12:23:42 · 4040 阅读 · 0 评论 -
ENVI5.3安装教程(含软件下载)
重要提示:各位安装目录和授权文件存放目录一定不要有中文!!!!!软件下载地址链接:https://pan.baidu.com/s/1PkwCw1xsAfLmaCOCoSr0mg提取码:qlu8首先,软件下载后,里面包含了很多的文件(其中的“license.lic我们是不用的,用压缩包里的license5.3.lic文件”):接下来,我们点击“IDL_ENVI53SP1win64.exe“ 开始安装。在接下来弹出的是否拥有管理员页面时,选择“是”,进行下一步:软件..转载 2022-01-10 11:31:09 · 1441 阅读 · 0 评论 -
【两种方式】用python和ENVI画出高光谱遥感影像的3D立体图
前言在之前的一篇文章中,介绍了高光谱图像的特点和表达形式。高光谱图像最突出的一个特点拥有大量光谱波段,使得图像堆叠成一个超立方体。由于最近研究需要,想可视化展示HSI图像的3D立方体。于是,搜索了一些资料,展开了工作。以下是绘制的两种方式。一、使用python这种方法很简单,几行代码就可以搞定,废话不多说,直接上代码。需要的环境:spectral,ipython,matplotlibimport osimport scipy.io as siofrom spectral i转载 2022-01-10 11:00:33 · 11205 阅读 · 8 评论 -
face_recognition基础接口
face_recognition使用世界上最简单的人脸识别库,在Python或命令行中识别和操作人脸。使用dlib最先进的人脸识别技术构建而成,并具有深度学习功能。 该模型在Labeled Faces in the Wild基准中的准确率为99.38%。face_recognition 官方文档:https://pypi.org/project/face_recognition/ 1|1查找图片中的面孔 1 2 3 4 5...转载 2020-05-29 03:30:14 · 4256 阅读 · 0 评论 -
基于内容的图像检索技术:从特征到检索
基于内容的图像检索(CBIR, Content Based Image Retrieval)是相对成熟的技术领域,在工业界也有广泛的应用场景,如搜索引擎(Google、百度)的以图搜图功能,各电商网站(淘宝、Amazon、ebay)的相似商品搜索,社交平台(Pinterest)的相似内容推荐等。本文从图像检索流程出发,结合我们团队在社交应用中的相似图片、视频检索中的实践经验,介绍构建基于内容的图像检索系统所涉及的算法技术,包括特征提取、索引构建、近邻搜索等技术,供相关领域研发人员参考。在介绍视...转载 2020-07-05 21:36:08 · 2763 阅读 · 0 评论 -
python实现图像检索的三种(直方图/OpenCV/哈希法)
这篇文章主要介绍了python实现图像检索的三种(直方图/OpenCV/哈希法),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧简介:本文介绍了图像检索的三种实现方式,均用python完成,其中前两种基于直方图比较,哈希法基于像素分布。检索方式是:提前导入图片库作为检索范围,给出待检索的图片,将其与图片库中的图片进行比较,得出所有相似度后进行排序,从而检索结果为相似度由高到低的图片。由于工程中还包含Qt界面类、触发函数等其.转载 2020-05-27 23:40:23 · 2356 阅读 · 0 评论 -
Python图像识别,图片相似度计算!
1.背景要识别两张图片是否相似,首先我们可能会区分这两张图是人物照,还是风景照等......对应的风景照是蓝天还是大海......做一系列的分类。从机器学习的的角度来说,首先要提取图片的特征,将这些特征进行分类处理,训练并建立模型,然后在进行识别。但是让计算机去区分这些图片分别是哪一类是很不容易的,不过计算机可以知道图像的像素值的,因此,在图像识别过程中,通过颜色特征来识别是相似图片是我们常用的(当然还有其特征还有纹理特征、形状特征和空间关系特征等,这些有分为直方图,颜色集,颜色局,聚合向量,相转载 2020-05-27 00:21:12 · 5925 阅读 · 3 评论 -
图像检索系列——利用 Python 检测图像相似度!
前言最近在做一个海量图片检索的项目,可以简单的理解为“以图搜图”,这个功能一开始是搜索引擎带火的,但是后来在电商领域变得非常实用。在制作这个图片检索的项目前,笔者搜索了一些资料,如今项目临近结尾,便在这里做一些简单的分享。本文先介绍图像检索最基础的一部分知识——利用 Python 检测图像相似度。提到检测“某某”的相似度相信很多人第一想法就是将需要比较的东西构建成两个向量,然后利用余弦相似度来比较两个向量之间的距离,这种方法应用很广泛,例如比较两个用户兴趣的相似度、比较两个文本之间的相似度。但是这个转载 2020-05-26 10:12:19 · 3231 阅读 · 0 评论 -
Python图像识别,图片相似度计算!
1.背景要识别两张图片是否相似,首先我们可能会区分这两张图是人物照,还是风景照等......对应的风景照是蓝天还是大海......做一系列的分类。从机器学习的的角度来说,首先要提取图片的特征,将这些特征进行分类处理,训练并建立模型,然后在进行识别。但是让计算机去区分这些图片分别是哪一类是很不容易的,不过计算机可以知道图像的像素值的,因此,在图像识别过程中,通过颜色特征来识别是相似图片是我们常用的(当然还有其特征还有纹理特征、形状特征和空间关系特征等,这些有分为直方图,颜色集,颜色局,聚合向量,相转载 2020-05-26 00:21:28 · 4174 阅读 · 0 评论 -
如何正确理解和使用参考文献
内容提要:【一、参考文献引用的目的和作用——为什么要使用参考文献?】【二、参考文献的基本格式和使用规范——如何使用参考文献?】【2.1文献介绍遵循的原则】【2.2如何自查文献引用规范】【2.3参考文献的格式标准】【2.4文献列表的基本格式】【2.5文献引用的基本句型】【2.6文献引用的其它要求】【三、参考文献的查询与引用——介绍一种快速引用参考文献的方法】【四、文献示例——毕业论文中常见文献类型的引用示例】【小结】...原创 2020-05-23 18:48:51 · 4166 阅读 · 0 评论 -
简单理解混淆矩阵—Matlab详细代码注解
本人计算机小白一枚,将自己学到的知识点整理出来,一方面是对自己学习的小总结,另一方面是欢迎大家批评指正。如果觉得写得还可以,大家可以转发关注此博客,谢谢!后续会有新算法持续更新~.一.混淆矩阵(一).简介在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。在图像精度评价中,主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵里面。混淆矩阵是通过将每个实测像元的位置和分类与分类图像中的相应位置和分类像比较计算的.转载 2020-05-18 18:38:28 · 5015 阅读 · 1 评论 -
机器学习之分类器——Matlab中各种分类器的使用总结(随机森林、支持向量机、K近邻分类器、朴素贝叶斯等)
Matlab中常用的分类器有随机森林分类器、支持向量机(SVM)、K近邻分类器、朴素贝叶斯、集成学习方法和鉴别分析分类器等。各分类器的相关Matlab函数使用方法如下:首先对以下介绍中所用到的一些变量做统一的说明:train_data——训练样本,矩阵的每一行数据构成一个样本,每列表示一种特征train_label——训练样本标签,为列向量test_data——测试样本,矩阵的每一行数据构成一个样本,每列表示一种特征test_label——测...转载 2020-05-16 22:52:45 · 7094 阅读 · 2 评论 -
SMOTE(Synthetic Minority Over-Sampling Technique ,即“人工少数类过采样法“)----Python调包简单实现
一、SMOTE原理SMOTE的全称是Synthetic Minority Over-Sampling Technique 即“人工少数类过采样法”,非直接对少数类进行重采样,而是设计算法来人工合成一些新的少数样本。SMOTE步骤__1.选一个正样本红色圈覆盖SMOTE步骤__2.找到该正样本的K个近邻(假设K = 3)SMOTE步骤__3.随机从K个近邻中选出一个样本绿色的SMOTE步骤__4.在正样本和随机选出的这个近邻之间的连线上,随机找一点。这...转载 2020-05-16 22:29:24 · 22737 阅读 · 3 评论 -
python划分训练集、验证集和测试集
机器学习简单流程:使用大量和任务相关的数据集来训练模型; 通过模型在数据集上的误差不断迭代训练模型,得到对数据集拟合合理的模型; 将训练好调整好的模型应用到真实的场景中;我们最终的目的是将训练好的模型部署到真实的环境中,希望训练好的模型能够在真实的数据上得到好的预测效果,换句话说就是希望模型在真实数据上预测的结果误差越小越好。我们把模型在真实环境中的误差叫做泛化误差,最终的目的是希望训练好的模型泛化误差越低越好。我们希望通过某个信号来了解模型的泛化误差,这样就可以指导我们得到泛化能力更强的模型转载 2020-05-16 21:27:15 · 113471 阅读 · 15 评论 -
机器学习采样方法大全
Index数据采样的原因 常见的采样算法 失衡样本的采样 采样的Python实现数据采样的原因其实我们在训练模型的过程,都会经常进行数据采样,为了就是让我们的模型可以更好的去学习数据的特征,从而让效果更佳。但这是比较浅层的理解,更本质上,数据采样就是对随机现象的模拟,根据给定的概率分布从而模拟一个随机事件。另一说法就是用少量的样本点去近似一个总体分布,并刻画总体分布中的不确定性。因为我们在现实生活中,大多数数据都是庞大的,所以总体分布可能就包含了无数多的样本点,模型是无法对这些海量的数据转载 2020-05-16 21:00:17 · 2613 阅读 · 0 评论 -
数据集的非均衡问题(imbalanced data)和应对方法
写在前面:作者是数据挖掘/机器学习新人进阶,专栏目的是分享自己的学习与进阶过程,把自己觉得有趣有价值的内容放上来。内容基本总结自我看过的英文教材/论文/论坛,如果涉及到侵权等问题麻烦私信。这一篇的主要内容是在分类问题中解决不平衡(imbalanced)问题的思路,深入的数学原理及推理在参考文献中。我自己是R-user,正在学习Python,这篇文章不会有很实用的package教程,想看教程的可以去优快云和github搜索相应的教程。如果有任何不清楚或不准确的描述,希望各位读者指出,多多指教啦!.转载 2020-05-16 20:41:14 · 4521 阅读 · 1 评论 -
训练集、验证集、测试集以及交验验证的理解
在人工智能机器学习中,很容易将“验证集”与“测试集”,“交叉验证”混淆。一、三者的区别训练集(train set) —— 用于模型拟合的数据样本。验证集(development set)—— 是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估。在神经网络中, 我们用验证数据集去寻找最优的网络深度(number of hidden layers),或者决定反向传播算法的停止点或者在神经网络中选择隐藏层神经元的数量;...转载 2020-05-16 19:01:16 · 6685 阅读 · 0 评论 -
常见度量距离
在这里整理了一下常见的度量距离,公式就不贴了。文章最后发转载 2019-11-24 18:17:09 · 185 阅读 · 0 评论 -
一个验证码破解的完整演示
这篇博客主要讲如何去破解一个验证码,for demo我会使用一个完整的工程来做,从原始图片到最终的识别结果,但是破解大部分的验证码其实是个很费力的活,对技术要求反而不是特别高,为什么这么说呢? 主要原因有以下几点:你需要验证码的正确答案作为监督,所以基本是人来识别然后写答案 CNN之类的DL方法对验证码这种简单的图像识别能力非常高所以,破解的话你需要有耐心破解流程破...转载 2018-08-20 11:00:59 · 13089 阅读 · 0 评论 -
2018谷歌学术影响因子发布:CVPR排名泛AI领域第一
学术出版哪家强?AI论文影响力是否又有新变化?刚刚,谷歌发布了2018年最新版学术指标(Google Scholar Metrics,GSM)榜单。通过综合衡量学术会议和期刊论文中已发表的论文,谷歌对学术出版物及论文的影响力做出了排名。在这份新出炉的榜单中,所有学术出版物中影响力Top 3是谁?对学术圈产生核弹式影响的那篇论文...转载 2018-08-20 18:42:42 · 5641 阅读 · 0 评论 -
一个不到300行的C语言打飞机游戏
#include "stdio.h"#include <windows.h>#include <conio.h>#include <time.h>#define Esc 27 //退出#define Up 72 //上,下,左,右#define Down 80#define Left 75#define Right 77#define Kon...转载 2018-09-01 19:18:17 · 3173 阅读 · 6 评论 -
t-SNE高维数据可视化(python)
t-SNE实践——sklearn教程t-SNE是一种集降维与可视化于一体的技术,它是基于SNE可视化的改进,解决了SNE在可视化后样本分布拥挤、边界不明显的特点,是目前最好的降维可视化手段。关于t-SNE的历史和原理详见从SNE到t-SNE再到LargeVis。代码见下面例一TSNE的参数函数参数表:parameters 描述 n_components...转载 2019-07-07 09:32:19 · 39819 阅读 · 0 评论 -
TensorFlow介绍_中英文对照
TensorFlow is an Open Source Software Library for Machine IntelligenceTensorFlow是一个关于机器智能的开源软件库About TensorFlowTensorFlow™ is an open source software library for numerical computation usin转载 2018-02-06 17:51:44 · 602 阅读 · 0 评论 -
基础知识(二)matlab与c++混合编程之经验笔记
开发环境:win7 64位+vs2010+matlab学习matlab与c++混合编程的路上有时候会遇到莫名其妙的错误,因此做一下记录:2015年:1、由于系统是64位,装的matlab的链接库也是64位,如果使用win32控制台是32位,需要配置管理器-》配置为X64位2、在c++中调用mwarray类,若未初始化,会出现直接运行没问题,然而调试的时候,出现内存异转载 2016-10-17 21:21:22 · 951 阅读 · 0 评论 -
什么是通讯作者?和第一作者的区别有哪些?
通讯作者往往指课题的总负责人,承担课题的经费,设计,文章的书写和把关。他也是文章和研究材料的联系人。最重要的是,他担负着文章可靠性的责任。他要负责与编辑部的一切通信联系和接受读者的咨询等。实际上如果从知识产权上来说,研究成果算是通讯作者的。通讯作者的好处是能和外界建立更广泛的联系。论文的第一作者必须是第一线操作的实施者和原始数据的收集和处理人,又是初稿的执笔人,第一作者当然要对研究结果和数据的...转载 2018-08-02 11:37:55 · 14340 阅读 · 0 评论 -
Python爬虫实战---抓取图书馆借阅信息
原文地址:http://python.jobbole.com/87045/ 前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约,影响日后借书,而自己又懒得总是登录到学校图书馆借阅系统查看,于是就打算写一个爬虫来抓取自己的借阅信息,把每本书的应还日期给爬下来,并写入txt文件,这样每次忘了就可以打开该txt文件查看,每次借阅信息改变了,只要再重新运行一遍该程...转载 2018-08-02 11:38:24 · 1777 阅读 · 0 评论 -
从0开始学习 GITHUB 系列之「GIT 进阶」
版权声明:本文为 stormzhang 原创文章,可以随意转载,但必须在明确位置注明出处!!!关于 Git 相信大家看了之前一系列的文章已经初步会使用了, 但是关于Git还有很多知识与技巧是你不知道的,今天就来给大家介绍下一些 Git 进阶的知识。1. 用户名和邮箱我们知道我们进行的每一次commit都会产生一条log,这条log标记了提交人的姓名与邮箱,以便其他人方便的查看与联系转载 2016-10-17 21:22:39 · 320 阅读 · 0 评论 -
从0开始学习 GITHUB 系列之「向GITHUB 提交代码」
版权声明:本文为 stormzhang 原创文章,可以随意转载,但必须在明确位置注明出处!!!之前的这篇文章「从0开始学习 GitHub 系列之「Git速成」」相信大家都已经对 Git 的基本操作熟悉了,但是这篇文章只介绍了对本地 Git 仓库的基本操作,今天我就来介绍下如何跟远程仓库一起协作,教你们向 GitHub 上提交你们的第一行代码!1. SSH你拥有了一个 GitHub转载 2016-10-17 21:22:26 · 317 阅读 · 0 评论 -
从0开始学习 GITHUB 系列之「GIT 速成」
版权声明:本文为 stormzhang 原创文章,可以随意转载,但必须在明确位置注明出处!!!前面的 GitHub 系列文章介绍过,GitHub 是基于 Git 的,所以也就意味着 Git 是基础,如果你不会 Git ,那么接下来你完全继续不下去,所以今天的教程就来说说 Git ,当然关于 Git 的知识单凭一篇文章肯定说不完的,我这篇文章先介绍一些最基本的、最常用的一些 Git 知识转载 2016-10-17 21:22:10 · 314 阅读 · 0 评论 -
从0开始学习 GITHUB 系列之「加入 GITHUB」
版权声明:本文为 stormzhang 原创文章,可以随意转载,但必须在明确位置注明出处!!!看完昨天的文章「从0开始学习 GitHub 系列之「初识 GitHub」」估计不少人已经开始期待我继续更新了,这不赶紧马不停蹄,加班加点给你们更新了第二篇。在更新本篇文章之前先回答昨天大家留言的两个问题:GitHub 需要翻墙么?印象中 GitHub 之前确实总是断断续续的访问不了转载 2016-10-17 21:21:55 · 334 阅读 · 0 评论 -
从0开始学习 GITHUB 系列之「初识 GITHUB」
版权声明:本文为 stormzhang 原创文章,可以随意转载,但必须在明确位置注明出处!!!1. 写在前面我一直认为 GitHub 是程序员必备技能,程序员应该没有不知道 GitHub 的才对,没想到这两天留言里给我留言最多的就是想让我写关于 GitHub 的教程,说看了不少资料还是一头雾水,我转念一想,我当初接触 GitHub 也大概工作了一年多才开始学习使用,我读者里很多是初学者转载 2016-10-17 21:21:38 · 276 阅读 · 0 评论 -
基础知识(三)makefile文件编写初级篇
Linux下进行c++开发,需要熟悉相关编译器的编译、链接命令。这边主要以实例讲解,如何在linux中,进行c++程序简单的编译链接运行。一、单文件编译链接这里先从最简单的单个文件编译链接为例。在桌面下新建一个名字为:helloworld.cpp 文件内容:[c++] view plain copy转载 2016-10-17 21:21:22 · 358 阅读 · 0 评论 -
基础知识(一)matlab与c++混合编程之环境搭建
Matlab 与c++混合编程方法开发环境:win7 64位+vs2010+matlab如果想要让matlab调用c++的函数类,则需要把c++编译成mex文件,使用这个方法可以实现混合调试。不过我认为学习c++与matlab混合编程一般是通过c++调用matlab函数,因为matlab具有强大的数学函数库,然而vc++具有界面设计灵活的优点,因此这里只介绍通过vc++调用matlab转载 2016-10-17 21:21:13 · 701 阅读 · 0 评论 -
基础知识(四)C++常用函数.txt
一、txt文件读写1、写入文件[cpp] view plain copy ofstream f1("index.txt");//创建文件,并写入 f1"姓名:""hjimce" f1"家庭地址:""福建厦门" f1.close(); 2、读取文件[cpp] view转载 2016-10-17 21:21:08 · 596 阅读 · 0 评论 -
Ubuntu-安装-有道词典
Windows下的有道词典非常地好用,在Ubuntu下也可以使用有道词典啦!!!添加源,并更新# 添加软件源sudo add-apt-repository ppa:justzx2011/openyoudao-v0.4# 更新sudo apt-get update12341234安装软件包# 安装软件包sudo apt-get install openyoudao转载 2016-10-16 08:37:17 · 421 阅读 · 0 评论 -
学习笔记——Git
说明,此博文是学习《Git教程——廖雪峰》的笔记一、安装和设置# Ubuntu安装Gitsudo apt-get install git -y# 设置全局用户名和邮件,该机器上所有仓库使用该配置$ git config --global user.name "Your Name"$ git config --global user.email "email@example.com"转载 2016-10-16 08:35:35 · 287 阅读 · 0 评论