自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 数据表示

在计算机系统中,数据类型是所有数据的基本表示方法。计算机的基本功能是对数据、文字、声音、图形、图像和视频等信息进行加工处理,其中数据有两大类:一类是数值数据,如+314、-3.14、53等,有“量”的概念;另一类是非数值数据,如各种字母和符号。无论是数值数据还是非数值数据,在计算机中都是用二进制数码表示的,而文字、声音、图形、图像和视频等信息要在计算机中处理,都要事先数字化,即把文字、声音、图形、图

2017-03-21 21:26:33 1264

原创 MTF算法

MTF(move-to-front)是一种数据编码方式,用于提高数据压缩技术效果。在数据压缩算法中,MTF可以作为一个额外的步骤。也就是说 ,可以先进行MTF编码,在进行数据压缩。主要使用的是数据的”空间局部性“,也就是最近出现过的字符很可能在接下来的文本附近再次出现。MTF的主要思想是:(1)维护一个文本字符集大小的栈,“recently used symbols”(最近访问过的字符),其中每个不

2017-03-20 20:40:56 9191

原创 数据挖掘(三)聚类

聚类是一个将数据集分成若干个簇或类的过程,表示同一类的数据具有高度的相似性。聚类分析(英语:Cluster analysis,亦称为群集分析)是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系

2017-03-17 08:36:28 914

原创 感知器算法

感知器算法是一种用于二进制分类的监督学习算法,可以预测数字向量所表示的输入是否属于特定的类。 在机器学习的术语中,分类被认为是监督学习的实例,即,其中可观测得到正确识别的训练集,可将之用于训练学习。 相应的无监督过程被称为聚类或聚类分析,并且涉及基于固有相似性(例如,被视为多维向量空间中的向量的实例之间的距离)的某种度量将数据分组到类别中。 (维基百科) 在人工神经网络领域中,感知机也被指为单层

2017-03-15 23:48:10 21354

原创 使用BFS验证二分图

图论中,有很多算法可以实现图的验证,最基本的两个算法是深度优先搜索和广度优先搜索。还有其它高级算法也可以实现类似的功能,但是它们都是基于这两个基础算法之上的。例如:A, IDA, Kosaraju algorithm 和Tarjan algorithm 等等。我会在之后的博客中加以介绍。在二分图的验证中主要有两个主要函数块,一个是邻接矩阵的建立,另一个则是对顶点颜色的划分和存储。使用DFS算法则是

2017-03-15 23:12:18 1030

原创 信息检索

搜索文档或文档中信息的科学。文档可以是文本或多媒体,并且可能驻留在Web上。 信息检索与数据库系统的差别:信息检索假定所搜索的数据是无结构的;信息检索查询主要用关键词,没有复杂的结构。 主题模型:一个文本文档集的主题可以用词汇表上的概率分布建模。文件类型检测 语言检测 检测文件语言类型检测特定字符 使用split()对文本内容进行区分,区分不同词语,进行标记 标记化倒排索引

2017-03-15 19:38:47 557

原创 k-平均算法

k-平均算法 k-平均算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是:把n个点(可以是样本的一次观察或一个实例)划分到k个聚类中,使得每个点都属于离他最近的均值(此即聚类中心)对应的聚类,以之作为聚类的标准。k-平均聚类倾向于在可比较的空间范围内寻找聚类,期望-最大化技术却允许聚类有不同的形状。 给定表示为d的N个实例的数据集(),

2017-03-02 08:03:50 3590

原创 计算机逻辑Introduction

计算机逻辑介绍

2017-02-09 00:49:02 367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除