- 博客(20)
- 资源 (2)
- 收藏
- 关注
原创 Hadoop及Hbase介绍与Ubuntu下安装配置
Hbase 安装模式介绍1.单机模式1> Hbase 不使用 HDFS,仅使用本地文件系统2> ZooKeeper 与 Hbase 运行在同一个 JVM 中2.分布式模式– 伪分布式模式1> 所有进程运行在同一个节点上,不同进程运行在不同的 JVM 当中2> 比较适合实验测试– 完全分布式模式1> 进程运行在多个服务器集群中2> 分布式依赖于 H...
2019-06-21 00:09:58
485
原创 TF-IDF介绍及Python实现文本聚类
TF-IDF 是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF 加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了 TF-IDF 以外,因特网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜寻结果中出现的顺序...
2019-06-20 23:45:07
3387
原创 Azure中通过模板部署批量创建虚拟机
1.开始模板部署,点击创建2.编辑模板3.加载导入json模版文件(这里使用了CentOS虚拟机的),修改内容4.设置对应参数5.点击确定,等待部署完成。...
2019-06-20 23:24:35
1590
原创 SpringCloud的Config Client端Could not resolve placeholder 'xxx' in value "${xxx}错误解决
编写SpringCloud的Config Client端时,当尝试去配置文件里拿某${xxx}的值会出现以下错误:org.springframework.beans.factory.BeanCreationException: Error creating bean with nameInjection of autowired dependencies failed; nested exce...
2019-06-20 23:06:44
23528
5
原创 关于Correct the classpath of your application so that it contains a single, compatible version of xxx错
在编写java项目时,遇上报如下错误:***************************APPLICATION FAILED TO START***************************Description:An attempt was made to call a method that does not exist. The attempt wa...
2019-06-04 14:04:21
153933
32
原创 SQL Server系统数据库损坏时的快速恢复使用
1.假设data文件夹中master,masterlog,model,modellog,msdbdata,msdblog的系统数据库文件已损坏,复制Binn/template中的同名文件替换。2.管理员模式运行cmd,命令行中输入NET START MSSQLSERVER /f /T3608启动输入SQLCMD -S .\以windows验证方式连接到实例。更改master中各系统文件...
2018-09-24 15:04:03
1766
原创 SQL Server的Windows验证之NTLM的Netmon主要过程
NTLM连接SQL Server默认实例1. 使用命令,ipconfig /flushdns, 然后再次去执行连接,由于没有client会发一个包给DNS Server, 来查询SERVER的IP地址。2.然后,在服务器端,抓到的TCP三次握手过程。3.三次握手建立以后,SQLNCLI10会发一个PreLogin的包,到SQL Server服务器上。在PRELOGIN成功之后,也就...
2018-09-24 14:51:16
520
原创 Python实现根据评论评分信息预测 (协同过滤,LFM,词向量)
一.数据集train.dat共393366项,第一维是用户的代号,第二维是商品代号,第三项是用户对该商品的评分,第四项是评论数,第五项是评论内容。 test.dat第一维是用户代号,第二维是商品代号。 二.简单思路及实现过程这里简单先贴出代码实现,后期再慢慢补上具体过程说明~1.数据预处理去除部分无关常用词,这里调用nltk包,将评论词词词根化等,进行...
2018-06-28 01:17:54
4951
3
原创 基于yale人脸库的人脸图像检测
一.嵌入式特征选择:将特征选择方法和学习训练过程融为一体。两者同在一个优化过程中完成。在学习器训练时自动进行特征选择。给定训练集,考虑线性回归模型,以平方误差为损失函数,则优化目标为: 当样本特征较多,样本数量较少时,很容易过拟合。若采用L1正则化,则有: 二. 人脸图片处理读入训练图片,将每张人脸图片信息存储为一维矩阵(1*10304),方便计算。 三.稀疏表示假设我们用一个M*N的矩阵表...
2018-04-15 17:06:43
3952
1
原创 Pat部分答案
今天看到同学在做pat,也做了一点试水。下面贴上部分代码~1006#include<iostream>using namespace std;int main(){int n; cin>>n; int m=n; int *a=new int [4]; int count=0; int i=0; while(m>0){...
2018-04-13 20:27:09
356
原创 关于SVM算法 python实现
SVM简介 SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。SVM的主要思想可以概括为两点:它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空...
2018-03-26 22:08:29
1296
原创 Adaboost 算法实现
Adaboost简介:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。下面使用sklearn库简单体验一下,使用自带数据集iris:from sklearn.model_selection import cross_val_scorefrom sklearn.data...
2018-03-26 21:41:44
341
原创 isomap算法 python实现
isomap算法主要流程:1:构建邻接图G:基于输入空间X中流形G上的的邻近点对i,j之间的欧式距离dx (i,j),选取每个样本点距离最近的K个点(K-Isomap)或在样本点选定半径为常数ε的圆内所有点为该样本点的近邻点,将这些邻近点用边连接,将流形G构建为一个反映邻近关系的带权流通图G;2:计算所有点对之间的最短路径:通过计算邻接图G上任意两点之间的最短路径逼近流形上的测地距离...
2018-03-26 21:34:07
7597
1
原创 Kmeans算法 python实现
K-Means算法简介:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,知道质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。 总的来说,算法很简单,下面是python的简单实现:import numpy as np...
2018-03-26 21:27:13
441
原创 EM算法 python初探
EM算法在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算:第一步是计算期望(E),利用概率模型参数的现有估计值,计算隐藏变量的期望;...
2018-03-26 21:13:11
673
1
原创 Apriori算法 python实现
算法简介: 首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。主要流程: 输入:数据集合D,支持度阈值αα 输...
2018-03-26 20:59:52
668
原创 决策树剪枝简单python实现
决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。决策树仅有单一输出,如果有多个输出,可以分别建立独立的决策树以处理不同的输出。ID3算法:ID3算法是决策树的一种,是基于奥卡姆剃刀原...
2017-12-18 16:52:31
8718
4
原创 python实现共轭梯度法
共轭梯度法(Conjugate Gradient)是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点,共轭梯度法不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的算法之一。 这里初始化A为对角线元素全为2且横纵坐标差值绝对值为1时为-1的矩阵,b为全1矩阵,求解x 算法实...
2017-10-23 10:58:53
12464
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人