- 博客(11)
- 收藏
- 关注
原创 PyTorch scatter_ 从懵懂到清晰
PyTorch scatter_ 从懵懂到清晰今天看pytorch官方文档,看到一个函数scatter_,好奇了一下去看官方解释,乍一看寥寥几句解释,却把我整懵了,赶紧搜了一下,发现好几篇文章都是写的差不多,也没看懂,后来终于看到这篇文章,才算搞明白了是咋回事 原文链接。重点来了老弟直接贴图:假设我们有这样一个tensor调用scatter_方法,会得到如下结果:(3,5) 表示输...
2020-03-15 01:25:41
461
原创 特征选择方法记录
1.信息增益最大的问题还在于它只能考察特征对整个系统的贡献,而不能具体到某个类别上,这就使得它只适合用来做所谓“全局”的特征选择(指所有的类都使用相同的特征集合),而无法做“本地”的特征选择(每个类别有自己的特征集合,因为有的词,对这个类别很有区分度,对另一个类别则无足轻重)。 ...
2018-03-11 23:11:33
288
原创 阿里笔试题
1.下面程序的运行结果是() String str1 = "hello"; String str2 = "he" + new String("llo"); System.out.println(str1 == str2); False2下面程序的运行结果是什么() 1 class HelloA { 2 public HelloA() { 3 ...
2018-03-11 11:11:46
1535
原创 SQL中的DML、DDL以及DCL是什么?
DML(data manipulation language)是数据操纵语言:它们是SELECT、UPDATE、INSERT、DELETE,就象它的名字一样,这4条命令是用来对数据库里的数据进行操作的语言。 DDL(data definition language)是数据定义语言:DDL比DML要多,主要的命令有CREATE、ALTER、DROP等,DDL主要是用在定义或改变表(TABLE)的...
2018-03-10 22:50:14
11819
3
转载 K-Means 聚类算法中k的确定及初始簇中心的选择
转自:http://www.cnblogs.com/kemaswill/archive/2013/01/26/2877434.html KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内...
2018-03-03 23:49:06
29257
原创 面试题:请描述K-means的原理,说明选择聚类中心的方法 引发的回顾
聚类 常见的无监督学习任务有密度估计、异常检测、聚类等,本问主要记录聚类算法及相关知识。 在无监督学习中,训练样本的标记信息是未知的,训练的过程就是要找出数据中的内在性质和规律。 聚类既可作为一个单独的过程,也能够作为其他学习任务的前驱过程,如分类,由于事先不知道样本的类别,我们可以先对样本进行聚类,根据聚类结果将每个簇(类)定义为一个类别,然后再基于这些类别训练分类模型,来判别...
2018-03-03 23:19:12
10165
原创 graph
option = { title: { text: ‘Graph 简单示例’ }, tooltip: {}, animationDurationUpdate: 1500, animationEasingUpdate: ‘quinticInOut’, series : [ { ty
2017-10-20 23:20:17
899
原创 kNN(K最近邻)
KNN(K-nearest neighbor)是一种可用作分类与回归的算法,由Cover和Hart于1968年提出。算法输入为实例的特征向量,可以当做特征空间的一个点,目标是为这个实例确定一个类别,可取多个类别。算法基于这样一个假设,给定一个训练集并且其中的每个实例的类别已知。当新的实例到来时,根据距离度量方式从训练集中选出k个最相近的实例的类别,然后根据多数投票方式决定新的实例的类别。k,距离度量
2017-08-27 23:12:26
340
转载 自然语言处理中CNN模型几种常见的Max Pooling操作
/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林原文地址:http://blog.youkuaiyun.com/malefactor/article/details/51078135#0-tsina-1-38411-397232819ff9a47a7b7e80a
2017-05-04 19:56:51
742
原创 支持向量积-1
《统计学习方法——支持向量机》 支持向量积(support vector machine)是机器学习中的一种分类器,其基本模型是定义在特征空间上的最大间隔线性分类器,跟感知机的区别也在于最大间隔这个点,感知机的解是有多个的,而svm由于限定了最大间隔,因此其解是唯一的。线性可分支持向量机与硬间隔最大化 假设对于一个二分类问题,其数据是线性可分的,线性可分支持向量机的学习目标就是找出一个分离超平
2017-04-16 16:31:15
1506
原创 Mining opinion features in customer reviews(aaai, 04, Hu and Liu)
Mining opinion features in customer reviews(aaai, 04, Bing Liu)虽然断断续续看了一些论文,但感觉有些时间一久就淡忘,所以计划今后做论文笔记,就当备忘吧,这是第一篇,希望能坚持住,就像王者里说的,“稳住,我们能赢”哈哈,欢迎交流学习,如有错误也欢迎指正。此次看的论文是Bing Liu在04年在aaai上发的一篇关于从用户评论中抽取观点特征
2017-03-31 21:54:35
1664
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人