
学习笔记
文章平均质量分 55
xikafe
高维索引领域的一只蜗牛~
展开
-
向量点积的另一种几何含义
〇、背景给定向量a⃗,b⃗\vec a, \vec ba,b,夹角是θ\thetaθ(如下图),我们都知道,向量a⃗\vec aa和向量b⃗\vec bb的点积公式是a⃗⋅b⃗=∥a⃗∥∥b⃗∥cosθ\vec a \cdot \vec b=\|\vec a\|\|\vec b\|\cos{\theta}a⋅b=∥a∥∥b∥cosθ其几何含义就是将b⃗\vec bb投影到向量a⃗\vec...原创 2019-11-27 16:33:29 · 750 阅读 · 0 评论 -
TP的命名规范
ThinkPHP的命名规范,可供参考。类文件都是以.class.php为后缀(这里是指的ThinkPHP内部使用的类库文件,不代表外部加载的类库文件),使用驼峰法命名,并且首字母大写,例如 DbMysql.class.php;类的命名空间地址和所在的路径地址一致,例如 Home\Controller\UserController类所在的路径应该是 Application/Home/Control翻译 2017-05-25 10:21:20 · 2309 阅读 · 0 评论 -
ubuntu下yael库调用与编译示例
yael提供了非常全且方便的feature向量数据上的基本运算,包括nn, vector, heap, kmeans(hkm), gmm, sorting, vlad 等等。之前已在ubuntu系统(14.04)上安装好了yael库(v438),发现写c/c++代码调用及编译器来非常简单,特此给出一个示例。原创 2017-03-27 11:20:35 · 1258 阅读 · 1 评论 -
阅读列表:On the Surprising Behavior of Distance Metrics in High Dimensional Space
有一些结论,比较新颖,可用于指导:例如,在挖掘问题当中,高维空间中L1可能比L2更prefer。fractional metrics分数度量可能更有用。https://bib.dbvis.de/uploadedFiles/155.pdf原创 2017-03-25 16:11:41 · 840 阅读 · 0 评论 -
FNN:利用均值和方差构造欧式距离下界
在做NN算法的时候遇到了一个有意思的论文。通过向量自身的均值和方差构建的高维点间的距离下界。实现了快速的线性NN搜索。文中发现的这一下界公式觉得很有意思,特来详细介绍一下。原创 2017-03-25 14:58:24 · 797 阅读 · 0 评论 -
基于kNN完善digit recognition(kaggle)精度(0.95-->1)[进行中]
背景一直在搞高维数据检索,研究成果没出多少,爱钻牛角尖。时间长了,发现连基本的解决问题的能力都没有了。视野太狭窄,所以决定到kaggle上恶补一番。Digit Recognition是一个最基本的手写识别问题,是对数字[0-9]手写的识别。共有42000份训练样本,28000份待识别样本。kNN初步尝试先提交第一份结果建立自信吧。感谢wepon_的kaggle入门帖的启发。原来自己一直在研究的k近邻原创 2017-02-24 18:03:39 · 935 阅读 · 0 评论 -
分层K-Means+Matlab计算向量间距离
Y=pdist(X); % 计算X内向量两两间距离Y=squareform(Y); % 将距离整理成矩阵形式(对称矩阵,且对角线为0)Z=linkage(Y); % 分层聚类dendrogram(Z); % 可视化翻译 2015-11-05 22:40:59 · 1526 阅读 · 0 评论