- 博客(30)
- 资源 (8)
- 收藏
- 关注
原创 向量点积的另一种几何含义
〇、背景给定向量a⃗,b⃗\vec a, \vec ba,b,夹角是θ\thetaθ(如下图),我们都知道,向量a⃗\vec aa和向量b⃗\vec bb的点积公式是a⃗⋅b⃗=∥a⃗∥∥b⃗∥cosθ\vec a \cdot \vec b=\|\vec a\|\|\vec b\|\cos{\theta}a⋅b=∥a∥∥b∥cosθ其几何含义就是将b⃗\vec bb投影到向量a⃗\vec...
2019-11-27 16:33:29
747
原创 哈佛幸福课个人使用精华
出处知乎友整理地址:https://zhuanlan.zhihu.com/p/24680966精华 5.抵抗抑郁的最佳灵药: 睡眠充足。每24小时睡8小时(根据实际情况略微调整) 意念锻炼(冥想)。每周6~7次,每次10~15min,如果坚持不下来,至少全天要安排几次深呼吸 锻炼身体。每周4次,每次至少半小时 每天至少5个,最好12个拥抱...
2018-05-17 08:43:35
1214
原创 C++二维数组排序段错误-之二元关系
需要写一个对向量集进行字典序排序的代码。所谓字典序 [1 1 2] < [1 1 9] < [2 0 1]使用vector<vector<float> >存储数据,使用sort(vecs.begin(), vecs.end(), comp)排序,一开始的comp函数是这么写的:/* 向量字典序比较关系
2018-05-15 17:57:50
490
1
原创 数据集
精确近邻查询LNL1方法: An Efficient Exact Nearest Neighbor Search by Compounded Embedding ↩
2018-05-10 20:19:30
289
原创 LSB-tree理论证明理解
一些基本公式和定义(1,c,p1,p2)(1,c,p1,p2)(1,c,p_1,p_2)敏感含义‖,‖≤r,Pr[]≥p1‖,‖≤r,Pr[]≥p1\|,\| \leq r, Pr[] \geq p_1, ‖,‖>cr,Pr[]≤p2‖,‖>cr,Pr[]≤p2\|,\| > cr, Pr[] \leq p_2基本LSH函数h(o)=⌊a⋅o+bw⌋h(o)=⌊a...
2018-05-05 10:49:23
326
原创 yael库读源代码
Yael库是自己领域大牛Jegou实现的底层库,用C写的。自己对C比较自信,但自我感觉只是一个C的应用者,而且还没有人家用得这么底层,觉得很佩服,因此下决心想搞搞清楚。比较感兴趣的先列出来并行的代码底层有没有一些高深的实现machinedeps篇比较核心的就是这个machinedeps库。...
2018-04-30 18:12:55
411
原创 本硕博研究计算机把自己也搞成了计算机,现在要回到人的部分
背景计算机专业是一门研究计算机的学科,自己本科、硕士、博士都是计算机专业,感觉把自己也看成了计算机。 但是自己是一个人啊,现在觉得都不知道要怎么与人打交道了。所以急需人方面的知识。人不是机器 什么是研究人的学科呢?心理学——是一门研究人类心理现象及其影响下的精神功能和行为活动的科学,兼顾突出的理论性和应用(实践)性。心理学研究人的心理、精神和行为感觉对人的涵盖还挺全面的,都...
2018-04-28 15:27:24
242
原创 怎么判断一个点是否有可能成为最远邻
目前,远邻图的构建还是在采用线序构建,比较耗时。有没有一种思路能够判断一个点是否是远邻。因为感觉,实际上数据集中不是所有点都可以成为最远邻,成为最远邻需要一些性质,或者无法成为最远邻需要一些性质,这些性质是什么?猜想数据集的中心点,所有点到数据集中心点的距离计算出来,排序,那么一个点 按照到中心点的距离将整个数据集划分成两部分,一个是比较距离大的,一个是比他距离小的,然后……建...
2018-04-20 13:50:51
252
转载 科学作息时间表-梳理
转载整理自:https://www.jianshu.com/p/c32deb41dc977:00 起床7:00是起床的最佳时刻,身体已经准备好一切了。 打开台灯,告诉身体的每一个部分,尽快从睡眠中醒来,调整好生物钟。 醒来后需要一杯温开水,水是身体内成千上万化学反应得以进行的必需物质,饮水帮助每一个缺水的细胞都重新活力四射。7:20-8:00 吃早饭早饭必须吃,这没有什...
2018-04-19 17:01:12
1510
原创 MultiCore
http://www.cs.otago.ac.nz/staffpriv/hzy/publications.phpMultiCore的工作,由新西兰Otago大学的Huang Zhiyi教授领导,链接。 先是在TOPD上发表1,然后在2016年PCAF发表在B类会议ICPP(internation confe on parallel processing)2,最近(2018)扩展到A类期刊Tr...
2018-02-27 10:36:22
779
原创 C++中堆的使用及自定义类型排序
简介C++中堆(heap)是在vector的基础上实现的。具体地,是定义了一些方法在vector类型数据上进行操作,包括 - make_heap 建立堆(默认最大堆) - push_heap 加入元素 - pop_heap 删除元素 - sort_heap 堆排序义的一些方法代码示例#include<iostream> #include<vecto...
2018-02-25 11:34:05
767
原创 C++中堆的使用及自定义类型排序
简介C++中堆(heap)是在vector的基础上实现的。具体地,是定义了一些方法在vector类型数据上进行操作,包括 - make_heap 建立堆(默认最大堆) - push_heap 加入元素 - pop_heap 删除元素 - sort_heap 堆排序义的一些方法代码示例#include #include #include using namesp
2018-01-08 16:39:29
2790
原创 LaTeX论文写作
通讯作者角标http://blog.youkuaiyun.com/aresgod/article/details/50457791
2017-12-03 12:21:07
487
原创 Mac布置
远程连接windows下载microsoft remote desktop for mac,安装后可以远程连接windows电脑,而且自动全屏,清晰度也挺高。http://www.maczapp.com/microsoft-remote-desktop文件传输,具体是配置Redirection。本质上是指定mac上一个目录为Redirection,其效果是可以在windows系统的资源管理页面里
2017-11-28 13:09:11
238
原创 ubuntu常用功能安装集锦
系统配置为显卡安装驱动个人开发安装yael安装SSH安装dukto更新源添加新root用户配置ftp连接系统配置为显卡安装驱动$ add-apt-repository ppa:noobslab/apps$ apt-get update$ apt-get install ddm个人开发安装yaelhttp://blog.youkuaiyun.com/xd227/article/details/
2017-11-21 20:56:21
864
翻译 TP的命名规范
ThinkPHP的命名规范,可供参考。类文件都是以.class.php为后缀(这里是指的ThinkPHP内部使用的类库文件,不代表外部加载的类库文件),使用驼峰法命名,并且首字母大写,例如 DbMysql.class.php;类的命名空间地址和所在的路径地址一致,例如 Home\Controller\UserController类所在的路径应该是 Application/Home/Control
2017-05-25 10:21:20
2307
翻译 PDF文件字体嵌入
提交论文时,有些网站会提示没有嵌入字体的错误。打开文件,“文件”->“属性”->“字体”,往下来能看到一些没嵌入的字体,如下图:核心解决思路:打开pdf文件后,点击文件->打印,选择名称到Adobe PDF->属性->默认设置【标准】->编辑->字体,然后将“字体来源”中的所有字体都添加到“总是嵌入”边框,最后点击另存为一个配置文件【名称自拟,按默认路径保存】,保存后退出;
2017-05-25 08:59:34
10202
原创 ubuntu下yael库调用与编译示例
yael提供了非常全且方便的feature向量数据上的基本运算,包括nn, vector, heap, kmeans(hkm), gmm, sorting, vlad 等等。之前已在ubuntu系统(14.04)上安装好了yael库(v438),发现写c/c++代码调用及编译器来非常简单,特此给出一个示例。
2017-03-27 11:20:35
1256
原创 阅读列表:On the Surprising Behavior of Distance Metrics in High Dimensional Space
有一些结论,比较新颖,可用于指导:例如,在挖掘问题当中,高维空间中L1可能比L2更prefer。fractional metrics分数度量可能更有用。https://bib.dbvis.de/uploadedFiles/155.pdf
2017-03-25 16:11:41
840
原创 FNN:利用均值和方差构造欧式距离下界
在做NN算法的时候遇到了一个有意思的论文。通过向量自身的均值和方差构建的高维点间的距离下界。实现了快速的线性NN搜索。文中发现的这一下界公式觉得很有意思,特来详细介绍一下。
2017-03-25 14:58:24
797
原创 C2LSH没有用多个hash table,是怎么解决False Negative的?
C2LSH里只有一组复合哈希函数,却也取得了精度上的概率保证,那么他有没有处理False Negative,怎么处理的?本帖对这一问题加以初步分析。
2017-03-24 13:55:48
1183
原创 基于kNN完善digit recognition(kaggle)精度(0.95-->1)[进行中]
背景一直在搞高维数据检索,研究成果没出多少,爱钻牛角尖。时间长了,发现连基本的解决问题的能力都没有了。视野太狭窄,所以决定到kaggle上恶补一番。Digit Recognition是一个最基本的手写识别问题,是对数字[0-9]手写的识别。共有42000份训练样本,28000份待识别样本。kNN初步尝试先提交第一份结果建立自信吧。感谢wepon_的kaggle入门帖的启发。原来自己一直在研究的k近邻
2017-02-24 18:03:39
934
原创 高速外存体系下的高维索引标准.思路列表
现有的外存体系是DDR内存+磁盘二级存储结构。磁盘的优点是廉价,在存放大数据背景下的海量数据时扩充容量的代价容易承受。但是,数据管理的其他操作就有些蛋疼了,很多基本的操作都发现无法避免一个瓶颈:内外存间的通信(Jeffrey Scott Vitter)基于闪存的高速外存(SSD)没有随机I/O,这对很多ENN(Exact Nearest Neighbor)搜索方法是福音。典型的,va-file, f
2015-11-06 01:10:22
465
翻译 分层K-Means+Matlab计算向量间距离
Y=pdist(X); % 计算X内向量两两间距离Y=squareform(Y); % 将距离整理成矩阵形式(对称矩阵,且对角线为0)Z=linkage(Y); % 分层聚类dendrogram(Z); % 可视化
2015-11-05 22:40:59
1525
原创 Yael for ubuntu 部署日志 - [内含ssaupd_的问题,python部署]
做高维数据索引实验,发现有个比较好的c/python/matlab库,yael-项目地址不过目前只支持linux和macOS。特此将安装过程记录下来:版本信息yael_v438ubuntu 14.04 或者 14.10准备工作安装gfortran, blas, lapack, swig$ sudo apt-get install gfortran$ sudo apt-get install
2015-10-02 15:39:03
1049
晚餐预定系统——Web Service大作业
2013-11-07
数据库实验报告—学生管理系统
2012-11-13
汇编实验报告
2012-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人