
资源整理
文章平均质量分 79
dajunxing
这个作者很懒,什么都没留下…
展开
-
堆区和栈区的区别
问题: 在C++中编写一个char* functionX(), 想请问一下能否在函数内部建立并且返回一个char*指针,在不用全局变量和STATIC的情况下有其他办法么?答:1 new(malloc)分配的内存在堆区,函数结束后依然存在。把这个内存的指针给别的地方,当然能访问了,不过要记得释放,不然就是内存泄漏了。2 函数里面的别的变量分配在栈去,函数结束的时候就消失了。那栈区转载 2015-08-25 15:38:18 · 405 阅读 · 0 评论 -
点滴资源汇总
1、生成模型与判别模型 http://blog.youkuaiyun.com/zouxy09/article/details/8195017 生成算法尝试去找到底这个数据是怎么生成的(产生的),然后再对一个信号进行分类。基于你的生成假设,那么那个类别最有可能产生这个信号,这个信号就属于那个类别。判别模型不关心数据是怎么生成的,它只关心信号之间的差别,然后用差别来简单对给定的一个信号进行分类。转载 2015-08-21 20:07:33 · 291 阅读 · 0 评论 -
机器学习中的相似性度量
转载自:http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量转载 2015-08-27 22:08:31 · 282 阅读 · 0 评论 -
网络挖掘技术——微博文本特征提取
文本特征向量 经典的向量空间模型(VSM: Vector Space Model)由Salton等人于60年代提出,并成功地应用于著名的SMART文本检索系统。VSM概念简单,把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂。当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性。文本处理中最常用的相似性度量方式是转载 2015-09-09 09:30:23 · 1021 阅读 · 0 评论 -
笔试面试题总结(一)--- 软件开发
1.Huffman编码中的贪心策略,该部分所需要的计算时间。首先,要理解Huffman编码中那部分用到了贪心算法,贪心的策略,这样才能求所需的计算时间。哈夫曼编码算法:每次将集合中两个权值最小的二叉树合并成一棵新二叉树,n-1次合并后,成为最终的一棵哈夫曼树。这既是贪心法的思想:从某一个最初状态出发,根据当前的局部最优策略,以满足约束方程为条件,以使目标函数最快(或最慢)为原则,在候选集合原创 2015-09-12 15:36:48 · 625 阅读 · 0 评论 -
SVD在推荐系统中的应用(资源汇总)
关于SVD在推荐系统中的应用一些比较好的资源博文[1]给出了一个具体的实例分析,能够很好的理解SVD在推荐系统中应用对推荐结果所起的作用。博文[2]从强调SVD应用到推荐系统领域中的思想出发,详细介绍了SVD模型的思想和原理,并从改进和实际应用思想的角度结合图 形分析介绍了几种SVD模型的变形,能够很好的理解SVD模型及各种变形。博文[3]主要介绍了矩阵原创 2016-03-27 22:06:21 · 1209 阅读 · 0 评论 -
自然语言处理相关书籍及其他资源
特别推荐:1、HMM学习最佳范例全文文档2、无约束最优化全文文档一、书籍:1、《自然语言处理综论》英文版第二版2、《统计自然语言处理基础》英文版3、《用Python进行自然语言处理》,NLTK配套书4、《Learning Python第三版》,Python入门经典书籍,详细而不厌其烦5、《自然语言处理中的模式识别》6、《EM算法及其扩展》7、《统计学习基转载 2016-01-28 17:11:29 · 710 阅读 · 0 评论 -
推荐领域数据集
http://www.grouplens.org/taxonomy/term/14Movielens Dataset: 其中Movielens-100k和movielens-1M有用户对电影的打分,电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。转载 2016-05-09 23:09:14 · 9698 阅读 · 3 评论