- 博客(10)
- 收藏
- 关注
原创 PRML exercises 10.3 解析
Pattern Recognition and Machine Learning第10章10.1节Variational Inference 泛函优化习题Exercises 10.3答案解析
2017-02-24 13:23:46
820
原创 AWS EMR下配置安装分布式xgboost库
为什么需要xgboostSpark MLlib缺少处理不平衡样本集的能力,速度、分类性能也十分感人. xgboost无论在速度和AUC等分类性能指标上都能秒掉目前最新的Spark MLlib 2.0.2 本文的配置安装过程参考了这篇csdn博客,补全了编译libhdfs.so的部分,根据安装环境的不同提供了AWS EMR jvm环境变量的设置和xgboost实际运行中可能遇到问题的说明环境最
2016-12-30 13:18:00
2430
原创 使用Damerau-Levenshtein自动机实现字符串模糊查询
运用Damerau-Levenshtein自动机,使用Python实现字符串的模糊查询
2016-08-04 17:16:13
4515
原创 pool_allocator源码笔记
C++中的自定义Allocator主要用来解决大量小对象的分配和释放非常耗时的问题。本文介绍与STL兼容的自定义Allocator "pool allocators for stl"源码中潜藏的问题, 该代码由微软NLP组研究员编写,质量高可读性强,非常适合用来学习编写custom allocator。
2016-07-08 12:57:11
1188
原创 VIM补全插件YouCompleteMe编译安装详细步骤
VIM神级补全插件YouCompleteMe安装详细步骤YouCompleteMe(以下简称YCM)。包括YCM依赖的Clang3.8+llvm的编译安装以解决Centos服务器系统核心库Glibc版本过低的问题。
2016-06-27 18:04:06
18819
原创 使用python实现可重入的公平读写锁
在本项目中,读写锁主要应用于多线程服务器场景下的日志文件的读写,以及缓存的获取和更新。 多线程编程的准标准库posix pthread库拥有rwlock, 而python2.7自带的threading库没有读写锁,只有可重入锁RLock, 因此有必要自己实现一个读写锁以提升程序的并发性。需要了解的概念可重入锁。 可重入锁是指同一个锁可以多次被同一线程加锁而不会死锁。 实现可重入锁的目的是防止递归函
2016-04-18 17:15:16
5337
原创 使用decorator在本模块中向系统函数插入自定义代码
什么是decoratordecorator是python这类动态语言独有的语法糖,其使用闭包和factory函数实现,hook了被装饰函数的调用过程但又不影响被装饰函数的输入输出接口(即不用修改被装饰函数的调用代码),同时又不影响其它模块中对原始被装饰函数的调用,使得一些重复性的任务变得简洁又简单,例如,插入代码使得一个模块中的所有函数运行完毕输出运行时间,或者在自定义函数或者系统函数运行前运行后进
2016-03-29 14:18:27
896
原创 数据挖掘导论习题常用数学公式
第6章第5题 Suppose there are dd items. We first choose kk of the items to form the left-hand side of the rule. There are (dk){d \choose k} ways for doing this. After selecting the items for the left-hand
2015-06-20 23:03:46
818
原创 Stanford 机器学习课程cs229 数学推导知识
if xx is a row vector,then xTx=(x⋅x)=∥x∥22=tr(xTx)x^Tx=(x \cdot x)=\lVert x \rVert^2_2=tr(x^Tx) Linear regression: trA=trATtrA=trA^T tr(A+B)=trA+trBtr(A+B)=trA+trB traA=atrAtraA=atrA ∇AtrAB=BT\nab
2015-06-09 23:46:32
1739
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人