- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 RNN-资料记录
网上找了好多资料看,主要是参考了“deep learning” 这本书。图片粘贴不过来,就全部截图了.......解决Long term问题LSTM理解lstm:中文版:http://www.jianshu.com/p/9dc9f41f0b29 英文版 http://col
2016-07-02 23:52:32
519
转载 spark优化
转载:http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-1/http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/Avoid reduceByK
2015-12-28 16:22:28
566
转载 spark mapPartition方法与map方法的区别 以及 join的用法
转载:http://wanshi.iteye.com/blog/2183906 rdd的mapPartitions是map的一个变种,它们都可进行分区的并行处理。 两者的主要区别是调用的粒度不一样:map的输入变换函数是应用于RDD中每个元素,而mapPartitions的输入函数是应用于每个分区。 假设一个rdd有10个元素,分成3个分区。如果使用map方法,
2015-09-14 10:31:51
13683
转载 特征选择[转载,翻译]
问题描述:进行模型训练时,特征数据必不可少,但是特征数量、特征质量如何,对模型效果起着十分关键的作用。有时候特征维度很高但是有很多特征对模型效果提升是无益的,甚至在有的模型中特征之间还会进行干扰。此时特征选择是十分必要的,通过特征选择选取最优特征子集能达到提高模型训练速率和模型效果的目的。特征选择流程:进行特征选择时,需要生成特征子集,确定好评价函数(模型效果是否变优),停止准则(什么
2015-08-26 14:25:22
821
原创 不平衡分类问题处理方法
问题描述:工作中处理分类问题时,很多情况是多个分类类别的数据分布不平衡,有的类别的数据量可能远小于其他类别。并且在实验中发现,进行分类模型训练时,各类别的数据比例不同对最终模型分类效果的影响很大。解决方法:对于这类问题,主要从数据和学习两个角度进行处理。训练集大小,类优先级,误分代价几个重要影响因素需要重点处理。从数据角度:训练集重采样,训练集划分;从学习算法角度:分类器集成,
2015-08-21 11:24:04
1655
原创 matlab积累
matlab中矩阵用法:1.反斜杠:如果a,b均为常数,则a\b=b/a如果A,B为矩阵,则A\B=A的逆*B即A\B的结果为一个向量,为方程组Ax=B的解。
2015-05-24 17:37:29
487
原创 推荐
学校创新项目做的推荐系统,主要参考文献为巩亮的推荐系统书。主要利用用户的用户行为,用户标签以及对资源进行动态分类,虽然有很多不足,但自认为还是有些特点的,考虑得比较细致了。主题思路:根据用户的兴趣模板,用户的历史记录来给用户做针对性的资源推荐。并且能够根据用户的信息反向动态调整资源分类。下面是算法的具体实现:1 首先我们将用户分为新用户和老用户,因为新用户会遇
2015-04-12 11:41:40
581
原创 MacOS 安装 convnet的几个问题
1. 类似fatal error: 'jpeglib.h' file not found或者 X11/Xlib.h找不到这种文件找不到的问题。 原因:该文件引入路径不对,可能是电脑上不存在这类文件,更多可能是该类文件指向不对。 解决方法:此时一般需要先找出该文件所在位置,然后再建立相应的映射,如软链接ln -s XXX XXX这种做法2.编译convnet时,报uint没定义这种
2015-04-04 20:38:10
3054
原创 C++实现小根堆
#include#includeusing namespace std;/**堆排序算法适用于海量元素,时间复杂度为O(nlog(n)),辅助空间也只需O(1);*有大根堆和小根堆两种,大根堆根节点比两子节点大;小根堆相反。*此例说明的是小根堆*/template void swap(const T &a ,const T &b){ T t; t=a;
2014-04-20 00:01:23
5725
原创 C++,希尔排序
#includeusing namespace std;/**希尔排序也是缩小增量排序,其时间复杂度较插入排序要好,因为在最后进行插入排序之前已经基本有序了;*插入排序的时间复杂度为O(n^2),而希尔排序能缩小到O(n^3/2)*///template //模版传递指针和数组需注意//void shell_sort(const *arr(T),const T &n,c
2014-04-18 23:39:54
560
原创 C++实现快速排序
#include#includeusing namespace std;/**冒泡排序算法平均时间复杂度为O(nlog(n)),最坏情况O(n^2)*/template void swap(const T &m,const T &n){T temp;temp=m;m=n;n=temp;}int part(vector &Sort,int a,in
2014-04-18 21:53:25
445
原创 C++实现冒泡排序
#includeusing namespace std;templatevoid swap(const T &m,const T &n){T temp;temp=m;m=n;n=temp;}int main(int argc,char *argv[]){int n,i,j;//,*Sortcin>>n;//Sort=(int*)malloc(size
2014-04-18 20:58:56
735
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人