
数据分析-数据挖掘
文章平均质量分 82
nanjingdreamfly
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
推荐系统算法总结
1、Itemcf (基于商品的协同过滤) 这个算法是cf中的一种,也是当今很多大型网站都在采用的核心算法之一。对于商城网站(以Amazon为代表,当然也包括京东那种具有搞笑特色的推荐系统在内),影视类推荐,图书类推荐,音乐类推荐系统来说,item的增长速度远不如user的增长速度,而且item之间的相似性远不如user之间的相似性那么敏感,所以可以在离线系统中将item的相似度矩阵计算好,以供线转载 2017-03-31 16:40:12 · 644 阅读 · 0 评论 -
大数据分析和挖掘的基本技术栈和入门方法整理
Hive、hadoop主要是了解Hive从HDFS中提数的Hive SQL语法,还是有很多技巧Hive提数后怎么办?一般是导出Excel csv格式,通过python、R语言处理数据挖掘工具和平台python、R语言等caffee、tensorflow、python、R语言数据计算框架Spark实现数据计算数据显示R语言的数据呈现数据分析算法、挖掘算法划分数据集和测试集,通过简单交叉验证或K折交叉验原创 2017-03-15 17:48:43 · 2198 阅读 · 0 评论