- 博客(2)
- 收藏
- 关注
原创 Spark推荐系统实现
代码实现如下:使用电影数据集进行训练模型package mllib.Collaborativefilteringimport org.apache.log4j.{Level, Logger}import org.apache.spark.sql.SparkSessionimport org.apache.spark.mllib.recommendation.{ALS, Rating...
2018-10-29 15:21:19
1462
1
原创 机器学习特征工程之特征选择
在做数据分析的时候,数据预处理之后的特征选择尤为重要,特征选择做好之后对后面的优化尤为重要。特征选择的来源一般可以分为两块,第一就是根据业务实际需求已经整理好的特征数据,第二就是根据数据驱动来选择的高级特征。 那我们如果在成百上千的特征中选择合适的特征呢,第一我们可以请教相关领域的专家,让专家根据经验给出相关的建议;第二就是根据数据统计进行特征选择。 根据数据...
2018-07-20 16:10:23
525
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人