- 博客(3)
- 收藏
- 关注
原创 MapReduce、YARN、Pig、Spark、HBase简单介绍
–Hadoop权威指南阅读笔记1、关系型数据库与MapReduce的比较:RDBMSMapReduce数据大小GBPB数据存取交互式和批处理批处理更新多次读/写一次写入,多次读取事物ACID无结构写时模式读时模式完整性高低横向扩展非线性的线性的MapReduce是一种可用于数据处理的编程模型。MapReduce程序本质上是并行运行的,可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心2、关于YA
2021-04-27 17:13:50
683
原创 【Kaggle course 学习笔记】- Intro to Machine Learning
Kaggle course- Intro to Machine Learning 学习笔记Intro to Machine Learning 课程链接此课程适合新手了解机器学习最基础的知识,只介绍了决策树、随机森林模型且基本不涉及复杂的底层原理和模型调参。每个章节含有理论教学内容和实际操作(Kaggle上可以直接运行代码并检查答案),都较简单且容易上手,新手友好。但不适合已经对机器学习步骤掌握了的朋友。目录Kaggle course- Intro to Machine Learning 学习笔记
2020-12-21 09:10:29
1097
原创 Kaggle入门实战:Titanic - Machine Learning from Disaster
Kaggle入门实战:Titanic - Machine Learning from Disaster项目简介关于数据数据概括数据字段描述数据分析总体思路初步分析项目简介Use machine learning to create a model that predicts which passengers survived the Titanic shipwreck.基于机器学习建立模型预测泰坦尼克号灾难中哪些乘客得以生存。Kaggle入门项目:Titanic overview参考分析视频:B
2020-12-20 11:58:35
1084
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人