
知识点
MJ_911
欢迎打扰
展开
-
集成学习(二)
随机森林:随机森林是由许多决策树组成的模型。 这个模型不是简单地平均树的预测(我们可以称之为“森林”),而是使用两个关键概念,使其名称为随机:在构建树时对训练数据点进行随机抽样分割节点时考虑的随机特征子集Bagging和Boosting的概念与区别随机森林属于集成学习(Ensemble Learning)中的bagging算法。在集成学习中,主要分为bagging算法和boostin...原创 2019-10-26 01:05:40 · 494 阅读 · 0 评论 -
集成学习(一)
入门知识点:熵:假设集合中的变量X={x1,x2…xn},它对应在集合的概率分别是P={p1,p2…pn}。信息增益:第一列为QQ,第二列为性别,第三列为活跃度,最后一列用户是否流失。我们要解决一个问题:性别和活跃度两个特征,哪个对用户流失影响更大?我们通过计算信息熵可以解决这个问题。按照分组统计,我们可以得到如下信息:其中Positive为正样本(已流失),Negative为负...原创 2019-10-25 22:31:12 · 334 阅读 · 0 评论 -
Java 容器之Set、Map、List
ArrayList与LinkedListLinkedList与ArrayList一样实现了List接口。LinkedList执行List的中间插入和删除比ArrayList更高效;在随机访问稍显逊色。LinkedList增加了可以使其作栈、队列或双端队列的方法。Set不保存重复的元素(查找最重要)HashSet 优化了快速查找。使用散列,输出无顺序。TreeSet 可以对元素自动排序(...原创 2019-07-26 14:25:08 · 107 阅读 · 0 评论 -
大数据 mysql+hive+sqoop 操作数据库 shell脚本
原创 2019-07-12 08:28:27 · 302 阅读 · 0 评论 -
大数据软件安装和编程实践指南
大数据软件安装和编程实践指南在线访问地址:http://dblab.xmu.edu.cn/post/7586/快速入门大数据基础编程扫一扫访问本网页指南目录Linux系统安装:http://dblab.xmu.edu.cn/blog/1257-2/Hadoop安装与使用:http://dblab.xmu.edu.cn/blog/1258-2/HDFS基础编程实践:http://d...原创 2019-07-01 14:50:55 · 401 阅读 · 0 评论 -
Mybatis配置以及基本操作
jar加载在pom.xml配置文件中,mybatis具体配置配置在MybatisConfig配置文件中。项目下载:https://github.com/1147809112/Mybatis-Mysql.git原创 2019-06-04 18:26:31 · 149 阅读 · 0 评论 -
知识点杂记
有关几种排序的时间复杂度:快速排序 nlogn堆排序 nlogn冒泡排序 在改良的冒泡下 最优时间复杂度为n插入排序 最优下n选择排序 n*n归并 nlogn原创 2019-04-02 15:35:54 · 198 阅读 · 0 评论 -
Java 使用库函数排序
参考:https://blog.youkuaiyun.com/fxjzzyo/article/details/61914733转载 2019-03-26 11:27:23 · 434 阅读 · 0 评论