- 博客(126)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注

原创 笔试IO处理收集
场景1.求a+b的和#include <iostream>using namespace std;int main() { int a,b; while(cin >> a >> b)//注意while处理多个case cout << a+b << endl;}场景2.给出N阶方阵所有的数,求方...
2019-08-02 23:03:29
313

原创 GBDT理解2.0
参考文献1.GBDT原理与Sklearn源码分析-回归篇2.GBDT原理与Sklearn源码分析-分类篇3.GBDT原理与实践-多分类篇前提:CART可以用于回归和分类,那么到底用回归还是分类呢?我们知道,GBDT拟合的目标是一个梯度值,这个值当然是一个连续值或者说实值,所以在GBDT里,通通都是回归树!!!如果损失函数选的是最小平方损失函数,那么拟合残差就和拟合损失函数的负梯度是等...
2019-07-26 14:34:36
212

原创 【三部曲03】从XGBoost到LightGBM
参考文献引用来源:1.lightgbm论文翻译2.lightgbm论文翻译解读3.LightGBM——提升机器算法(图解+理论+安装方法+python代码)4.论文原文下载Question1. LightGBM提出的原因或者说背景是什么?概括:面对稀疏、大数据场景,计算方式过于耗时我们知道在LightGBM出现之前,已经有了例如 XGBoost 这样的优化很细致的工程实现。但是尽管...
2019-06-27 15:31:26
595

转载 【转】七大查找算法总结
参考博客1.顺序查找思路:从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。2.二分查找思路:也称为折半查找,属于有序查找算法。用给定值k先与中间结点的关键字比较,中间结点把线形表分成两个子表,若相等则查找成功;若不相等,再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表,...
2019-06-23 23:23:22
5501

原创 剑指offer思路总结
统一格式前注:‘’‘’标题对应《剑指offer》题号时间复杂度空间复杂度思路:包括解题思路和编程中的技巧教训:编程过程中需要注意的地方以及存在的惯性错误‘’‘’1.赋值运算符函数(略)2.实现Singleton模式(略)3.数组中重复的数字:时间复杂度:O(n);空间复杂度:O(1);思路:从0~n-1获得启发,各个数字值应当与所在数组下标一致,不一致则调换,当调换...
2019-06-16 00:46:26
1278

原创 【转】十大经典排序算法最强总结
参考地址1.冒泡排序思路:比较相邻的元素。如果第一个比第二个大,就交换它们两个;对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;针对所有的元素重复以上的步骤,除了最后一个;2.选择排序思路:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推...
2019-06-10 18:22:56
765

原创 【三部曲02】从GBDT到XGBoost
参考文献引用来源:1.XGBoost论文翻译和理解2.CART,回归树,GBDT,XGBoost,LightGBM一路理解过来Question1. 从论文本身表述看,xgboost有哪些工作点?【1】设计和构建高度可扩展的端到端提升树系统。【2】提出了一个理论上合理的加权分位数略图。 这个东西就是推荐分割点的时候用,能不用遍历所有的点,只用部分点就行,近似地表示,省时间。【3】引入了一...
2018-11-22 11:56:39
648
1

原创 【三部曲01】从CART到GBDT
参考文章引用来源:1.GBDT入门教程之原理、所解决的问题、应用场景讲解2.《统计学习方法》李航3.Question1. 首先明确,GBDT是做什么用的??GBDT (Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来...
2018-11-20 18:43:26
2022
原创 PPT笔记
PPT笔记一、常用插件piti、islide、口袋动画二、设计美感十足的字体本质:文字的意义在于使读者从我们规定好的角度去思考问题1.常见问题 问题1:画面呆板 解决方法:慎用艺术字、阴影、特效 问题2:字体丢失 解决方法:字体嵌入(防止移植时候丢失):文件-》选项-》保存-》将字体嵌入文件 问题3:字库不全 解决方法:规避冷门字库,一般使用常见字库(如汉仪...
2020-04-03 16:38:38
493
原创 Keras文档学习08.局部连接层&嵌入层&融合层&高级激活层&批量标准化层&噪声层
一、局部连接层关键词:LocallyConnected1D、LocallyConnected2D原文地址:文档对应地址LocallyConnected1D 层与 Conv1D 层的工作方式相同,除了权值不共享外, 也就是说,在输入的每个不同部分应用不同的一组过滤器。二、嵌入层关键词:embedding原文地址:文档对应地址keras.layers.Embedding(input_d...
2019-10-22 21:12:53
677
原创 深入浅出MySQL学习笔记(二)
参考文献第七章、表类型(存储引擎)的选择1.两种查看当前引擎的方法:【1】 SHOW ENGINES \G【2】SHOW VARIABLES LIKE ‘have%’;2.改变已有表的存储引擎:可以使用 ALTER TABLE 语句,将一个已经存在的表修改成其他的存储引擎: alter table ai engine = innodb;3.几种常用存储引擎:MyISAM引擎(1...
2019-09-15 22:35:39
207
原创 红黑树常见面试问题整理
参考文献1.红黑树知识点结构图2.红黑树漫画初步解读3.笔试面试常考数据结构红黑树性质总结4.教你初步了解红黑树(很完整的博客!!)一、定义红黑树是一种特定类型的二叉树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组。它是在1972年由RudolfBayer发明的,他称之为"对称二叉B树",它现代的名字是在LeoJ.Guibas和RobertSedgewick于197...
2019-09-15 16:03:20
16462
3
原创 堆排序原理和实现
参考文献1.堆排序原理2.堆排序的手写实现堆排序思想Step 1: 构造初始堆初始化堆时是对所有的非叶子结点进行筛选;最后一个非终端元素的下标是[n/2]向下取整,所以筛选只需要从第[n/2]向下取整个元素开始,从后往前进行调整。Step 2:进行堆排序堆排序是一种选择排序。建立的初始堆为初始的无序区。排序开始,首先输出堆顶元素(因为它是最值),将堆顶元素和最后一个元素交换...
2019-09-15 14:36:03
176
原创 排序算法的稳定性
参考文献1.排序算法的稳定性及其意义2.稳定排序和不稳定排序3.排序算法的稳定性总结稳定性的定义假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,ri=rj,且 ri在rj之前,而在排序后的序列中,ri仍在rj之前,则称这种排序算法是稳定的;否则称为不稳定的。稳定性的意义1、如果只是简单的进行数字的排序,那么稳定性将...
2019-09-15 12:18:46
254
原创 深入浅出MySQL学习笔记(一)
参考文献1.博客12.博客2第一章、mysql的安装与配置第二章、SQL基础sql分类:(1)DDL:数据库定义语言,用于定义表,列,索引等数据库对象. create,drop,alter等(2)DML:数据库操纵语言,增删改查数据库的记录insert,delete,update,select等(3)DCL:数据库控制语言,定义了数据库的表,字段,用户的访问权限和安全级别 ...
2019-09-14 18:57:40
309
原创 关于make_heap和priority_queue
参考文献1.stl里关于heap的函数与priority_queue的区别2.C++中两种实现堆的方式:make_heap和priority_queue3.[STL]heap和priority_queue大家都知道,priority_queue是用堆实现的,可以通过重载()运算符选择使用最大堆或最小堆。以前一直觉得stl里面的heap相关的函数都是多余的,因为一般的heap操作都可以用p...
2019-09-09 21:25:13
920
原创 GBDT、XGBoost潜在问题攻防解决方案
参考文献1.参考文献12.我爱机器学习——xgboost详解(非常推荐!!!)3.几个模型的对比4.5.问题1:xgboost工具支持并行。boosting不是一种串行的结构吗?怎么并行的?注意xgboost的并行不是tree粒度的并行,xgboost也是一次迭代完成才能进行下一次迭代的(第t次迭代的代价函数里面包含了前面t-1次迭代的预测值)。xgboost的并行是在特征粒度上的...
2019-09-05 16:00:19
762
原创 Stacking与Blending以及相关的heamy库的使用收集
参考文献1.heamy官方文档2.heamy的github仓库3.heamy库中核心模块的介绍博客4.heamy库使用示例一、关于Stacking和Blending的比较核心区别:前者基于交叉验证,后者基于留出法很多人stack和blend是混着叫的,所以不必纠结这个名字,不要着相。只要知道:【1】stack是用cv交叉验证来得出元模型的特征(一个基模型产出一个元特征作为二级模型...
2019-09-01 13:01:42
1133
原创 侯捷STL学习笔记
参考文献1.侯捷-STL与泛型编程笔记(第一讲、容器概述——0.概述)2.侯捷-STL与泛型编程笔记(第二讲、源码分析——0.源码)3.STL"源码"剖析-重点知识总结一、简介C++ 标准库(STL大部分属于C++标准库)—— STL和标准库的关系STL 标准模板库标准库以header files形式呈现(头文件)C++标准库的header files不带副档名,如:#inclu...
2019-08-22 20:40:34
3125
原创 C++智能指针原理
参考文献1.C++智能指针2.C++智能指针简单剖析3.智能指针 auto_ptr 详解4.C++智能指针详解5.请你介绍一下C++的智能指针——牛客网一.什么是智能指针?为什么要有智能指针?在C++程序里,使用new关键字开辟的内存必须被手动delete掉,不然就会导致内存的泄漏,但是,当程序非常冗长,你能保证自己每一个手动开辟的内存块都释放了吗?在delete之前,倘若程序因为...
2019-08-20 20:22:29
385
原创 XGBoost使用相关收集--参数设定
参考文献:1.XGBOOST参数说明1.使用的基本结构:import xgboost as xgb# 读取数据dtrain = xgb.DMatrix('demo/data/agaricus.txt.train')dtest = xgb.DMatrix('demo/data/agaricus.txt.test')# 通过 map 指定参数param = {'max_depth':2...
2019-08-17 22:29:45
854
转载 【转】Python sklearn机器学习各种评价指标——Sklearn.metrics简介及应用示例
博客链接import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import ensemblefrom sklearn import metrics#################################################################...
2019-08-12 12:47:28
1884
python中的随机数生成问题
2014-11-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人