达瓦里氏吨吨吨-优快云博客

原创笔试IO处理收集

场景1.求a+b的和#include <iostream>using namespace std;int main() { int a,b; while(cin >> a >> b)//注意while处理多个case cout << a+b << endl;}场景2.给出N阶方阵所有的数，求方...

2019-08-02 23:03:29 337

原创 GBDT理解2.0

参考文献1.GBDT原理与Sklearn源码分析-回归篇2.GBDT原理与Sklearn源码分析-分类篇3.GBDT原理与实践-多分类篇前提：CART可以用于回归和分类，那么到底用回归还是分类呢？我们知道，GBDT拟合的目标是一个梯度值，这个值当然是一个连续值或者说实值，所以在GBDT里，通通都是回归树！！！如果损失函数选的是最小平方损失函数，那么拟合残差就和拟合损失函数的负梯度是等...

2019-07-26 14:34:36 236

原创【三部曲03】从XGBoost到LightGBM

参考文献引用来源：1.lightgbm论文翻译2.lightgbm论文翻译解读3.LightGBM——提升机器算法（图解+理论+安装方法+python代码）4.论文原文下载Question1. LightGBM提出的原因或者说背景是什么？概括：面对稀疏、大数据场景，计算方式过于耗时我们知道在LightGBM出现之前，已经有了例如 XGBoost 这样的优化很细致的工程实现。但是尽管...

2019-06-27 15:31:26 654

转载【转】七大查找算法总结

参考博客1.顺序查找思路：从数据结构线形表的一端开始，顺序扫描，依次将扫描到的结点关键字与给定值k相比较，若相等则表示查找成功；若扫描结束仍没有找到关键字等于k的结点，表示查找失败。2.二分查找思路：也称为折半查找，属于有序查找算法。用给定值k先与中间结点的关键字比较，中间结点把线形表分成两个子表，若相等则查找成功；若不相等，再根据k与该中间结点关键字的比较结果确定下一步查找哪个子表，...

2019-06-23 23:23:22 5539

原创剑指offer思路总结

统一格式前注：‘’‘’标题对应《剑指offer》题号时间复杂度空间复杂度思路：包括解题思路和编程中的技巧教训：编程过程中需要注意的地方以及存在的惯性错误‘’‘’1.赋值运算符函数（略）2.实现Singleton模式（略）3.数组中重复的数字：时间复杂度：O(n)；空间复杂度：O(1)；思路：从0~n-1获得启发，各个数字值应当与所在数组下标一致，不一致则调换，当调换...

2019-06-16 00:46:26 1337

原创【转】十大经典排序算法最强总结

参考地址1.冒泡排序思路：比较相邻的元素。如果第一个比第二个大，就交换它们两个；对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对，这样在最后的元素应该会是最大的数；针对所有的元素重复以上的步骤，除了最后一个；2.选择排序思路：首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推...

2019-06-10 18:22:56 810

原创【三部曲02】从GBDT到XGBoost

参考文献引用来源：1.XGBoost论文翻译和理解2.CART，回归树，GBDT，XGBoost，LightGBM一路理解过来Question1. 从论文本身表述看，xgboost有哪些工作点？【1】设计和构建高度可扩展的端到端提升树系统。【2】提出了一个理论上合理的加权分位数略图。这个东西就是推荐分割点的时候用，能不用遍历所有的点，只用部分点就行，近似地表示，省时间。【3】引入了一...

2018-11-22 11:56:39 735 1

原创【三部曲01】从CART到GBDT

参考文章引用来源：1.GBDT入门教程之原理、所解决的问题、应用场景讲解2.《统计学习方法》李航3.Question1. 首先明确，GBDT是做什么用的？？GBDT (Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来...

2018-11-20 18:43:26 2078

原创 PPT笔记

PPT笔记一、常用插件piti、islide、口袋动画二、设计美感十足的字体本质：文字的意义在于使读者从我们规定好的角度去思考问题1.常见问题问题1：画面呆板解决方法：慎用艺术字、阴影、特效问题2：字体丢失解决方法：字体嵌入（防止移植时候丢失）：文件-》选项-》保存-》将字体嵌入文件问题3：字库不全解决方法：规避冷门字库，一般使用常见字库（如汉仪...

2020-04-03 16:38:38 536

原创 Tensorflow2.0学习笔记01.基本数据类型和操作

2019-10-30 10:45:29 396

原创 Keras文档学习10.编写你自己的 Keras 层

编写你自己的 Keras 层占位，建议阅读已实现好的层的源代码！！

2019-10-22 23:05:27 438

原创 Keras文档学习09.层封装器

关键词：LocallyConnected1D、LocallyConnected2D原文地址：文档对应地址

2019-10-22 22:49:07 300

原创 Keras文档学习08.局部连接层&嵌入层&融合层&高级激活层&批量标准化层&噪声层

一、局部连接层关键词：LocallyConnected1D、LocallyConnected2D原文地址：文档对应地址LocallyConnected1D 层与 Conv1D 层的工作方式相同，除了权值不共享外，也就是说，在输入的每个不同部分应用不同的一组过滤器。二、嵌入层关键词：embedding原文地址：文档对应地址keras.layers.Embedding(input_d...

2019-10-22 21:12:53 732

原创 Keras文档学习00.Keras的模块结构

参考文献（2016年前的组织结构图）

2019-10-21 15:54:12 310

原创深入理解Python特性笔记

2019-09-22 17:36:31 374

原创【西瓜书框图笔记12】第十四章——隐马尔科夫模型（HMM）

2019-09-22 17:34:46 313

原创【西瓜书框图笔记11】第十三章——半监督学习

2019-09-22 17:34:04 348

原创【西瓜书框图笔记10】第十一章——特征选择与稀疏学习

2019-09-22 17:31:45 235

原创【西瓜书框图笔记09】第十章——降维与度量学习

2019-09-22 17:29:39 195

原创【西瓜书框图笔记08】第九章——聚类

2019-09-22 17:27:22 216

原创【西瓜书框图笔记07】第八章——集成学习

2019-09-22 17:26:25 195

原创【西瓜书框图笔记06】第七章——贝叶斯分类器

2019-09-22 17:24:24 223

原创【西瓜书框图笔记05】第六章——支持向量机

2019-09-22 17:21:19 248

原创【西瓜书框图笔记04】第五章——神经网络

2019-09-22 17:20:08 179

原创【西瓜书框图笔记03】第四章——决策树

2019-09-22 17:19:04 464

原创【西瓜书框图笔记02】第三章线性模型

2019-09-22 17:14:03 157

原创【西瓜书框图笔记01】第二章——模型评估与选择

2019-09-22 17:13:31 160

原创深入浅出MySQL学习笔记（二）

参考文献第七章、表类型（存储引擎）的选择1.两种查看当前引擎的方法：【1】 SHOW ENGINES \G【2】SHOW VARIABLES LIKE ‘have%’；2.改变已有表的存储引擎：可以使用 ALTER TABLE 语句，将一个已经存在的表修改成其他的存储引擎： alter table ai engine = innodb；3.几种常用存储引擎：MyISAM引擎（1...

2019-09-15 22:35:39 247

原创红黑树常见面试问题整理

参考文献1.红黑树知识点结构图2.红黑树漫画初步解读3.笔试面试常考数据结构红黑树性质总结4.教你初步了解红黑树（很完整的博客！！）一、定义红黑树是一种特定类型的二叉树，是在计算机科学中用到的一种数据结构，典型的用途是实现关联数组。它是在1972年由RudolfBayer发明的，他称之为"对称二叉B树"，它现代的名字是在LeoJ.Guibas和RobertSedgewick于197...

2019-09-15 16:03:20 16550 3

原创堆排序原理和实现

参考文献1.堆排序原理2.堆排序的手写实现堆排序思想Step 1：构造初始堆初始化堆时是对所有的非叶子结点进行筛选；最后一个非终端元素的下标是[n/2]向下取整，所以筛选只需要从第[n/2]向下取整个元素开始，从后往前进行调整。Step 2：进行堆排序堆排序是一种选择排序。建立的初始堆为初始的无序区。排序开始，首先输出堆顶元素（因为它是最值），将堆顶元素和最后一个元素交换...

2019-09-15 14:36:03 197

原创排序算法的稳定性

参考文献1.排序算法的稳定性及其意义2.稳定排序和不稳定排序3.排序算法的稳定性总结稳定性的定义假定在待排序的记录序列中，存在多个具有相同的关键字的记录，若经过排序，这些记录的相对次序保持不变，即在原序列中，ri=rj，且 ri在rj之前，而在排序后的序列中，ri仍在rj之前，则称这种排序算法是稳定的；否则称为不稳定的。稳定性的意义1、如果只是简单的进行数字的排序，那么稳定性将...

2019-09-15 12:18:46 291

原创深入浅出MySQL学习笔记（一）

参考文献1.博客12.博客2第一章、mysql的安装与配置第二章、SQL基础sql分类：（1）DDL：数据库定义语言，用于定义表，列，索引等数据库对象. create,drop,alter等（2）DML：数据库操纵语言，增删改查数据库的记录insert，delete，update，select等（3）DCL：数据库控制语言，定义了数据库的表，字段，用户的访问权限和安全级别 ...

2019-09-14 18:57:40 356

原创关于make_heap和priority_queue

参考文献1.stl里关于heap的函数与priority_queue的区别2.C++中两种实现堆的方式:make_heap和priority_queue3.[STL]heap和priority_queue大家都知道，priority_queue是用堆实现的，可以通过重载（）运算符选择使用最大堆或最小堆。以前一直觉得stl里面的heap相关的函数都是多余的，因为一般的heap操作都可以用p...

2019-09-09 21:25:13 1005

原创 GBDT、XGBoost潜在问题攻防解决方案

参考文献1.参考文献12.我爱机器学习——xgboost详解（非常推荐！！！）3.几个模型的对比4.5.问题1：xgboost工具支持并行。boosting不是一种串行的结构吗？怎么并行的？注意xgboost的并行不是tree粒度的并行，xgboost也是一次迭代完成才能进行下一次迭代的（第t次迭代的代价函数里面包含了前面t-1次迭代的预测值）。xgboost的并行是在特征粒度上的...

2019-09-05 16:00:19 796

原创【转载】关于递归的思想理解

原文地址

2019-09-05 11:51:25 233

原创 Stacking与Blending以及相关的heamy库的使用收集

参考文献1.heamy官方文档2.heamy的github仓库3.heamy库中核心模块的介绍博客4.heamy库使用示例一、关于Stacking和Blending的比较核心区别：前者基于交叉验证，后者基于留出法很多人stack和blend是混着叫的，所以不必纠结这个名字，不要着相。只要知道：【1】stack是用cv交叉验证来得出元模型的特征（一个基模型产出一个元特征作为二级模型...

2019-09-01 13:01:42 1188

原创侯捷STL学习笔记

参考文献1.侯捷-STL与泛型编程笔记（第一讲、容器概述——0.概述）2.侯捷-STL与泛型编程笔记（第二讲、源码分析——0.源码）3.STL"源码"剖析-重点知识总结一、简介C++ 标准库（STL大部分属于C++标准库）—— STL和标准库的关系STL 标准模板库标准库以header files形式呈现（头文件）C++标准库的header files不带副档名，如：#inclu...

2019-08-22 20:40:34 3247

原创 C++智能指针原理

参考文献1.C++智能指针2.C++智能指针简单剖析3.智能指针 auto_ptr 详解4.C++智能指针详解5.请你介绍一下C++的智能指针——牛客网一.什么是智能指针？为什么要有智能指针？在C++程序里，使用new关键字开辟的内存必须被手动delete掉，不然就会导致内存的泄漏，但是，当程序非常冗长，你能保证自己每一个手动开辟的内存块都释放了吗？在delete之前，倘若程序因为...

2019-08-20 20:22:29 425

原创 XGBoost使用相关收集--参数设定

参考文献：1.XGBOOST参数说明1.使用的基本结构：import xgboost as xgb# 读取数据dtrain = xgb.DMatrix('demo/data/agaricus.txt.train')dtest = xgb.DMatrix('demo/data/agaricus.txt.test')# 通过 map 指定参数param = {'max_depth':2...

2019-08-17 22:29:45 924

转载【转】Python sklearn机器学习各种评价指标——Sklearn.metrics简介及应用示例

博客链接import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import ensemblefrom sklearn import metrics#################################################################...

2019-08-12 12:47:28 1937

微博图片爬取工具

python中的随机数生成问题