- 博客(107)
- 资源 (2)
- 收藏
- 关注
原创 运筹学学习笔记2 python-or tools 使用
在本节,可以通过如何开始用Python调用or tools:* 什么是优化问题* 怎么用Python解决优化问题* 更多Python 案例* 定义优化问题的类型什么是优化问题?优化问题目标是在一个问题的解空间里找到一个最优解。典型的案例就是车辆运输问题,解决打包及路径成本最小的问题。对于优化问题是通用的两个部分如下,* 目标。目标包含两个部分,① 目标的名称② 目标函数。目标名称名称必须是可量化,会以量词结尾。在日常工作通常是节省了 xx pd,工时,¥等。..
2021-08-13 02:01:07
2138
原创 运筹学学习笔记 1 - OR-Tools简介-翻译
OR-Tools 是解决组合优化问题最优解的谷歌开源项目。可解如以下问题,① 路径规划问题。在给定条件下,为运载车辆寻找最优的装卸路径。(其条件可以是,“运载车辆不能装超过2万镑的货物”,“所有的货物必须在两小时内完成”)。② 调度在复杂任务下最有的调度流程。③ 装箱问题如何在有限的体积下,最多的装更多物品。在大多数情况下,这些问题都是有很多的解,这些解太多以至于不能将其枚举完。为了解决这个问题,OR-Tools 使用state-of-the-art 算法 来缩小解的空间,来..
2021-08-10 14:28:31
909
1
原创 机器学习-基础算法-选择排序
前言排序是个老话题,虽然自己已经在练习高阶的一些算法,但是感觉排序一直未能总结,而且认为排序通透是有难度的。所以,在练习一些高阶的玩法后,再来看排序,最简单的选择排序。文章目录:从最为简单的代码,来一步步迭代实现选择排序 ,不那么生硬,直接丢出一段代码,这就是选择排序。当然这一过程也是看了结果之后的思考。一步步衍生出我们最终的选择排序算法。1、简单的for循环2、一维搜索3、选择排序的实现。1、f...
2018-05-13 20:09:58
614
原创 机器学习之特征工程——正态分布
前言本文总结性文章,主要是参考文章的整理。正态分布综合性文章*【程序员眼中的统计学(7)】正态分布的运用:正态之美why?Importance of data distribution in training machine learning modelsWhy is the normal distribution important?Can anyone tell me why we alway...
2018-05-05 01:32:04
3229
原创 机器学习——SVM算法面试总结
前言最近准备trans了,SVM作为一个ML er必备的,做下汇总,答案都在参考文章里。范围:度,*gu*歌,.analytics vidhya,某公众账号,*乎上,sklearn。1、基本概念:SVM的简介松弛变量软间隔support vector核函数2、原理为什么采用最大间隔为什么引入核函数SMO算法SVM的损失函数怎样处理多分类3、推导手撸对偶问题为什么转为对偶问题kkt 条件4、核函数有...
2018-04-28 10:43:04
1117
原创 机器学习-机器学习试题(二)
前言在网上找的一些试题及延伸的一些问题,以选择题为主,主要是关于基础理论知识,同时给出自己联想到的一些问题。当然基础问题应当包含算法本身的过程和某些推导过程。比如:LR、SVM的推导。试题这次分享的试题较为简单,都是基础概念,无太多的延伸问题。1. 下面哪个统计量可能大于1? A. logloss B. ROC AUC...
2018-04-22 19:20:03
3799
原创 Random Forest 简单的实现
前言本文仅记录Random Forest python代码实现。关于Random Forest 算法模型不做深入讨论。单颗树使用的是二叉搜索树。代码地址代码简单流程示意图:核心思路说明:1、数据加载和预处理2、决策树一类算法,重要点在于树停止生长的条件,如下:(当不满足树停止生长的条件时,就可以生长,二者是互斥的) a>当前的结点的左或右子树不能为空 b>当前结点中...
2018-04-22 13:23:37
1152
原创 机器学习-算法模型-线性回归的不断升级
前言本文是总结性的文档。主要是从简单的线性模型存在的问题,以及对解决这些问题后的模型比如:Lasso、Ridge、LR、SVM、LDA。获得启示:1、对基本线性模型有更深的理解2、将模型串起来。3、提供学习新的模型的方法。(基本模型,改进后"新"的模型)4、改进模型的一些思路。(能力有限,有些深入的部分未扩展)线性模型存在的问题及解决方案:问题1:鲁棒性较差解决方案: 空间变换。 ...
2018-04-21 16:20:37
1024
原创 机器学习-机器学习试题(一)
前言在网上找的一些试题及延伸的一些问题,以选择题为主,主要是关于基础理论知识,同时给出自己联想到的一些问题。当然基础问题应当包含算法本身的过程和某些推导过程。比如:LR、SVM的推导。试题试题1: 已知坐标轴中两点A(2,−2)B(−1,2),求这两点的曼哈顿距离(L1距离)。 答案:7 。向量AB(-3,4),L1 是向量中非零元素的绝对值和。问题延伸:机器学习算法中哪些应用了L1,哪些应用了L...
2018-04-21 11:20:21
33599
1
转载 机器学习-算法实现-PCA
前言:本文主要follow Sebastian Raschka大神的blog Implementing a Principal Component Analysis (PCA) – in Python, step by step,做下记录.PCA基本原理考察变量间的相关性找到少数的主成分代表原来的多个变量,同时尽可能保留原始信息保留的主成分间,不相关,数量远少于原变量的数量,从而达到降维的目的对...
2018-04-16 21:45:00
982
1
原创 机器学习-算法实现-朴素贝叶斯-贝叶斯公式再理解(二)
前言在上篇文章机器学习-算法实现-朴素贝叶斯(一) 了解了朴素贝叶斯来龙去脉。即: 贝叶斯公式+特征独立贝叶斯公式的本质是条件概率,特征独立假设的目的是为了可实现。本篇主要再从全概率的角度和实际试题的角度来理解贝叶斯公式。全概率个人理解描述如下: 在某已知的样本,可以完成对数据集分类,...
2018-04-14 21:46:09
551
原创 机器学习-算法实现-朴素贝叶斯(一)
前言声明:本篇是个人的学习记录,大神请绕行。主要内容:对朴素贝叶斯的理解。包含以下几个方面:1、基础2、公式的演变3、贝叶斯模型1、基础从数学公式推导的过程,认为其基础是条件概率。1.1 概率概率:对未知事物发生可能性的量化描述,量化是为了完成比较,得到差异,区分和排序。概率值是通过统计方法,假设,校验得来的量化值。1.2 条件概率: ...
2018-04-12 21:01:59
413
原创 机器学习--统计学(一)
前言我不是something ,所以以下言论,纯属自己思考,其正确与否有待考量,也希望有人批评指正。1、为什么看《统计学》?我看的是《统计学》(贾俊平著)这本书,原因是对kaggle上的discussion中提到的检验,第一次一脸懵逼,但是在后续研读中先是发现了《实用多元统计分析》这本书,而后又是找到了《统计学》这本书,但是一下被两本书,开篇的序吸引住了。于是这两本书就下单买了。2、统计学之美我个...
2018-04-03 14:07:47
1591
原创 数据结构&算法——递归
前言递归在较为高级的数算法实现中是常用的,比如深度优先搜索,暴力搜索。下面展示较为简单的递归代码执行的过程中。简单示例如下:示例1: public void recurisve() { Scanner inputUtil = new Scanner(System.in); String str = inputUtil.next(); if (str.equals("a")) { ...
2018-03-21 15:31:18
1006
原创 拟牛顿法——伪代码描述
前言为什么?为什么要有拟牛顿法?是因为Hession矩阵的逆矩阵计算较为复杂,所以提出用一个n阶矩阵来近似代替。要点如下:1、导数的定义推导出拟牛顿条件。2、当矩阵为正定矩阵时:设M是n阶方阵,如果对任何非零向量z,都有zTMz> 0,其中zT 表示z的转置,就称M正定矩阵(百科)3、设Hession矩阵为正定矩阵,泰勒级数二阶展开式忽略二次项完成近似代替。4、由牛顿法中,Xk的递推关系式可...
2018-03-18 12:07:37
1746
原创 机器学习——优化算法:牛顿法-伪代码描述算法
前言在上一篇文章中,我了解了关于牛顿法的基础。简单概括其中的要点:1、对于函数的泰勒级数展二阶开式2、优化目标是求出目标函数极小值点Xt,该点的重要特征是一阶偏导数为0.(利用这一特征建立等式关系,推导出x的递推式。)至此,整个牛顿法就能已经在自己心中有个蓝图。本次主要是用伪代码来描述整个算法过程,对于一个码农来说,感觉很有意思。伪代码: 关于算法优缺点,不在此贴了,伪代码参考...
2018-03-18 10:33:56
3637
原创 数据结构——堆
前言堆的存储结构说明此处讨论的堆是基于顺序存储结构,即数组存储,我实现的方式是Java中的ArrayList。必备知识点:下面讨论使用:nums[] 表示堆的顺序存储,nums[i]代表堆中的元素,i表示数组中的下标,nums[0]不存储元素为null。当1<=i<=(nums.length-1)/2时,有如下关系成立:1、nums[i]>=nums[2*i]&&...
2018-03-17 13:11:52
384
原创 机器学习——优化算法:牛顿法-初探
前言1、看了关于牛顿法相关的文章,下面是总结记录。2、感受的话:数学公式最为重要的是数学符号语言的理解,如果第一次看不懂很正常,保持住心态最为重要,然后将每个符号带入公式和公式描述语言里就能理解,还有一篇看不懂就看第二篇,第三篇....(ps:我是捏着鼻子看完又臭又长的公式)必备知识点:1、泰勒级数展开式(ps:这个要记下来,不要问为什么)2、极值点对任意的函数f(x)的一阶导为0时,该点一定是极...
2018-03-15 23:31:34
701
原创 leetcode258 题解
前言LeetCode 258 题目难度等级,easy(官方给的)。leetcode258题目描述Given a non-negative integer num, repeatedly add all its digits until the result has only one digit.For example:Given num = 38, the process is like:...
2018-03-12 12:19:54
690
原创 编程中的位——不用加法实现两个数的和
不用加法实现两个数的和题目给出两个整数a和b, 求他们的和, 但不能使用 + 等数学运算符代码: public int aplusb(int a, int b) { while (b != 0) { int _a = a ^ b;// 计算不加进位的结果 int _b = (a & b) << 1;//...
2018-03-10 13:01:51
838
原创 一点点蚕食JDK源码(一)ArrayList源码
一点点蚕食JDK源码(一)ArrayList源码在对数据结构和算法有一定了解之后,我开始学习JDK源码,下面是自己的记录。采用的方式是将JDK源码中主要的类切离出来,含有集合Collection,并发JUC两个主要的包。本篇主要是学习ArrayList源码。切分出的代码,我放到git上,有兴趣继续研读的看官,可以fork。ArrayList源码先来看add方法: /
2018-01-26 00:24:27
300
原创 sklearn 官方文档翻译--SVM
支持向量机(-)声明:本人初学,属于简单记录。若有错误,望看官不吝指正。原文链接支持向量机(SVM)Support vector machines (SVMs) are a set of supervised learning methods used for classification, regression and outliers detection.s
2018-01-08 17:45:33
2403
原创 推荐系统学习之近邻算法推荐10个电影
推荐系统学习之近邻算法推荐10个电影实验环境:surprise (surprise地址)+python2.7实验思路如下图:代码如下:# coding:utf-8 设置编码'''使用MovieLens的数据,根据某个电影名,计算与其相邻最近的10个电影'''#导入工具库import osimport iofrom surprise import Datas
2017-12-25 22:24:09
2635
原创 《剑指offer升级打怪》--链表
《剑指offer升级打怪》--链表(上)写在前面: 本人入门,以下纯属学习记录,若有错误请指正,还有代码有些是参考的。今天凌晨了(估计是疯了,MD明天怎么上班),来刷一篇,攒了好久了,刷剑指offer,刷的蛋疼。下面总结下其中关于链表的题目。题目有:画个图显得题目好多这里说明一下,我个人是个彩笔,有些代码是从网上的参考(你要说抄袭,这个我承认。)先来看个简单的
2017-12-20 23:38:03
418
原创 GBM调试参数学习
GBM、xgboost参数调试学习 主要参考文章: http://blog.youkuaiyun.com/han_xiaoyang/article/details/52663170 (gbm) http://blog.youkuaiyun.com/han_xiaoyang/article/details/52665396(xgboos
2017-12-05 17:05:58
1879
原创 第七节 使用matplotlib可视化数据
第七节 使用matplotlib可视化数据1、一幅图包含的元素数据区 data横、纵轴图例标题--title2、绘制一幅图像的步骤:导入matplotlib相关的工具包准备数据 ,numpy数组绘制原始的曲线添加标题、坐标轴、title、刻度、图例添加文字说明、注解显示、保存绘图结果案例1:
2017-11-04 11:44:58
432
原创 剑指offer中树的总结(基于树的深度)
剑指offer中树的总结(基于树的深度) 虽说把该题归到基于树深度的扩展题目,但是树深度可以看做基于最为基本的前序遍历,中序遍历,后序遍历的递归写法。 求树的深度的程序如下: public int TreeDepth(TreeNode root) { if (root==null) { return 0; } int m =TreeDepth(root.le
2017-08-28 16:29:15
263
原创 剑指offer中树的总结(基于层次遍历)
剑指offer中树的总结(一) 第一类型的题目:树的层次遍历及拓展应用。 基础题:从上往下打印出二叉树的每个节点,同层节点从左至右打印。 public ArrayList PrintFromTopToBottom(TreeNode root) { // 所有结点的list ArrayList allN
2017-08-28 13:37:40
456
原创 机器学习——Python(六)
机器学习——Python(六) 模块练习,对于模块化,主要是模板练习,有固定的格式。 1、文档支持运行环境 2、代码编码格式设置 3、文档第一个字符串为模块注释 4、模块化的作者 5、编写函数 6、__name__='__main__' 函数名()'a test modle'_author_ = 'caiqiang'imp
2017-08-18 14:11:25
260
原创 机器学习——Python(五)
机器学习——Python(五) 本篇主要练习函数式编程,这里关键点:map/reduce、排序、lambda匿名函数、filter、函数作为参数、函数作为返回值。 #coding:utf-8print "-------------Higher-order function--------------------"print "以abs函数为例",abs(-10)print "ab
2017-08-17 15:51:26
340
原创 机器学习——Python(四)
机器学习——Python(四)此处主要练习的是:Python的高级特性:切片、列表生成公式、迭代、生成器#coding:utf-8print "-------------切片----------------------"# 定义一个数组L=[1,2,3,4,5,5]# 访问数组的指定区间的元素print "访问数组的第2个到第4个元素",L[1:3]#注意此处返回 [2, 3],
2017-08-16 23:23:29
281
原创 机器学习——Python(三)
机器学习——Python(三)在练习函数中的体会: 关键点:可变参数、关键参数、组合参数、同一个函数可以有多个返回值、默认参数的坑#coding:utf-8#以下是关于函数的练习import mathprint "取绝对值函数 ",abs(-12222)print "比较两个数大小函数 ",cmp(3,5),cmp(9,7),cmp(9,9)print "----
2017-08-16 19:49:39
281
原创 机器学习——Python(二)
机器学习——Python(二) 本篇主要是对list,tuple的练习: 1、与Java不同的打印可以使用 -n 来倒序打印数组 2、tuple 中包含基本数组类型是不可以改变,但是包含复杂的数据类型时,该元素内的数据是可以改变的。#coding:utf-8#数组的下标同样是从0开始print '--------------打印数组---------------'
2017-08-16 13:29:32
330
原创 机器学习序
机器学习序 兜兜转转,我又回到这个机器学习,不知道啊,什么情结,听着《那些年》。新的旅程开始了,报了班,XX培训机构。 过去一年做的都是Java web,也不觉得什么,Java web养活了自己,现在的收入还行,但是还是想学机器学习,学了。 在此,我会分享自己的每次课程的学习,还是那颗虔诚的心,迎来新的开始。 机器学习: 我脑海中还是在大学时的了解,大部分是
2017-08-15 17:35:16
290
原创 Springboot连接同一物理机上多数据库
Springboot同一物理机上配置多库 项目开发需要,需要在同一个数据源下使用两个库。 场景:开发框架是Springboot,两个数据库,在同一个物理机上,即spring.datasource.url是同一个。 在网上查阅相关资料,发现多说是指spring.datasource.url是两个值,即在两个库在两台物理机上
2017-08-10 11:20:33
1154
1
转载 Java 计算两个日期相差月数、天数
Java 计算两个日期相差月数、天数 原文地址:http://www.cnblogs.com/mingforyou/p/3545174.html 计算相差的月数:package com.myjava;import java.text.ParseException;import java.text.SimpleDateFormat;import java.util.Calen
2017-06-04 09:47:03
4174
1
原创 C语言小知识点
C语言小知识点 在公司考核后打算重新学习数据结构,选择实现的语言是C,但是好多都忘记了,重新学习一下吧。 1、指针:个人理解就是个存放对应变量的地址值。 指针变量:就是可以存放指针的变量,即这个变量的值是指针,且和该指针存放的数据类型对应的。 这个概念在现在来看很好理解。是需要一些基础的,可以联系计算机的发展史,最初的一台计算机使用来存储数据的,后来才会计
2017-05-06 16:09:32
365
转载 使用System.getProperty方法,如何配置JVM系统属性
转自http://www.cnblogs.com/acm-bingzi/p/6673823.html使用System.getProperty方法,如何配置JVM系统属性原创文章,欢迎转载,转载请注明出处!很多时候我们需要在项目中读取外部属性文件,用到了System.getProperty("")方法。这个方法需要配置JVM系统属性,那么如何配置呢?那就是使用
2017-04-19 20:57:28
1395
原创 并发编程实战第三章(二)
Volatile关键字解读及案例 在上篇文中指出Volatile的轻量、读取拿到的是最新写入值、严格的使用条件、只能保证可见性。本篇中主要加深对其理解和使用demo。 在理解之前,要能先了解Java的内存模型。明确在内存模型中有严格的区分:主内存和线程内存。主内存是线程间共享的,比如堆内存。线程内存是指每个线程都会有工作内存,工作内存是不能共享,即其他线程不可以访问的,且对于数据操
2017-04-10 22:05:23
289
deep ctr torch 源代码
2023-03-24
ctr预估公开数据集 avazu avazu-ctr-prediction
2023-03-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人