- 博客(26)
- 资源 (6)
- 收藏
- 关注
原创 三生万物:决策树
一、概述不知怎么回事,提到决策树我就想起”道生一,一生二,二生三,三生万物“这句话,大概是因为决策树从一个根节点慢慢“长”成一棵树,也要经历“一生二,二生三”的过程。决策树本质上就是一种二叉树,根据特定的标准不停的分成左右两个子树,直到符合某种条件停止。树算法解释性强、简单直观以及接近人的决策方式使它成为流行的机器学习算法之一。当决策树与装袋法(Bag)、提升法(Boosting)结合之后,可以成为
2017-11-11 16:53:19
598
原创 mit scheme常用命令
c-x z转到命令模式 (edit)转到编辑模式 c-x c-e执行光标前命令 c-i自动缩进 c-x c-w保存文件
2016-09-29 15:18:58
863
原创 HTTPS为什么是安全的
HTTP我们都知道是超文本传输协议,HTTPS与HTTP一字之差,它到底是什么呢?引用《HTTP权威指南》的介绍: HTTPS是最常见的HTTP安全版本。它得到了很广泛的应用,所有主要的商业浏览器和服务器上都提供HTTPS。HTTPS将HTTP协议与一组强大的对称、非对称和基于证书的加密技术结合在一起,使得HTTPS不仅很安全,而且很灵活,很容易在处于无序状态的、分散的全球互联网上进行管理。H
2016-08-23 17:08:28
1210
翻译 加密和解密
最近学习HTTPS的知识,涉及了一些加密和解密的内容,在Mozilla MDN上找到一篇文章Encryption and Decryption,清晰明了,特地翻译一下,与大家分享。加密(Encryption )是将原始信息转化为对其他用户非明了信息的过程,除非信息的接受者;解密(Decryption)是将非明了信息转化为原始数据的过程。加密算法,也称作密码(cipher, 注:与传统意义上的密码不同
2016-08-22 16:40:34
1766
翻译 数字签名是什么
随着现在网银、电子商务的普及,“数字签名”屡屡越来越多的被提到,我也曾一度迷惑,直到看到Mozilla MDN上的一篇文章Digital Signatures,下面我将翻译一下这篇文章。加密和解密解决了三大互联网安全隐患(窃听、篡改、伪装)之窃听的问题,但是却没法避免信息被篡改。本篇文章将向你介绍公共秘钥加密如何解决这个问题。信息篡改及相关的认证技术依赖于一个数学函数单向散列函数(one-way h
2016-08-20 11:49:30
882
原创 他们征友(婚)时,他们征什么?
有道是年年岁岁花相似,岁岁年年征友人,征友贴一茬又一茬,简历投了一波又一波,为什么迟迟得不到回复?当男女征友时,他们到底在征什么?你真的看懂征友贴了吗?你还在为你屡屡投条未收到答复而苦恼吗?你还在为简历被女神刷掉自怨自艾吗?本文以北邮人论坛征友贴为主要原料,使用独家秘制八卦手法,希望从中发现一些有意思的事,本着娱乐至上,看热闹不嫌事大的原则,有些观点和分析请观者自行甄别,图例中F(emale)代表
2016-08-17 22:06:53
907
原创 简洁高效的Boyer-Moore算法
字符串匹配有着很广泛的应用,例如在文档软件中查找关键词,网站过滤敏感词,生物学家查找某种模式的基因组序列等等,很多人听说过著名的KMP算法,Boyer-Moore算法做到的更多,有迹象表明在某些情况下效率是前者的3-5倍,且实现起来更加简单,符合我简单高效的原则。下面先抛开算法不谈,如果让自己在ABCSAKDFFEHHJDDEFKLD中查找DDEFK字符串,应该如何做?ABCSAKDFFEHHJDD
2016-07-31 21:40:41
729
转载 win7计划任务执行BAT文件问题
今天下午做了一个调用java 可执行jar的程序,想通过win7的计划任务来调用批处理命令:java -jar BIDropSyc.jar 或者javaw -jar BIDropSyc.jar 但添加以后发现win7没有调用jar程序,单独点击批处理文件能执行。发现问题是由于没有添加批处理文件所在路径。在如下图框中添加上即可。源地
2016-06-14 17:38:27
3659
转载 log4j.properties配置详解与实例-全部测试通过
最近使用log4j写log时候发现网上的写的都是千篇一律,写的好的嘛不全,写的全一点的嘛没有一点格式,看着累。这里把网上收集到的整理了一下,并且全部都在机器上测试成功了。这么好的文档估计没有了吧? ################################################################################ #①配置根Logger,其语法为
2016-06-13 17:40:32
525
原创 IE6下的一些常见问题
下面是项目中常见的ie6问题,记录一下,以备不时之需。 1. 日期框不显示,表现为页面的日期框点击无反应 原因:日期控件WdatePicker跨域设置问题。 解决方法:WdatePicker.js将$crossFrame:true修改为false,清理缓存。页面不能正常跳转,表现为页面中文件不能下载或者跳转动作没有执行 原因:ie6对window.open(url)支持度不好。 解决方法
2016-04-05 14:37:58
456
原创 Javascript中的this
对于js的函数有两个特殊的关键字,this和arguments,后者存储的是函数的参数,类似于一个数组。例如如下的函数,var testArgus = function() {console.log(arguments);}// [1, 2]testArgus(1,2)arguments的含义比较明确,而this就不那么直白了,this指代的是函数运行时所处的上下文。这句话有两点需要注意:一是t
2016-03-27 23:07:42
467
原创 Oracle中的高水位线
高水位线(High Water Mark, HWM)类似于一个指针,用来标识分配给段(segment)的块(block)状态。块是Oracle中数据分配和操作的最小单位,段是类似于表、索引这样的数据库实体。块有下面几种状态:在HWM之上,块是未格式化和未使用的(unformated and unused)在HWM之下,块又有下面几种状态: 分配的(allocated),但是还未格式化格式化并
2016-03-25 09:37:21
461
原创 Javascript中的原型
首先要明确的是,js中的原型是一个对象,而且这个对象是函数(对象)的一个属性,即prototype。当以构造函数的形式调用函数时,即new一个函数,会创建一个实例对象,这个实例的__proto__属性会指向构造函数的prototype,由于原型也是对象,所以它也有一个__proto__属性,这个属性指向的是原型对象的构造函数的prototype,这样一步一步上溯到Object.prototype
2016-03-20 13:28:20
416
原创 统计学中的p值
在我看来,假设检验从本质上是一种反证法。当你想证明一样事物是对的,有时候不太好证明,因为一件你以为对的东西可能只是因为你还没发现它错的一面,相反你想证明一件事物是错的就容易多了。在假设检验中,证明备择假设H1存在困难,我们就去证明它的反面原假设H0。p值一直是一个令人迷惑的地方,p值实际上是当H0假设为真,一些极端情况出现的概率。即 p值={极端情况概率|H0}p值 = \{极端情况概率|H0\
2016-03-20 11:36:27
4964
原创 CSS选择器
1.ID和类选择器.specialtext {font-style: italic;}p.specialtext {color: red} /* class为specialtext的p元素 */.specialtext.featured {font-size: 100%;} /* class为specialtext和featured的元素*/#specialtext {}p#specialte
2016-01-20 13:35:59
398
翻译 VIM中的正则表达式
VIM作为一款编辑软件有着强大的操作指令,灵活的配置方法,通过适当的组合能够实现令人眼花缭乱的功能,而正则表达式作为一门处理文本和数据的重要工具,和VIM异曲同工,通过元字符的简单组合就可以匹配千变万化的文本和数据,它是如此的强大以至于有些任务如果没有正则表达式几乎没有其他好的方法实现。下面看看这两个强大的武器是如何结合在一起的。本文翻译自http://www.vimregex.com/,算是一篇比
2015-11-01 21:00:10
4654
1
原创 大道至简:朴素贝叶斯分类器
万物之始,大道至简,衍化至繁。 ——ifelse(is.element(this, 道德经), 道德经, unknown)一、背景 提到贝叶斯分类,首先来看下贝叶斯其人,贝叶斯(Thomas Bayes,1701—1761)英国牧师、业余数学家。可别小看了欧洲的牧师,孟德尔,被誉为“遗传学之父”也曾为一名神父,假如你不记得孟德尔是谁,那么你肯定记得高中生物上那个著名的豌豆
2015-10-11 13:45:30
2251
原创 当Python和R遇上北京二手房(下)
四、各区情况作为买房者第一步就是看房选房,那么各区的情况是怎样的呢?下面从买房者比较注重的五个方面横向对比一下。1.各区总价(图中红点为本区域的均值)果然不出所料,西城、东城、海淀、朝阳四区均值和中位数均在前列,且数据区间分布比较广,而一些新兴的郊区如房山、门头沟、燕郊总价则较为集中,大概是因为房子是同一时期建设,功能需求也比较单一的缘故。另外我注意到,各区的总价均值均不同程度的偏离中位点,城区偏离
2015-09-05 11:47:00
2350
原创 当Python和R遇上北京二手房(上)
最近忙活了一阵子,终于把房子的事情落实了,俗话说饱暖思淫欲,某天突发奇想能不能利用手头上的一些工 具对北京的二手房数据捣鼓一下,看看能不能有一些有意思的发现?想到以前有点python经验,正巧最近也在 看R,正好借此机会巩固一下,齐活,走起!一、数据准备看了下各大房产网站,从数据的量级、真实性、即时性等方面对比了下,有的数据挺多,但是数据真实性不高,上面既有房主的帖子,也有中介的帖子;
2015-09-02 22:26:36
1628
原创 Python requests库解析中文网页乱码处理方法
r = requests.get('http://bj.lianjia.com/ershoufang/')print r.text当使用requests解析中文网页时,上述语句在ipython中一直打印的都是乱码, 试过如下代码:import sys reload(sys) sys.setdefaultencoding('utf8') 还有类似于r.text.decode('codi
2015-08-07 22:32:58
1050
原创 Oracle问题汇总
24小时字符串为 DD-MM-YY hh24:mm:ss如果转义符号出现在多个LIKE子句,应该为每个子句都添加ESCAPE
2015-08-03 17:41:43
370
原创 批量下载网站文件
# -*- coding: utf-8 -*-"""Created on Wed Jul 24 12:22:28 2013@author: T430"""import reimport urllibdef reporthook(blocks_read,block_size,total_size): print 'Finish %.1f%%' % (100 *
2013-07-24 21:32:38
1011
原创 《一分钟经理人》
一分钟经理人三条原则:一分钟目标设定一分钟目标设定是为了使目标简洁明确,能够让执行人一分钟内看完,当然并不是绝对一分钟,只是说明目标的指定要提纲挈领,不要眉毛胡子一把抓。一分钟表扬表扬这个事时间长了让人厌恶,疑似拍马屁,所以一分钟就够,或者简单几句话就行。一分钟批判这个说明批评要对事不对人,也不要叠加。
2013-07-23 11:32:54
690
原创 批量修改图片大小
import Image, os def resize(fname): img = Image.open(fname) if img.size[0] > 2048: width = int(img.size[0] * 0.6) height = int(img.size[1] * 0.6) else: wi
2013-07-18 18:06:11
653
原创 这段时间的小结
毕业到今天有3个月了,中间也接触了几个人,总结一下今后需要注意的地方。不要口无遮拦,想起什么说什么,即便是对熟悉的人,或者伤人或者伤己。要努力做到喜怒不形于色,即使做不到心里难受脸上高兴,也要做到心里难受表面看不出来。永远记住上面两条。
2013-07-18 08:18:16
588
W3school CHM 2011.03 最新版
2011-12-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人