自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(103)
  • 收藏
  • 关注

转载 linux tar 解压缩zip文件报错的解决

解压缩时报错gzip: stdin has more than one entry--rest ignored  tar: Child returned status 2  tar: Error is not recoverable: exiting now 看这博主(http://blog.youkuaiyun.com/zhngjan/article/details/25

2015-10-16 13:47:34 591

转载 同时装了Python3和Python2,怎么用pip?

详见官方文档https://docs.python.org/3/installing/mac自带py2.7,自己安装了pip安装了python3.4, 已包含pip更新pip实测安装第三方包看一下site-packagesDone!

2015-10-16 13:29:56 452

转载 linux 技巧:使用 screen 管理你的远程会话

你是不是经常需要 SSH 或者 telent 远程登录到 Linux 服务器?你是不是经常为一些长时间运行的任务而头疼,比如系统备份、ftp 传输等等。通常情况下我们都是为每一个这样的任务开一个远程终端窗口,因为他们执行的时间太长了。必须等待它执行完毕,在此期间可不能关掉窗口或者断开连接,否则这个任务就会被杀掉,一切半途而废了。元凶:SIGHUP 信号让我们来看看为什么关掉窗口/断

2015-10-16 10:58:34 357

转载 随机salt二次加密及hash加密漫谈

我们知道,如果直接对密码进行散列,那么黑客(统称那些有能力窃取用户数据并企图得到用户密码的人)可以对一个已知密码进行散列,然后通过对比散列值得到某用户的密码。换句话说,虽然黑客不能取得某特定用户的密码,但他可以知道使用特定密码的用户有哪些。 加Salt可以一定程度上解决这一问题。所谓加Salt,就是加点“佐料”。其基本想法是这样的——当用户首次提供密码时(通常是注册时),由系统自动

2015-09-29 15:46:39 564

原创 在Linux上用pip安装scipy

在linux上用pip安装scipy需要blas/lapack支持。我下载的是lapack-3.5.0版本。tar -zxvf lapack-3.5.0.tgz#解压缩cd lapack-3.5.0#进入目录mv make.inc.example make.inc#改变make.inc的名称vim make.inc#打开make.inc,修改内容里面长这样F

2015-07-03 17:47:13 1660

原创 序列S的所有可能情况

输入正整数m和n 输出n个数,形成一个序列S={s1,s2,...,sn}。其中s_i满足取值为[0,m-1],且后一个数比前一个数大(s_i > =s_j if i >= j),输出S的所有可能情况。

2015-06-25 18:10:11 532

原创 matplotlib使用指南

http://mytrix.me/2013/08/matplotlib-animation-tutorial/

2015-06-15 09:34:20 230

转载 matplot pip安装

wget http://download.savannah.gnu.org/releases/freetype/freetype-2.5.3.tar.gz tar xzf freetype-2.5.3.tar.gz cd freetype-2.5.3 ./configure --prefix=/myhome/local --without-png make && make install

2015-06-12 14:26:10 296

转载 用python的matplotlib包绘制热度图

python里的matplotlib是一个很强大的绘图软件包。可以绘制类似matlab和R软件效果的图样。这几天尝试着从原始数据得到一个热度图。就用了这个软件包。效果还好。虽然软件很庞大很复杂,但是遇到的各种问题都还能比较好地解决。最后得到了我想要的结果。代码如下:01#!/usr/bin/python02

2015-06-11 22:13:09 1771

转载 Python使用heapq实现小顶堆(TopK大)、大顶堆(BtmK小)

需求:给出N长的序列,求出TopK大的元素,使用小顶堆,heapq模块实现。01import heapq02import random03 04class TopkHeap(object):05    d

2015-06-09 17:55:20 1571

转载 adaboostM2初探(记录一个例子)

先简单介绍一下Matlab 2012b上可以运行的一个小例子:多分类的adaboost算法工具包的调用。load fisheriris%ens=fitensemble(train_data,train_label,'AdaBoostM1',100,'tree','type','classification');Mdl = fitensemble(meas,species,'AdaBoo

2015-04-21 00:10:53 1466 1

原创 常用URL标注数据集网络下载

良性URL数据集:1,DMOZhttp://rdf.dmoz.org/rdf/2,alexahttp://s3.amazonaws.com/alexa-static/top-1m.csv.zip3,chinazhttp://top.chinaz.com/top500?t=48恶意URL数据集:1,PhishTankhttp://www.phishta

2015-03-04 16:38:56 2222 1

转载 众包完成的 Nature 大作:世界上作者最多的文章

今日题图:David Baker给你讲述一个有57000位作者的Nature大作的故事。「如果无数多的猴子在无数多的打字机上随机地乱敲,并持续无限久的时间,那么在某个时候,必然有只猴子会打出莎士比亚的全部著作。」20 世纪初,法国数学家 Emile Borel 为了更好地阐述「无穷」的概念,将这一著名思想问题发扬光大。

2015-03-04 09:41:28 682

转载 Python SocketAPI

将上节中的C#该成Python版的容易程度大大超出了我的意料之外。从来没有发现,仅仅用灰尘简单的几句话就实现了该程序的主要功能,可见python的简易和强大之处。这里先对SocketAPI 做一下总结。Socket API 笔记1、Socket的地址表示单独的字符串,用于AF_UNIX地址族(host,port)对,用于AF_INET地址族。其中ho

2014-12-25 22:31:21 386

转载 DNS采用的传输层协议可能是TCP或UDP

当客户端发出DNS查询请求,从服务器收到的响应报文中的TC(删减标志)比特被置为1时,表示应答总长度超过512字节,只返回前512个字节,这时DNS就需要使用TCP重发原来的查询请求。因为在UDP的应用程序中,其应用程序被限制在512个字节或更小,因此DNS报文穿数据流只能有512字节,而TCP能将用户的数据流分为一些报文段,因此TCP就能用多个报文段去传超过512字节的数据流或是任意长度的数据流

2014-12-25 17:46:09 2899

原创 [LeetCode]Reverse Integer

Reverse digits of an integer.Example1: x = 123, return 321Example2: x = -123, return -321考虑输入是abc,返回结果是cba,那么如果用除法(除以10)取余数操作的话,是先入先出的操作(第一次入abc%10=c),因此选择使用队列。复习队列的方法有q.size(),q.front()

2014-10-27 21:53:53 626

转载 后台程序结果重定向到文件,结果看不到文件?缓冲区的问题

工作之余,遇到了一个问题。就是当我在执行

2014-10-24 17:47:27 1152

原创 从有序链表中去掉重复的

Given a sorted linked list, delete all duplicates such that each element appear only once.For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return 1->2->3.关键点:判断比较节点为空后,别忘了把当前节点的

2014-10-23 08:10:52 489

原创 判断链表是否有环

Given a linked list, determine if it has a cycle in it.Follow up:Can you solve it without using extra space?关键点:1)判断链表是否有环。2)一个小坑在判断root和root的next是否为空上。3)可以看为追及问题。最关键的坑在判断快走(每次走2步的节点),走1步会

2014-10-22 22:56:24 446

原创 栈的应用题(1)

Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the input string is valid.The brackets must close in the correct order, "()" and "()[]{}" are all va

2014-10-22 21:46:59 639

原创 平衡树

Given a binary tree, determine if it is height-balanced.For this problem, a height-balanced binary tree is defined as a binary tree in which the depth of the two subtrees of every node never diffe

2014-10-21 23:57:35 592

原创 二叉树的最短根到叶路径中点的个数

/** * Definition for binary tree * struct TreeNode { *     int val; *     TreeNode *left; *     TreeNode *right; *     TreeNode(int x) : val(x), left(NULL), right(NULL) {} * }; */cla

2014-10-21 23:29:46 401

原创 给定二叉树求最小深度

Given a binary tree, find its minimum depth.The minimum depth is the number of nodes along the shortest path from the root node down to the nearest leaf node./** * Definition for binary

2014-10-21 23:28:14 421

原创 回文题

Given a string, determine if it is a palindrome, considering only alphanumeric characters and ignoring cases.For example,"A man, a plan, a canal: Panama" is a palindrome."race a car" is not a

2014-10-21 22:10:26 588

转载 python 3里没有cmp这个函数了

3开始没这个函数了,官方文档是这么写的The cmp() function should be treated as gone, and the __cmp__() special method is no longer supported. Use __lt__() for sorting, __eq__() with __hash__(), and other rich compariso

2014-10-19 09:13:45 3571 1

转载 python读大文件

先前需要做一个使用python读取大文件(大于1G),并逐条存入内存进行处理的工作。做了很多的尝试,最终看到了如下的文章。http://stackoverflow.com/questions/8009882/how-to-read-large-file-line-by-line-in-python 该文章实际上提供了集中读取大文件的方式,先经过测试总结如下1. for line i

2014-10-17 11:44:34 416

原创 matlab2012b与matlab7.1执行set(gca,'Yscale','log')之后画到的直方图结果居然不同

这是一个之前没发现的现象。同样一段代码:b=10000;c=randn(1, b);              %产生10000个正态分布的随机数d=100;[a,b]=hist(c,d);              %平均分成100份a=a/length(c);               %把个数转换成频度bar(a);                      

2014-10-10 20:14:50 3086

原创 36辆车,6条跑道,无计时器,最少几次比赛可以选出前三

是2015年校园招聘之腾讯(数据挖掘)笔试面试题目,题目见标题。我的思路如下:首先这应该是多轮问题。(1)初筛36辆车分6组,每组6辆。这样,比下来,共需要6次。(2)再筛在初筛中,最坏情况下,有一组的前三名就是36辆车的前三名。因此,每个组都需要保留前三名(后三名就可以踢出去了。)第三名的6辆车放在一起,跑一遍。取第一名。(他是唯一有可能得第三的)第二名的6辆车放

2014-10-10 13:59:14 6347

转载 Discover Feature Engineering, How to Engineer Features and How to Get Good at It

Feature engineering is an informal topic, but one that is absolutely known and agreed to be key to success in applied machine learning.In creating this guide I went wide and deep and synthesized a

2014-10-02 07:22:43 934

转载 使连续的参考文献能够中间用破折号连起来

1.如何使连续的参考文献能够中间用破折号连起来?比如[6,7,8,9]变成[6-9]?方法:在文档开始前加上下面的语句命令\usepackage[numbers,sort&compress]{natbib}不但可以压缩参考文献标号,还可以进行排序,即无论正文里面的顺序怎样,显示出来都是先后顺序。在elsevier模板中,natbib包已经默认引用了,无需重新引用,改一下natb

2014-07-07 17:49:33 3325

转载 魏兴国:深入浅出DDoS攻击防御

来源:《程序员》敌情篇 ——DDoS攻击原理DDoS攻击基础DDoS(Distributed Denial of Service,分布式拒绝服务)攻击的主要目的是让指定目标无法提供正常服务,甚至从互联网上消失,是目前最强大、最难防御的攻击之一。按照发起的方式,DDoS可以简单分为三类。第一类以力取胜,海量数据包从互联网的各个角落蜂拥而来,堵塞IDC入口,让各

2014-06-03 14:18:41 1136

转载 Choosing a Machine Learning Classifier

How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, your best bet is to test out a couple different ones (making su

2014-06-03 14:15:05 510

转载 urllib2.urlopen超时问题

问题描述:    没有设置timeout参数,结果在网络环境不好的情况下,时常出现read()方法没有任何反应的问题,程序卡死在read()方法里,搞了大半天,才找到问题,给urlopen加上timeout就ok了,设置了timeout之后超时之后read超时的时候会抛出socket.timeout异常,想要程序稳定,还需要给urlopen加上异常处理,再加上出现异常重试,程序就完美了。

2014-05-14 15:35:48 810

转载 使程序在Linux下后台运行 (关掉终端继续让程序运行的方法)

一、为什么要使程序在后台执行我们计算的程序都是周期很长的,通常要几个小时甚至一个星期。我们用的环境是用putty远程连接到日本Linux服务器。所以使程序在后台跑有以下三个好处:1:我们这边是否关机不影响日本那边的程序运行。(不会像以前那样,我们这网络一断开,或一关机,程序就断掉或找不到数据,跑了几天的程序只能重头再来,很是烦恼)2:不影响计算效率2:让程序在后台跑后,不会占据终端

2014-05-13 14:02:41 6016

转载 去除Python readline()函数读入的\n

用Python的readline()函数读入文件的一行,读入的结果会带有换行符,如'\n',例如,文件内容为1 2 3 4执行:f = open('test.txt')a = f.readline()print a结果为 ' 1 2 3 4\n'可用如下方法解决f = open('test.txt')a = f.readline()l = len(a)

2014-05-12 15:14:11 1596

转载 如何清空dns缓存

一、Linux下清空DNS缓存  Linux下DNS缓存实现通常有两种方式:一种是用DNS缓存程序NSCD(name service cache daemon)负责管理DNS缓存。另一种实现DNS缓存则是用Bind来架设Caching Name Server来实现。  如果是清除NSCD上的Cache,可重新启动NSCD服务来达成清除DNS Cache的效果。用这个命令:?

2014-05-12 13:19:06 1713

转载 linux下调试python程序

之前调试python程序都是用print参数,感觉有点弱爆啊,最近发现python也有类似C语言gdb的工具pdb,记录下pdb的使用方法和心得。  先找了段简单的测试程序:#!/usr/bin/pythonfrom ftplib import FTPimport sysimport socketimport pdbdef passwordCorrect(ip,por

2014-05-12 11:45:15 3667

转载 用latex写英文论文时,遇到断字符(在不该断的地方断开)时,应该怎么办?

用latex写英文论文的时候,可能会遇到断字符 (hyphenation) 在不该断开的地方断开的问题。因为英文单词长短不一,latex排版的时候为了让论文整体上看起来比较美观,可能会把落在行尾的单词从中断开,一部分留在当前这一行并且以一个短横线(-)也就是Hyphenation结尾,剩下的部分新起一行。在英文文章的排版中,hyphenation是很重要的,特别是当行尾的单词很长的时候,如

2014-05-06 10:18:32 3797

用latex写作英文论文时,遇到断zifu

用latex写英文论文的时候,可能会遇到断字符 (hyphenation) 在不该断开的地方断开的问题。因为英文单词长短不一,latex排版的时候为了让论文整体上看起来比较美观,可能会把落在行尾的单词从中断开,一部分留在当前这一行并且以一个短横线(-)也就是Hyphenation结尾,剩下的部分新起一行。在英文文章的排版中,hyphenation是很重要的,特别是当行尾的单词很长的时候,如

2014-05-06 10:17:02 817

转载 pdf 问题打开的文件符合 PDFA 标准 , 且已在只读模式下打开以防被修改

pdf问题打开的文件符合PDFA标准,且已在只读模式下打开以防被修改 有时候打开PDF时,可能会出现上面的提示,无法修改文档. 解决办法是: 1.编辑->首选项->在左侧"种类"里选择"文档"->将PDF/A查看模式改为"从不"; 2.右键该文件

2014-05-04 14:46:05 8277

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除