- 博客(37)
- 资源 (1)
- 收藏
- 关注
原创 Get to know docker
Virtual machine: Each virtual machine includes the application, the necessary binaries and libraries and an entire guest operating system - all of which may be tens of GBs in size.Docker con
2016-07-01 12:58:07
616
原创 My remote working experience
Basic Info: A Team of 9 engineers: 1 Manager, 3 Senior engineer, 3 Junior - Intermediate engineer, 1 QA, 1 DBA Two groups of the team: each responsible for different but related projects
2016-07-01 11:41:25
1541
原创 What an engineer can take away from Velocity 2016
Velocity is a DevOps Conference that happens every year in several cities around the world which brings world's DevOps engineers together to talk about Web Performance and cutting edge Ops tech such a
2016-06-26 06:09:23
698
原创 Python Foundation - part three
Metaclasses in Python3>>> class FooBar: pass>>> type(FooBar)<class 'type'>>>> f = FooBar()>>> type(f)<class '__main__.FooBar'>>>> isinstance(foo, Foobar)True>>> isinstance(Foobar, type)
2015-08-19 02:48:29
630
原创 Python Foundation - part two
Some differences between python2.7 and python3print is a function now in python 3do print(a) and print a not workdivision by int can return float>>> 5/2 (python2.7)2while in python3>>> 5/22.5Some wel
2015-08-18 22:56:29
420
原创 Build your first Django site - QA
How to change admin password ?Django provided a built-in admin module, we can change our password from command line:python manage.py changepassword <username>if you even forgot your username, then crea
2015-08-18 11:14:32
828
原创 DevOps - CI
See the json format of jobs https:///queue/api/json?pretty=trueRestart jenkins https:///safeRetart
2015-06-04 04:36:08
587
原创 DevOps - Docker
sed 's/properties/property/g' build.xml > build.xml.tmp原地修改文件sed -i '100, 200d' new.txt
2014-08-29 02:10:31
800
原创 Maximum Bipartite Matching
算法旨在用尽可能简单的思路解决问题,理解算法也应该是一个越看越简单的过程,当你看到算法里的一串概念,或者一大坨代码,第一感觉是复杂,此时不妨从例子入手,通过一个简单的例子,并编程实现,这个过程其实就可以理解清楚算法里的最重要的思想,之后扩展,对算法的引理或者更复杂的情况,对算法进行改进。最后,再考虑时间和空间复杂度的问题。 了解这个算法是源于在Network Alignment问题
2014-05-11 07:08:51
3034
原创 贝叶斯公式、先验概率、后验概率
先验概率: 在缺少某个前提下的变量概率,在机器学习中就是没有训练样本,在训练之前的初始概率:P(w)后验概率: 在有了样本数据以后,对变量进行概率的修正,得到的概率就是后验概率,,例如g是样本,则后验概率是:P(w | g)贝叶斯公式: 从形式上讲,贝叶斯公式通过先验概率和似然函数求取后验概率。 P(w |
2014-04-04 08:09:42
2149
原创 操作系统那些事儿(一)
也许很多人没听过Multics, 全名是MULTiplexed Information and Computing System, AT&T实验室,MIT和美国通用电气联合开发的可以在大型主机上多人多任务操作的系统。 然而这个系统由于开发缓慢而最终被叫停。 然而Multics的失败却催生了另外一个大名鼎鼎的操作系统,它就是UNIX, 1969年, 由AT&T实验室的肯汤
2014-04-03 05:32:52
784
原创 Notes 1 of More Effective C++ —— Basics
Item 1: Pointers Versus References 1. There is no such thing as a null reference, a reference must always refer to some object. 2. C++ requires references to be initialized, while pointers
2014-03-23 23:13:02
898
原创 编译器技术简析(一)- Lexical Analysis之NFA-DFA
一、编译概述 计算机科学研究方向众多,我们不可能精通所有,但是如果明白了本质,我们就能进行交叉学习,理顺思路,也就不至于觉得某项技术特别难,无从下手。 最原始的计算机是靠机器代码(Machine Code)来工作的,而计算机使用的是我们熟知的冯诺依曼体系结构,计算模型就是图灵机。冯诺依曼结构决定了计算机的控制,存储和运算单元,而图灵机则揭示了计算
2014-02-28 03:46:43
2512
原创 Linux 命令积累
1. Edit PATH environment$ sudo gedit /etc/profile (to update the env)$ source /etc/profile (to make the update effect)2. scp: upload file or directory to remote serverscp -r [file] usern
2014-02-27 05:07:14
1182
翻译 大数相乘的算法(instructed by Western University Prof.Schost)
Karatsuba算法主要应用于两个大数的相乘,原理是将大数分成两段后变成较小的数位,然后做3次乘法,并附带少量的加法操作和移位操作。现有两个大数,x,y。首先将x,y分别拆开成为两部分,可得x1,x0,y1,y0。他们的关系如下:x = x1 * 10m + x0;y = y1 * 10m + y0。其中m为正整数,m m。那么 xy = (x1 * 10
2013-09-13 06:03:16
2092
原创 java和数据结构(待续)
(一)java对象使用的常识部分代码:public class Student implements interfacePerson p; Student s = new Student();p = s; Person q; p.equalTo(q); // Will not compile, q is not pointing to any objectp
2013-09-13 03:03:27
829
原创 Linux下C编程之makefile
最近一直在Linux下写C代码,处理基因序列,总共代码才1500行左右,但是在makefile build的时候,效率极低,慢的时候居然需要30多秒,由于此前经验缺乏,对makefile也不甚了解,但是为了提高程序效率,必须深入了解makefile.本文中部分内容摘自大牛博客。一、makefile基础知识 makefile定义了一系列的规则来指定,哪些文件需要先编译,哪些文件需要后
2013-05-27 10:18:53
1470
1
翻译 递归程序转换成非递归程序的一般方法
一、递归函数的原理 用栈保存未完成的工作,在适当的时候从栈中取出并执行。 系统保存了工作的数据和状态,数据就是函数的局部变量, 状态就是程序指针。 二、 非递归程序原理 1. 和递归函数的原理相同,只不过是把由系统负责保存工作信息变为程序自己保存,这样能减少保存数据的冗余(主要是节省了局部变量的空间),提高存储效率。
2013-03-18 09:51:14
4593
1
转载 指针的初始化
通俗的讲,指针是一个地址,指针的初始化就是让指针指向一个确定的地址。*是指针的解引用符,意思是取指针指向的地址里的数据。因此,int a;int *p = &a;// 这里是初始化,表示的是指针初始化为a的地址,实际相当于int *p; p = &a;*p = 10;// 这是表示对指针解引用,想p所指向的地址写入10从函数调用的角度来讲,一个函数在那里,并不会自己运行
2013-03-14 15:00:13
2745
原创 KMP算法重温
KMP就是字符串匹配算法,最朴素的字符串匹配算法,就是逐位匹配,不匹配就右移一位,这种方法效率太低。为了节省时间,利用已经匹配过的部分字符串的信息来为后续的匹配提供条件,减少匹配次数。 KMP算法的关键就是获取next值,next[ j ] 是通过模式串得来的,关于next[ j ] 的算法也有普通和改进的, 普通的获取next[ j ]的算法思想是:
2013-03-12 11:00:27
908
原创 随机算法初探
随机算法的数学基础就是概率论的知识,比如大学本科阶段学习的独立性,互斥、样本期望以及各种分布的知识。在这里默认大家都了解了概率论的知识的前提下,对随机算法进行初步的介绍。在学习C、JAVA的时候,我们其实也经常用到随机产生函数random()等等,但是本文将侧重于介绍随机算法的理论。一、随机算法 随机算法为使用随机函数发生器的算法,算法中的一些判断依赖于随机函数产生器
2013-03-11 10:19:08
1153
转载 基因序列分析(生物信息学论坛)
基因序列分析,其实说白了就是核酸和蛋白质的序列分析,分析上使用的主要是计算机的算法理论和工具,但是也必须具有生物学的背景知识,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwi
2013-03-08 19:55:05
20906
原创 前向算法的实例应用
一、基本情况 前面有章节介绍过前向算法的理论,似乎很难理解,本文将用一个实例来说明前向算法的应用,先回顾下前向算法的理论 1、 一个隐马尔可夫模型 (HMM) 是由一个五元组描述的: λ =( N,M ,A,B, π ) 其中:
2013-03-07 20:21:03
2023
原创 HMM理解以及相关算法
1、MM 先有马尔可夫模型,再有隐马尔可夫模型,什么叫马尔可夫模型呢,也就是具有马尔可夫性质的模型,而马尔可夫性质用概念来讲,就是:一个过程的“将来”只取决于“现在”,而不取决于“过去”。这就叫马尔可夫性,具有马尔可夫性的过程叫做马尔可夫过程。 (下面来一段数学定义: 设在时刻t的随机变量用St 表示,其观察值用st表示,则如果当S1=s1,S2=
2013-03-05 21:56:06
1725
转载 HMM之前向算法(forward algorithms)
初学HMM,可能会第一次对如此多的数学公式,理论和推理感到头晕,发现这篇文章,能比较好的理解前向算法,关于HMM的笔记,随后呈上。1.穷举搜索( Exhaustive search for solution) 给定隐马尔科夫模型,也就是在模型参数(Algorithm)" style="margin:0px; padding:0px; border:0px; list-style:no
2013-03-05 17:37:22
1739
原创 html5的web存储(五)
web存储,能让你在html5的开发过程中,将数据存储到本地计算机中。此时必须将web存储和cookie区分开来。(一)web存储和cookie的区别 Cookie的大小是受限的(4K以内),并且每次你请求一个新的页面的时候cookie都会被发送过去,这将产生很多不必要的操作。HTML5的storage是存储在你的计算机上,网站在页面加载完毕后可以通过Javascript来获
2013-02-24 19:16:02
629
转载 万维网联盟将于2014年推出HTML5标准(四)
html5标准规范看似前途无量,但是充满了利益纷争的标准制定工作却长期陷入分裂停止。长此以往,别说干掉Flash,恐怕自己就得先玩儿完。今天,W3C组织官方公布了HTML5标准的最新路线图,表示会在2014年第四季度将其推进到官方候选推荐阶段(Candidate Recommendation),等同于完成最终正式版,然后再过两年升级为5.1。 不过,HTML工作组尚未批准这一计划,是
2013-02-24 18:45:02
808
转载 html5,web前端开发的规范(三)
一、规范目的 为提高团队协作效率, 便于后台人员添加功能及前端后期优化维护, 输出高质量的文档, 特制订此文档. 本规范文档一经确认, 前端开发人员必须按本文档规范进行前台页面开发. 本文档如有不对或者不合适的地方请及时提出, 经讨论决定后方可更改.二、基本准则 符合web标准, 语义化html, 结构表现行为分离, 兼容性优良. 页面性能方面, 代码
2013-02-24 18:41:28
828
翻译 html5的简介(二)
1、历史 HTML 最近的一次升级是1999 年12 月发布的 HTML 4.01。自那以后,发生了很多事。最初的浏览器战争已经结束,Netscape 灰飞烟灭,IE5 作为赢家后来又发展到 IE6, IE7,IE8 到IE9。Mozilla Firefox从 Netscape 的死灰中诞生,并跃居第二位。苹果和 Google 各自推出自己的浏览器,而小家碧玉的Opera 仍然
2013-02-22 17:03:34
470
原创 网格计算(二)
一、认识网格用简单的话讲,网格是服务器、数据源、因特网三种技术的有机组合和发展,它具有高性能、一体化、资源共享等技术优点。它的优势在于,整合了分布在世界各地的计算资源,通过网格计算软件,用户可以将自己的计算需求分散到各个不同的服务器中进行计算,用户无需知道自己使用的服务器位置在哪,属于什么人,他所做的只是输入需求和获得结果。看到这,您也许会觉得网格好像和我们每天都要使用的互联网
2013-02-21 11:53:48
871
原创 网格计算、集群计算、云计算、分布式计算(一)
这些概念听起来挺晕乎,看了点资料仍是晕乎,在学校也很难得到比较深刻的认识,还得通过自己多看资料,多体会,对思考,才能明白他们的意思一、网格计算 官方概念:网格计算即分布式计算,是一门计算机科学。它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终结果。 网格诞生于那些
2013-02-21 11:28:44
1278
原创 数据挖掘中的十大问题
这十大问题是在2005年,ICDM会议上整理提出的,由香港科技大学的杨强教授等组织。ICDM是数据挖掘领域的顶级国际会议,International Conference on Data Mining。这十个问题是根据咨询的专家的意见整理出来的,具有很高的前瞻性和指导意义。 1、形成数据挖掘的统一理论 目前的数据挖掘都是为企业或者解决实际问题而使用的
2013-02-18 21:15:47
1384
原创 html5中的新属性(一)
高级的语言,试图提供更强大的更直接的功能,这就是各种语言产生的本质原因,从这个角度来看,语言的应用性可学而不必究,该深究的是语言底层的机理。 html5确实给了用户非常好的开发体验和享受。包括视频、音频嵌入功能等,同时还有很多表单属性也让开发更加方便。虽然应用很简单,看看编编就能明白,但有些属性也是需要一定的时间去体会一下的。 例如,auto
2013-02-06 11:22:34
565
原创 Objective C 面向对象编程(二)
在(一)中已经说过,Objective C的语言特性继承了C的特点,这些也不用赘叙,动手写代码自然会领会。 还是直接上手objective C的面向对象特性。 在创建类之前用@interface标记传递给编译器信息:下面将定义一个类了 先看一个类的声明实例: @in
2013-01-30 21:17:04
532
原创 Objective C 和 C
BOOL areIntsDifferent_faulty(int thing1, int thing2){ if(thing1 == thing2) {return (NO); }else { return (YES); }}BOOL areIntsD
2013-01-30 17:01:57
562
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人