- 博客(29)
- 资源 (1)
- 收藏
- 关注
原创 关于set.seed()
最近在上Stanford的公开课Statistic Learning,用到的语言是R。之前有接触过R,很多人也推荐用它来做数据分析,因为很方便,包也很多,做可视化也非常赞。看书的时候看到了set.seed()这么个function,大概知道是怎么个回事,但是不太清楚相关算法的细节,而且以前用random的时候也没有想那么多(计算机是如何产生随机数的,它的算法是怎么样的,只是觉得理所当然,随手拿
2014-02-06 15:29:46
8099
原创 python,numpy等的安装方式以及Theano的安装、vim的python开发环境配置总结
首先讲一下写这篇文章的动机,之前已经写过一段时间的python代码了,但是基本上仅限于基本的算法和机器学习方面的算法,对Linux、Mac OS下的环境也不是很熟悉。 不过最近开始研究Deep Learning,准备捣鼓下Montreal 大学Yoshua Bengio等人搞的python的包Theano(论文地址:http://www.iro.umontreal.ca/~lisa/po
2013-12-29 16:26:24
4796
原创 【Python排序搜索基本算法】之Dijkstra最短路径算法(Dijkstra's Shortest-Path Algorithm)
Single-Source shortest PathsInput directed graph G = (V,E) (m = |E|, n = |V|) ---each edge has nonnegative length ---source vertex soutput: for each v, compute L(v) = length of a sho
2013-08-13 20:57:15
3716
原创 【Python排序搜索基本算法】之深度优先搜索、广度优先搜索、拓扑排序、强联通&Kosaraju算法
Graph Search and Connectivity Generic Graph Search Goals 1. find everything findable 2. don't explore anything twice Generic Algorithm (given graph G, vertex S)
2013-08-09 15:47:17
2610
原创 【Python排序搜索基本算法】之无向图的最小割&Karger算法(Graphs and Minimum Cuts & Karger's Min-Cut Algorithm)
Graphs Two ingredients 1. vertices (nodes) v 2. edges(undirected or directed)Examples: road networks, the web, social networksThe minimum Cut problem Input: undirected g
2013-08-02 19:37:52
4829
1
原创 【Python基础】之copy and deepcopy
在Python中,无论你把对象做为参数传递,做为函数返回值,都是引用传递的。标准库中的copy模块提供了两个方法来实现拷贝.一个方法是copy(shallow copy),它返回和参数包含内容一样的对象。浅拷贝是指拷贝的只是原对象元素的引用,换句话说,浅拷贝产生的对象本身是新的,但是它的内容不是新的,只是对原对象的一个引用。这里有个例子>>> a=[[1, 2], 3, 4
2013-08-02 18:10:11
1548
原创 【Python排序搜索基本算法】之快速排序(QuickSort)
def choosePivot(number, l, r): #choose the first element as the Pivot p = l return pdef partition(number, l, r, p): number[l], number[p] = number[p], number[l] #swap the lth number a
2013-07-22 22:11:27
1653
原创 【Python基础】之set, list, dictionary
1. Simple expression3e-10 #10的-10次10//3 #10/3的整数部分10%3 #余数2.Setsx = {} #dictionary not setx = set() #setsum({1,2,3})sum({1,2,3}, 3)num = {1,2,3}2 in num #return True2 not
2013-07-16 15:50:59
1201
原创 【Python基础】之全局变量(UnboundLocalError: local variable referenced before assignment)
count = 0def function(): count = count + 1 print(count)Then we get: UnboundLocalError: local variable 'count' referenced before assignmentThe reason this happens is because as so
2013-07-14 22:07:32
29968
原创 【Python排序搜索基本算法】之归并排序&分治法(Merge Sort and Divide & Conquer)
Merge Sort is a good introduction to divide & conquer.The Big O of Merge Sort Algorithm is O(nlog(n)).The divide & conquer Paradigm1. Divide into small subproblems2. Conquer via recursive
2013-07-14 21:50:36
1574
转载 Solution to “Commit your changes or stash them before you can merge” in Git
You can't merge with local modifications. Git protects you from losing important changes. You have three options. One is to commit the change usinggit commit -m "My message"The second is to stas
2013-05-24 10:59:22
1753
转载 数据挖掘、机器学习和模式识别之间的关系与区别
数据挖掘和机器学习的区别和联系,周志华有一篇很好的论述《机器学习与数据挖掘》可以帮助大家理解。数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖
2013-05-22 14:13:17
1461
原创 c 判断文件夹是否存在,创建文件夹
int access(const char *filedir, int mode) 存在返回0,不存在返回-1int mkdir(const char* fiedir) 成功返回0,失败则返回-1#include #include if((_access(filedir, 0)) != -1){ //exist //printf("Dir exists\n");}e
2013-05-21 20:18:01
2359
转载 sql语句 on, where, having的区别
on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后。有时候如果这先后顺序不影响中间结果的话,那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的。 在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计
2013-05-20 16:49:06
959
原创 OpenCV设置摄像头的分辨率
项目需要三个版本的程序分别来保存对应的三种分辨率的video。之前查了一些资料都是好几年前的了,用的都是比较旧版本的opencv,说是无法用cvSetCaptureProperty函数修改frame的width和height。不过我尝试了下目前的版本(最新版)是可以修改的,但是设置的分辨率不能超过摄像头本身最大的分辨率。cvSetCaptureProperty(capture1,
2013-05-20 15:16:50
4288
原创 union and union all,join
union:将产生的两个记录连接后删除其重复的项; union all: 将产生的两个记录连接,但不删除其重复的项。 UNION和UNION ALL都是将左右两边的两个结果合为一个,但这两者从使用和效率上来说都有所不同。 UNION在进行记录结果连接后会筛选掉重复的记录,所以在连接后会对所产生的结果集进行排序运算,删除重复的记录再返回结果。实际大部分应用中是不会产生重复的记
2013-05-19 17:17:11
1196
原创 关于opencv打开摄像头的数量的问题
最近一直在忙一个项目,需要用到4个摄像头同时捕捉画面,拿到这些数据后利用machine learning来进行分析,具体的内容就不多说了。现在主要是前期的CameraSystem的programming,之前的1个和2个摄像头都进展的很顺利,扩展到4个摄像头的时候就出现了无法capture摄像头的问题。因为opencv的文档中也没有讲到这个问题,所以自己尝试了一些方法,最后发现主要原因
2013-05-13 23:01:23
2356
原创 about hashtags of tweet
Tweet text can potentially mention other users or lists, but also contain URLs, media, hashtags... Instead of parsing the text yourself to try to extract those entities, you can use the entities att
2013-05-08 23:35:43
1033
原创 【Python基础】之对字典进行排序操作(sort by the values of dict)
import operatorresult = sorted(dict.iteritems(), key = operator.itemgetter(1))The type of result is "list" and is sorted by the values of dict in ascending order.
2013-05-08 20:02:13
1356
转载 【Python基础】之has_key(key) or key in d
如果不知道dict中是否有key的值,那么最好用dict.get(key)如果用dict[key]这个读取会报KeyError异常d = {'a': 1, 'b': 2}'a' in dTrueor:d = {'a': 1, 'b': 2}d.has_key('a')TrueIn fact has_key() was removed in Pytho
2013-05-07 15:09:16
1428
原创 json.load() vs json.loads()
json.load:Deserialize fp (a .read()-supporting file-like object containing a JSON document) to a Python object using this conversion table.json.loads:Deserialize s (a str or unicode instance
2013-05-07 13:13:30
4206
原创 system string to std string
const char* fname; //name of the target filechar* label = (char*)Marshal::StringToHGlobalAnsi(this->label5-> Text).ToPointer(); // change system string to std
2013-05-04 20:54:40
1043
原创 关于formclosed(windows窗体应用程序)
windows窗体应用程序中并不会自动生成formclosed响应代码,需要自己注册:this->Closed += gcnew System::EventHandler(this, &Form1::Form1_Closed);private: System::Void Form1_Closed(System::Object^ sender, System::EventArgs^ e)
2013-05-04 20:43:21
2066
原创 关于opencv程序的打包发布问题
主要的两个问题:opencv_ffmpeg245d.dll和opencv_imgproc245.dll比如你要打包发布名字叫做Project1的项目,在这个项目打开的状态下新建一个项目setup(安装和部署下面的安装向导),将需要的主输出资源文件等打包到该setup项目上。他自动会将程序中使用到的dll文件放入setup项目中,此外还需手动将opencv_ffmpeg245d.
2013-05-04 20:31:32
4691
原创 招聘总结
最近参加了很多笔试和面试,恒生、中软、金山、腾讯鲲鹏、丰田。。。 笔试都过了哎,可惜学校规定只能违约一次,要是违约两次就取消招聘资格。悲剧啊,再加上这些公司笔试结果出来的太慢,直接导致只能选择已经面试并且结果已经出来的实习公司,可惜不能去心仪的丰田面试了。 不过这样也好,腾讯的这家子公司是做手机软件的,自己目前对这个也比较感兴趣,不太想做金融方面的工作,而且也看好手
2010-07-13 16:37:00
1188
1
原创 百度astar复赛最后一题
复赛一共5道,这是最后一道。大家可以做做看! 第五题. 玉树驰援 ( 时限:120000ms ) 问题描述4小时以前:青海玉树发生强烈地震,大量房屋倒塌,人员伤亡惨重。灾区急需救援。2小时以前:政府迅速成立救灾指挥中心。全国各地情系玉树,纷纷筹集救援物资。1小时以前:指挥中心将若干与玉树有直接或间接道路交通的地区作为集散点。救援物资分批就近到达集散点后,再由汽车运进灾
2010-06-21 09:58:00
2090
9
通过JDBC访问数据库
访问Access数据库的步骤:1、 创建数据源 在控制面板\管理工具\数据源(ODBC)中添加Microsoft Access Driver(*.mdb,*.accdb),在 他的配置中选择要相关联的数据库,如student数据库;2、 驱动程序 JDBC-ODBC桥接:sun.jdbc.odbc.JdbcOdbcDriver Oracle连...
2010-06-17 14:55:35
177
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人