
python
文章平均质量分 79
csy463168656
这个作者很懒,什么都没留下…
展开
-
python学习笔记
Python学习笔记 因为是搞nlp的,而python作为脚本语言对处理语料等方面有着先天的优势,所以近期好好学习了下它,下面是一些我的笔记,比较粗略,主要为了以后好复习。Sys.path环境变量数字,字符串,列表,字典,元组,文件自动跟踪类型,不声明代码Lambda args: expression 生成匿名函数拷贝对象字符串格式化 'a%s parrot'%原创 2012-09-27 09:43:43 · 362 阅读 · 0 评论 -
《python标准库》学习笔记1(__builtin__模块)
__builtin__模块这个模块包含Python中使用的内建函数,一般不用手动导入这个模块,Python会帮你做好一切。下面将一一介绍这个模块所常有的函数。 1. 加载和重载模块:import语句是用来导入外部模块的(也可使用from -- import)其实import是靠调用内建函数__import__来工作的。例如 import spam 其实就是相当于执行下面一行原创 2012-12-16 20:26:49 · 3746 阅读 · 0 评论 -
NumPy for Matlab Users
因为要在Python中用到matlab的有关知识,所以在这里介绍一个新的module-------------numpy,以下内容翻译自:http://www.scipy.org/NumPy_for_Matlab_Users/#head-611af3a5b2d69937e367b9c6626c33658a1c8629IntroductionMATLAB 和 NumPy/SciPy有很多原创 2012-11-20 11:09:49 · 1251 阅读 · 0 评论 -
《集体智慧编程》之决策树(学习笔记)
原理:决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。决策树中最上面的节点称为根节点,是整个决策树的开始。本例中根节点是“收入>¥40,000”,对此问题的不同回答产生了“是”和“否”两个分支。(百度百科) 以上图片来自(h原创 2012-11-13 14:43:21 · 1388 阅读 · 0 评论 -
NMF算法简介及python实现(gradient descent)
原文链接:http://www.albertauyeung.com/mf.php基本原理NMF,非负矩阵分解,它的目标很明确,就是将大矩阵分解成两个小矩阵,使得这两个小矩阵相乘后能够还原到大矩阵。而非负表示分解的矩阵都不包含负值。 从应用的角度来说,矩阵分解能够用于发现两种实体间的潜在特征,一个最常见的应用就是协同过滤中的预测打分值,而从协同过滤的这个角度来说,非负也很容易理解:打分都是正转载 2012-11-06 10:04:38 · 4039 阅读 · 0 评论 -
最小生成树算法之prim
输入无向图G=(V,E),它的权重函数是w: E→R输出一个最小生成树T----一棵用最小权重连接所有顶点的树:移去任何属于(u,v)∈T则T被分割成两棵子树T1,T2。还是用剪切和粘贴法来证明如下:从它的性质我们可以知道它符合动态规划的两个性质,所以我们可以用动态规划来设计算法,但是此处还有一个更好的性质:子问题的最优解也是全局最优解证明,同样适用反证法和原创 2012-10-25 15:44:07 · 642 阅读 · 0 评论 -
动态规划之LCS
最长公共子序列的意思就是两个序列,有公共的部分,公共部分在这两个序列的位置上不一定相等,但序列的逻辑顺序是相等的例如给定两个序列x[1..m]和y[1..n],找出一个(注,这里说的是一个而不是这个,也就是说可能有很多个)最长的公共序列,其中 x: A B C B D A B y: B D C A B A则LCS(x,y) = BCBA .........此处LC原创 2012-10-25 08:36:31 · 767 阅读 · 0 评论 -
python库学习之re
re库 (以下内容来自Python v3.2.3 documentation)前段时间因为要做实验当误了好长时间,从今天开始继续学习python,后面将学习一系列的库,为了加深映像所以把文档中常用的摘抄如下,希望自己在理解的基础上牢记它们。正则表达式中"\"表示转义字符,如果要匹配一个"\",一般情况下要用"\\\\"作为匹配符,但是用Python’s raw string 只需要写为r"原创 2012-10-22 14:57:40 · 565 阅读 · 0 评论 -
贪心算法之Bellman-Ford
前面都是边的权值是正的情况,如果一个图包含负权值的环,那么最短路径可能不存在。而Bellman-Ford算法:从源s∈V到所有v∈V找到所有的最短路径的长度或者检测是否有一个负环路存在。算法如下:算法的前面还是和Dijkstra一样的,只是在后面多了一个检测负权环的for循环,即对所有的边松弛完毕后,开始检测如果d[v]>d[u]+w(u,v)任然存在那么显然有一个负权环代码如下:原创 2012-10-30 14:49:51 · 1375 阅读 · 0 评论 -
贪心算法之Dijkstra
三角不等式:单源最短路径:对于给定的一个源顶点s∈V,对所有v∈V找出最短路径权重为δ(s,v),如果所有边权重w(u,v)是非负的,则s到所有点的最短路径肯定存在。思想:1. 有一个顶点集合S,从s到他的最短路径是未知的。2. 在每一步,添加从s到v∈V-S的路径是最短的v到S中3. 更新顶点邻接表中到v的距离算法如下:最后结果如下:算法分析如下:原创 2012-10-30 08:55:01 · 977 阅读 · 0 评论 -
《python标准库》学习笔记2
1.处理文件内建的open/file函数用于创建,打开和编辑文件,而os模块提供了重命名和删除文件所需的函数import osdef replace(file,search_for,replace_with): back = os.path.splitext(file)[0]+'.bak' print(back) temp = os.path.splite原创 2012-12-17 15:00:31 · 962 阅读 · 0 评论