
python学习
決心
致力于解决实际问题
展开
-
Python中if __name__ == '__main__':作用
转自:http://blog.chinaunix.net/uid-23802873-id-3143524.html分类: Python/Ruby#hello.pydef sayHello():str="hello"print(str);if__name__=="__main__":print ('This is mai转载 2014-11-07 16:08:38 · 546 阅读 · 0 评论 -
读书笔记:机器学习实战(2)——章3的决策树代码和个人理解与注释
首先是对于决策树的个人理解: 通过寻找最大信息增益(或最小信息熵)的分类特征,从部分已知类别的数据中提取分类规则的一种分类方法。 信息熵: 其中,log底数为2,额,好吧,图片我从百度截的。。 这里只解释到它是一种信息的期望值,深入的请看维基百科 http://zh.wikipedia.org/zh-sg/熵_(信息论)信息增益:划分数据集前后的信息发生的变化(原书定义) 实际应原创 2015-06-10 19:25:05 · 932 阅读 · 0 评论 -
python numpy矩阵和数组的转换
数组转换矩阵: A = mat(s[]) 矩阵转换数组: s[]= A.getA() 举例: s=[[4,2],[3,2],[3,1]] A =mat(s) A matrix([[4, 2], [3, 2], [3, 1]]) ss = A.get原创 2015-06-30 23:35:10 · 44468 阅读 · 3 评论 -
python-opencv(cv2) 之一 图像的简单读取
源码:#!/usr/bin/env python#coding=utf-8__author__ = 'zhangdebin'import cv2if __name__ == '__main__': #image read image = cv2.imread("/Users/zhangdebin/Documents/checkFace2.jpg") image0 = cv原创 2015-05-21 15:46:03 · 18769 阅读 · 0 评论 -
读书笔记:机器学习实战(1)——章2的knn代码和个人改进与注释
最近在学习《机器学习实战》一书,受益匪浅,之前还看过本书《机器学习系统设计》也很不错,个人觉得前者更注重算法学习和白盒代码优化(原理理解),而后者更注重skit-learn 等工具包的黑盒使用,更重要的是会指导部分工具算法使用的调优trick,提到机器学习的trick调优,比如early-stoping等,《Neural networks and deep learning》中讲授了很多精华,但是目原创 2015-06-06 23:54:01 · 798 阅读 · 0 评论 -
mac下pycharm python 默认生成“# coding=utf-8”等内容的方法
Tools ——>Save Files as Template… ——> Python Script 添加:!/usr/bin/env pythoncoding=utf-8author = ‘$USER’ 完成原创 2015-05-22 12:49:39 · 5390 阅读 · 1 评论 -
读书笔记:机器学习实战(3)——章4的朴素贝叶斯分类代码和个人理解与注释
简单介绍下朴素贝叶斯分类原理: 首先要知道贝叶斯公式: 贝叶斯定理是一种用先验概率推断后验概率:在B出现的前提下,A出现的概率等于A出现的前提下B出现的概率乘以A出现的概率再除以B出现的概率。通过联系A与B,计算从一个事件产生另一事件的概率,即从结果上溯原。 而这一章的代码,是通过简单的词袋模式,通过计算训练集中该事件对应的每个词出现的先验概率,来推断出文章中每个词对应的事件概率,对同类概原创 2015-06-17 16:23:54 · 1616 阅读 · 0 评论 -
python图像处理之pyocr
使用pyocr类库进行ocr识别,其中tools为’Tesseract’ #!/usr/bin/env python#coding=utf-8__author__ = 'zhangdebin'from PIL import Imageimport sysimport pyocrtools = pyocr.get_available_tools()[:]if len(tools)==0:原创 2015-05-21 17:36:43 · 6642 阅读 · 2 评论 -
pycharm写python程序时"line 1"报错
如果程序中有中文,请在首行加#coding=utf-8,也就是“line1”的位置,一般是因为默认的line1是作者名,比如"_author_小明“,或者程序内容中有中文路径等原因,需要在首行告诉程序使用utf-8的中文编码解析。原创 2015-04-27 10:56:26 · 1447 阅读 · 0 评论 -
python的类方法为什么要写一个self参数
http://www.douban.com/group/topic/19376685/这是对前面一个php程序员问python方法为什么要手写一个self的回答,当时那个帖非常的热闹,但是下面没有一个回复讲到要点,等我有空,已经找不到原帖了。 原因有多重。首先是python中几乎所有的东西的一级对象(一级对象的定义:http://en.wikipedia.org转载 2014-11-07 17:20:22 · 4217 阅读 · 0 评论 -
给python加log
# -*- coding: utf-8 -*-import loggingimport mathlogger = logging.getLogger()#set loghandlerfile = logging.FileHandler("qqxml.log")logger.addHandler(file)#set formater#formatter = l转载 2014-11-24 18:46:37 · 965 阅读 · 0 评论 -
Python正则表达式指南
AstralWindhttp://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html转载 2014-11-12 11:17:01 · 384 阅读 · 0 评论 -
Python中函数的参数定义和可变参数
转自:http://www.cnblogs.com/tqsummer/archive/2011/01/25/1944416.html转载 2014-11-07 16:54:51 · 366 阅读 · 0 评论 -
os.mkdir()和os.path.join()的区别
http://blog.youkuaiyun.com/nkfcp114/article/details/7957011 今天碰到一个问题,就是我用os.path.join()连接两个文件名地址的时候,就比如os.path.join("D:\","test.txt")结果是D:\test.txt,并且在我们往里面写东西,然后保存,在这个目录下会生成这个文件,但是如果你不写东西,那么执行这句话之后,在D盘转载 2014-11-07 18:20:20 · 566 阅读 · 0 评论 -
读书笔记:机器学习实战(4)——章五的逻辑回归代码和个人理解
个人理解,Logistic回归最根本的理论基础就是利用了Sigmod函数或者tan等,能够较平滑的(相对其他的单位阶跃函数)表示非0即1,或者-1和1,以及其中间值。这样将样本的特征向量的每一个维度或者(每一种属性,参数)都赋予一个权重系数,所有的属性值和其权重得到的权值的和作为改样本最终的分类参考值,这个值更偏向于哪一边样本就被划分为哪一类。 而Sigmod的这种非0即1的特点,可以错误分为1的原创 2015-06-30 23:50:57 · 750 阅读 · 1 评论