
Python
Shingle_
Done is better than perfect.
展开
-
Python标准类型分类
存储模型 分类 Python类型 标量/原子类型 数值,字符串 容器类型 列表、元组、字典更新模型 分类 Python类型 可变类型 列表、字典 不可变类型 数字、字符串、元组访问模型 分类 Python类型 直接访问 数字 顺序访问 字符串、列表、元组 映射访问 字典小结 数据类型 存储模型 更新模型原创 2017-02-12 18:09:59 · 1136 阅读 · 0 评论 -
Python面向对象编程
类和实例class MyNewObjectType(bases): 'define MyNewObjectType class' class_suite实例化myFirstObject = MyNewObjectType()方法class MyDataWithMethod(object): def printFoo(self): print 'You invo原创 2017-02-14 10:35:22 · 524 阅读 · 0 评论 -
Python输出日志
https://docs.python.org/2/howto/logging-cookbook.htmlimport loggingif __name__ == '__main__': # https://docs.python.org/2/howto/logging-cookbook.html logger = logging.getLogger('eval_trec_cnn')原创 2017-03-31 14:01:02 · 774 阅读 · 0 评论 -
python-框架-网页爬虫-文本处理-科学计算-可视化-机器学习-数据挖掘-深度学习
Python框架FlaskDjango爬虫ScrapyBeautiful SoupBeautifu Soup不完全是一套爬虫工具,需要配合urllib使用,而是一套HTML/XML数据分析,清洗和获取工具文本处理spaCyspaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Strength Natural Language Processing in原创 2017-04-16 20:28:35 · 2030 阅读 · 0 评论 -
IPython使用
Tab键自动完成变量方法、属性模块文件路径内省?:在变量前面或后面加一个问号(?)就可以将有关该对象的一些通用信息显示出来。%run命令%run ipython_script_test.py在IPython中执行一个Python脚本。此后,该文件中所定义的全部变量,还有各种import、函数和全局变量,就可以在当前的IPython shell 中访问了。注:如果希望脚本能够访问在交互IPy原创 2017-04-16 23:39:47 · 2068 阅读 · 0 评论 -
Python字典处理技巧
《Python for Data Analysis》path = 'cho2/usagov_bitly_data2012-03-16-1331923249.txt'import jsonrecords = [json.loads(line) for line in open(path)]time_zones = [rec['tz'] for rec in records if 'tz' in r原创 2017-05-04 14:22:40 · 747 阅读 · 0 评论 -
Python字符串操作
《Python for Data Analysis》Python 字符串对象方法 方法 说明 count 返回子串在字符串中出现次数 endswith 、startwith 如果字符串以某个后缀结尾或前缀开头,返回True join 连接其他字符串序列的分隔符 index 返回子串第一个字符所在位置,如果没有,ValueError find 返回子串第原创 2017-05-22 20:50:17 · 625 阅读 · 0 评论 -
pandas字符串函数
《Python Data Analysis》pandas中矢量化的字符串函数问题: 通过Series的map函数,所有字符串和正则表达式方法都能被应用于各个值(传入lambda表达式或其他函数),但是如果存在NA就会报错。解决: Series有一些能够跳过NA值得字符串操作方法,通过Series的str属性可以访问这些方法。矢量化的字符串方法: 方法 说明 cat 实现元素级的字符串原创 2017-05-22 21:05:58 · 8583 阅读 · 0 评论 -
Python映射类型:字典
哈希映射或者相连数组{key:value, key:value}keys和values方法分别用于获取键和值的列表。++虽然键值对没有特定的顺序,但这两个函数会以相同的顺序输出键和值。++从序列类型创建字典mapping = {}for key, value in zip(key_list, value_list): mapping[key] = valuedict类型函数直接处理二元元组原创 2017-02-13 17:15:13 · 1115 阅读 · 0 评论 -
Python错误和异常
错误: - 语法 - 逻辑异常: 因为程序出现了错误而在正常控制流以外采取的行为。 - 引起异常发生的错误 - 检测(和采取可能的措施)运行时管理错误的能力Python中的异常BaseExceptionKeyboardInterruptSystemExitException(all other current build-in exceptions)例子:NameError:原创 2017-02-13 17:19:40 · 840 阅读 · 0 评论 -
Python迭代器和iter()函数
使用序列for i in seq: do_something_to(i)字典字典的迭代器会遍历它的键。legends = {...}for eachLegend in legends: print '...' % eachLegend #keys print '...' % legends[eachLegend] #values文件文件对象生成的迭代器会自动原创 2017-02-13 17:15:53 · 962 阅读 · 0 评论 -
拷贝Python对象、浅拷贝和深拷贝
Python中,对象赋值实际上时简单的对象引用。对一个对象进行 ++浅拷贝++ 其实是新创建了一个类型跟原对象一样,其内容是原来对象元素的引用。序列类型对象的浅拷贝是默认类型拷贝,并可以通过以下几种方式实施:完全切片操作 [:]利用工厂函数,比如list()、dict() 等使用copy()模块的copy函数完全拷贝或者说 ++深拷贝++ ,创建一个新的容器对象,包含原有对象元素(引用)原创 2017-02-13 17:13:51 · 396 阅读 · 0 评论 -
Python函数与函数式编程
函数进行结构化的一种编程方法,是重要的代码组织和复用手段,能节省空间和保持一致性。参数位置参数(位置参数必须以在被调用函数中定义的准确顺序来传递)关键字参数(关键字参数必须位于位置参数之后)参数组(可变长度的参数)func(*tuple_grp_nonkw_args, **dict_grp_kw_args)*tuple_grp_nonkw_args是以元组形式体现的非关键字参数组**dic原创 2017-02-14 10:34:41 · 640 阅读 · 0 评论 -
代码复用
函数+模块比起多次重复运用相同的代码,把代码放在 函数 中会更有效和可靠。使用函数可以为程序节约空间。更重要的是:为函数选择名称可以提高程序可读性。函数是指带命名的代码块,可执行一些明确的任务。函数通常使用称为参数的变量进行输入,并且可能生成一些结果,称为返回值。关键字def局部变量一个文件中的变量和函数的集合被称为Python模块(module)。相关模块的集合称为包(package)。包的集合成原创 2017-02-21 14:54:34 · 532 阅读 · 0 评论 -
Python列表解析(列表推导式)
列表解析——用来动态地创建列表[expr for iter_var in iterable if cond_expr]例子一:map(lambda x: x**2, range(6))[0, 1, 4, 9, 16, 25][x**2 for x in range(6)][0, 1, 4, 9, 16, 25]列表解析式可以取代内建的map()函数以及lambda,而且++效率更高++。例子二:se原创 2017-02-13 17:16:58 · 12360 阅读 · 1 评论 -
Python生成器与生成器表达式
生成器要创建一个生成器,只需要将函数中的return替换为yield即可:def squares(n=10): print 'Generating squares from 1 to %d' % (n**2) for i in xrange(1, n+1): yield i ** 2调用生成器时,没有任何代码会即刻执行, 只有从该生成器中请求元素的时候,它才开始执行原创 2017-02-13 17:17:52 · 896 阅读 · 0 评论 -
Python模块结构和布局
#!/usr/bin/env python #(1)起始行"this is a test moudle" #(2)模块文档import sys #(3)模块导入import osdebug = True #(4)全局变量定义class FooClass (object): "Foo class" #(5原创 2017-02-12 18:08:35 · 405 阅读 · 0 评论 -
Python数字
数字类型Python支持五种基本数字类型,其中有三种是整数类型。有符号整数int长整型long (相当于Java里的BigInteger)布尔型bool浮点型float复数complex数字功能函数函数int()直接截去小数部分(返回值为整型)。函数floor()得到最接近原数但小于原数得整型(返回值为浮点型)。函数round()得到最接近原数得整型(返回值为浮点型)。原创 2017-02-13 17:09:26 · 432 阅读 · 0 评论 -
Python序列——字符串
知识点一: 连接操作符(+)对于字符串来说,这个操作不如把所有得子字符串放到一个列表或可迭代对象中,然后调用一个join方法来把所有的内容连接在一起节约内存例:' '.join(('I', 'love', 'U'))类似的,推荐使用列表类型的extend()方法来把两个或者多个列表对象合并。知识点二: 序列类型函数len()返回字符串的字符数max() and min()返回最大或最小的字符(按照A原创 2017-02-13 17:10:06 · 716 阅读 · 0 评论 -
Python序列——列表
列表是能保留任意数目的Python对象的灵活的容器。赋值访问更新(append())删除(del、pop())序列类型操作符切片([]和[:])成员关系操作(in, not in)连接关系符(+)extend() 方法可代替连接操作符把一个列表的内容添加到另一个中去。注: 使用 extend() 方法比连接操作的一个优点是它实际上是把新列表添加到了原有列表里面,而不是像连接操作符那原创 2017-02-13 17:11:59 · 751 阅读 · 0 评论 -
Python元组 vs 列表
不可变容器元组:数据传给一个不了解的API时,可以确定我们的数据不会被修改。tuple() 函数。同样的,操作从一个函数返回的元组,可以通过内建 list() 函数把它转换成一个列表。如,管理动态数据集合。通过内建的 list() 和 tuple() 转换函数,可以非常轻松的在两者之间进行转换。元组拆包如果对元组型变量表达式进行赋值,Python就会尝试将等号右侧的值进行拆包。tup = (1,原创 2017-02-13 17:12:41 · 551 阅读 · 0 评论 -
Python文件
文件内建函数内建函数open()file_object = open(file_name, access_mode='r', buffering=-1)工厂函数file()open() 和 file() 函数具有相同得功能,可以任意替换。Python的文件模式 模式 说明 r 只读模式 w 只写模式。创建新文件(删除同名的任何文件) a 附加到现有文件(如果文件不存在则原创 2017-02-13 17:18:58 · 514 阅读 · 0 评论