
Python
金帛文武在南京
这个作者很懒,什么都没留下…
展开
-
python学习记——爬糗事百科
学习python 跟着教程写了一个爬糗事百科的段子程序(去掉了包括图片的段子) 代码中item[2]为空表示段子中不带图片运行结果如下:代码如下:# -*- coding:utf-8 -*-import urllibimport urllib2import repage = 1url = 'http://www.qiushibaike.com/hot/page/' + str(page)原创 2015-11-08 16:18:19 · 791 阅读 · 0 评论 -
python报错MemoryError
python报错MemoryErrorpython 32bit 最大只能使用 2G 内存,坑爹之处,超过 2G 报错MemoryError。而 64bit python则无此限制,所以建议使用 64bit python。 可能存在的问题:以前 numpy、scipy 官方的库只支持 32bit python,现在应该发布了 64bit 对应版本。原创 2016-11-14 14:49:45 · 19483 阅读 · 0 评论 -
怎样合并字典最符合Python语言习惯?
转自EarlGrey的文章 http://codingpy.com/article/the-idiomatic-way-to-merge-dicts-in-python/这篇教程探讨了哪种合并字典的方式才是最符合Python语言习惯的(idiomatic)。首发于微信公众号“编程派”,阅读最新Python教程,请关注编程派。你有没有想过在Python中合并两个或以上字典?转载 2016-07-21 16:56:45 · 3530 阅读 · 0 评论 -
python 的日志logging模块学习
转自kenby的博客 http://kenby.iteye.com/blog/1162698一、从一个使用场景开始 开发一个日志系统, 既要把日志输出到控制台, 还要写入日志文件 Python代码 import logging # 创建一个logger logger = logging.getLogger('m转载 2016-07-18 09:50:40 · 1037 阅读 · 0 评论 -
WGS84坐标系转火星坐标系
from __future__ import divisionfrom math import pi,sqrt,sin,cos# a python binding of https://on4wp7.codeplex.com/SourceControl/changeset/view/21483#353936# Krasovsky 1940## a = 6378245.0, 1/f = 298.转载 2016-06-21 16:38:11 · 3467 阅读 · 0 评论 -
Python2 编码
输入 -> str -> decode -> unicode -> encode -> str -> 输出原创 2016-06-15 18:34:13 · 671 阅读 · 0 评论 -
python异常处理
本文转自http://www.cnblogs.com/dkblog/archive/2011/06/24/2089026.html异常#!/usr/bin/pythonimport tracebacktry: 1/0#except Exception,e:# print traceback.format_exc()except Exception as e: print e#!/usr/b转载 2016-04-18 18:54:43 · 426 阅读 · 0 评论 -
爬虫笔记
urllib2urlopen(url, data, timeout)第一个参数url即为URL,第二个参数data是访问URL时要传送的数据,第三个timeout是设置超时时间。第二三个参数是可以不传送的,data默认为空None,timeout默认为 socket._GLOBAL_DEFAULT_TIMEOUT第一个参数URL是必须要传送的,在这个例子里面我们传送了百度的URL,执行urlop原创 2016-04-11 20:46:38 · 4219 阅读 · 0 评论 -
Parallel Python 并行计算
原文链接 http://www.cnblogs.com/flyingis/archive/2009/11/12/1601574.html 作者: Flyingis最近在关注如何提升Python执行效率的问题,自己没有时间去深入研究,就直接选择了开源的Parallel Python,希望能够充分发挥多核CPU及集群环境的优势。 Parallel Python是Python进行分布转载 2016-04-26 15:16:45 · 4674 阅读 · 0 评论 -
readline&readlines
需求txt文件很大,难以打开,需要读取n行看看数据格式。开始with open(f1_name, 'r') as f1: contents1 = f1.readlines()[0:n_line] with open(f2_name, 'w') as f2: for line in contents1: f2.write(line)发现读个10行原创 2016-03-31 00:02:41 · 552 阅读 · 0 评论 -
python爬豆瓣电影Top250
1.前期分析完成豆瓣电影Top250网站(https://movie.douban.com/top250)推荐电影名单的爬取 。 可见每页显示25部电影,总共10页.chrome按F12: 所以用正则表达式表示为<span.*?class="title">(.*?)</span>但符合这样的有两行:<span class="title">肖申克的救赎</span><span class="ti原创 2015-12-18 20:07:16 · 2127 阅读 · 0 评论 -
python读写Excel
由于工作需要,需要对 Excel 数据进行一些预处理,所以随便写了一点 python 处理 Excel 的方法。。。一、导入相应库xlrd:读入Excel xlwt:写入Excel安装命令如下:pip install xlrdpip install xlwt二、读入Excel1. Excel表格内容下图分别为 test.xlsx 的 sheet1 和 sheet2 数据: 2. 代码 code原创 2015-12-17 19:32:18 · 1426 阅读 · 0 评论 -
python奥义
python 奥义原创 2015-12-17 10:41:32 · 768 阅读 · 0 评论 -
spider_scrapy
对spider来说,爬取的循环类似下文:以初始的URL初始化Request,并设置回调函数。 当该request下载完毕并返回时,将生成response,并作为参数传给该回调函数。spider中初始的request是通过调用 start_requests() 来获取的。 start_requests() 读取start_urls 中的URL, 并以 parse 为回调函数生成原创 2015-11-14 15:39:17 · 781 阅读 · 0 评论 -
python模拟登录爬淘宝模特信息
先模拟登录 再爬取照片# -*- coding:utf-8 -*-import urllibimport urllib2import cookielibimport reimport webbrowserimport toolimport os#模拟登录淘宝类class Taobao: #初始化方法 def __init__(self): #登录的URL原创 2015-11-11 10:19:57 · 3861 阅读 · 1 评论 -
python读取txt文件最后一行(文件大+文件小)
txt文件小#coding:utf-8'''fname为所读xx.txt文件输出为:文件第一行和最后一行'''fname = 'test.txt'with open(fname, 'r') as f: #打开文件 lines = f.readlines() #读取所有行 first_line = lines[0] #取第一行 last_line = lines[-原创 2016-04-05 20:33:36 · 27870 阅读 · 3 评论