
Python
文章平均质量分 60
PatrickZheng
这个作者很懒,什么都没留下…
展开
-
检验是否为BMP格式文件
检验是否为BMP格式文件原创 2017-06-05 14:00:55 · 2532 阅读 · 0 评论 -
为何slice和range都排除掉最后一个item?
在阅读 Fluent Python 一书 其中提到了 slice 和 range 都排除掉最后一个 item 的考虑因素当只给出结束索引时,很容易得知 slice / range 的总长度 range(3) 和 my_list[:3] 都是三个item当给出了起始索引和结束索引,很容易得知 slice / range 的截取长度 结束索引 减去 起始索引可在任意索引位置 x翻译 2018-01-17 00:29:59 · 844 阅读 · 0 评论 -
爬虫遇到连接中断问题,误以为是反爬
爬虫的一些尝试,误以为遭遇反爬原创 2017-10-19 00:24:38 · 7415 阅读 · 1 评论 -
探索数据集——Titanic
项目是使用Python对给定数据集进行探索和分析。本次选择的数据集是 泰坦尼克号上 2224 名乘客和船员中 891 名的人口学数据和乘客基本信息。 使用Numpy和Pandas进行数据清洗、处理、绘图,最后进行分析说明。报告是使用 jupyter notebook完成的,相关文档放在了个人GitHub上,欢迎讨论交流!原创 2017-06-28 14:41:09 · 6851 阅读 · 4 评论 -
sort、sorted 排序技巧
这篇文章主要介绍了python sort、sorted 高级排序技巧,本文讲解了基础排序、升序和降序、排序的稳定性和复杂排序、cmp函数排序法等内容,需要的朋友可以参考下转载 2017-06-28 00:46:21 · 1170 阅读 · 0 评论 -
Python 排序(sorted)
python 排序 sorted 如果第一个条件 相同 则按第二个条件排序遍历一个list,符合下列条件:按照元组第一位的值从小到大排序如果第一个相同,则按照元组第2位的值从大到小排序转载 2017-06-27 23:59:11 · 614 阅读 · 0 评论 -
数据库编程时需要注意的两点!
在优达学城看关系数据库的课程,复习一下数据库的知识。发现了两点以前有了解但是没有太注意的地方。数据库编程需要注意防范:1、SQL注入攻击2、脚本注入攻击原创 2017-06-22 16:17:23 · 922 阅读 · 0 评论 -
Python中Swithch Case语法实现
Python中Swithch Case语法实现转载 2017-06-09 14:48:10 · 707 阅读 · 0 评论 -
Python爬虫实战之抓取淘宝MM照片(四)
最后添加上 标题切换、本地目录创建、日志记录等,完善了整体代码。过程中遇到了一个自己坑了自己的地方:中文乱码问题! 一定要注意:python代码文件开头要加上 : # -- coding: utf-8 --带中文的字符串前一定要加上 u,比如 (u”hi,你好”)还有一点,我试过不是必需的。参见 http://blog.youkuaiyun.com/isfirst/article/details原创 2017-06-19 19:34:40 · 1001 阅读 · 0 评论 -
Python爬虫实战之抓取淘宝MM照片(三)
抓取JS动态页面内容 上文的内容,都是对首页内容的抓取和处理,实际上使用urllib2库以及正则表达式也可以完成(当然没有 beautiful soup 方便易用)。这并未能提现到 selenium + phantomJS 的主要用处。本文就会模拟JS渲染的页面翻页。原创 2017-06-19 11:13:39 · 1019 阅读 · 0 评论 -
Python爬虫实战之抓取淘宝MM照片(二)
紧接着上文,继续探索headers在不断尝试过程中,遇到了一个问题:有时候抓回来的网页会没有相关信息。猜测是因为 User-Agent(默认是phantomJS),那就尝试增加 headers。对上文获取到的图片链接进行下载保存原创 2017-06-19 01:29:07 · 1211 阅读 · 0 评论 -
Python爬虫实战之抓取淘宝MM照片(一)
Python爬虫系列教程的一次实战,然而淘宝进行过页面改版,现在已经没有淘宝MM这个版面,取而代之的是淘女郎。改版后,页面是使用JS渲染的,并不能直接通过url来切换页码。该系列教程后续讲到了 selenium + phantomJS,通过这个组合来模拟操作,进行页码切换等。原创 2017-06-19 00:49:56 · 2532 阅读 · 0 评论 -
学习Python爬虫
在学习廖雪峰老师的python教程,和优达学城的数据分析课程,了解了python的使用,以及数据清洗和处理的一些方法后,想到了“数据获取”。然后就搜到了一篇讲解Python爬虫的系列教程 http://cuiqingcai.com/1052.html。开始了Python爬虫的学习原创 2017-06-18 23:57:01 · 534 阅读 · 0 评论 -
编写一个search(s)的函数,将当前目录及其所有子目录下查找文件名包含指定字符串的文件,打印完整路径
编写一个search(s)的函数,将当前目录及其所有子目录下查找文件名包含指定字符串的文件,打印完整路径原创 2017-06-05 13:52:26 · 3169 阅读 · 0 评论 -
抓取一个网页并解析HTML
抓取一个网页并解析HTML原创 2017-06-05 14:06:36 · 2395 阅读 · 0 评论 -
Python正则表达式指南
Python正则表达式指南 本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。转载 2017-06-17 12:30:08 · 465 阅读 · 0 评论 -
一些术语
Duck typing(鸭子类型)https://zh.wikipedia.org/wiki/%E9%B8%AD%E5%AD%90%E7%B1%BB%E5%9E%8BABC(abstract base class,抽象基类)https://www.jianshu.com/p/19ed49293168Fluent Interface (流式接口,也叫方法链式调用)https://...原创 2018-03-04 23:03:13 · 565 阅读 · 0 评论