
Python
iMazy
不同的思想、不同的路、不同的人生!
展开
-
[Python] - 爬虫之lxml库的用法
`lxml` 用法源自 `lxml python` 官方文档,更多内容请直接参阅官方文档[lxml 官方文档](http://lxml.de/index.html)原创 2017-12-18 17:47:20 · 14954 阅读 · 1 评论 -
[Python] - 函数
[Python] - 函数文章从简书转入,只因它已不再是以前的简书The secret of getting ahead, is getting started. 先人一步的秘诀是即刻启程。函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段函数能提高应用的模块性,和代码的重复利用率函数有内建函数,比如print() 和 自定义函数函数定义函数代码块以 def 关键词开头,后原创 2017-12-15 09:40:26 · 453 阅读 · 0 评论 -
[Python] - 输入和输出
文章从简书转入,只因它已不再是以前的简书Happiness is to find someone who can give you warm and share your life together. 幸福,就是找一个温暖的人过一辈子。读取键盘输入 input() 函数从标准输入读入一行文本,默认的标准输入是键盘示例:str = input("请输入:");print ("你输入的内容是:原创 2017-12-15 09:43:38 · 515 阅读 · 0 评论 -
[Python] - 文件操作
文章从简书转入,只因它已不再是以前的简书A book is a gift you can open again and again. 书籍是一件可以一次又一次打开的礼物。文件,可以看作成一个存储数据容器 文件的操作包含:创建、打开、读取、更新,关闭等open()open() 将会返回一个 file 对象基本语法格式如下:open(filename, mode)filename:filename原创 2017-12-15 09:44:20 · 500 阅读 · 0 评论 -
[Python] - 错误和异常
文章从简书转入,只因它已不再是以前的简书 Knowledge is a treasure but practice is the key to it. 学识是宝藏,但实践才是打开它的钥匙。语法错误语法错误或者称之为解析错语法错误在编译时编译失败示例:a = abc # 字符串不加引号x = 4 + y # 使用了未定义的变量print("%f"6.66) # 打印时不加`%`号..原创 2017-12-15 09:45:07 · 556 阅读 · 0 评论 -
[Python] - 面向对象
文章从简书转入,只因它已不再是以前的简书If you focus on what you left behind you will never see what lies ahead! 如果你只顾回头看,永远也看不见前方有什么。面向对象编程(Object-Oriented Programming)介绍OOP编程是利用“类”和“对象”来创建各种模型来实现对真实世界的描述,使用面向对象编程的原因一方面原创 2017-12-15 09:45:55 · 524 阅读 · 0 评论 -
[Python] - List 列表实际操作
文章从简书转入,只因它已不再是以前的简书The shortest distance between two people is a smile. 人与人之间最短的距离是微笑。List 列表实际操作练习1、List 定义>>> list = ["Mazy", "Joy", "Vivian", "Vicky", "Eric"]>>> list['Mazy', 'Joy', 'Vivian', 'V原创 2017-12-15 09:46:36 · 497 阅读 · 0 评论 -
[Python] - 日期和时间
文章从简书转入,只因它已不再是以前的简书Only I can change my life. No one can do it for me. 只有我可以改变我的命运,没有人可以帮我做。Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间时间间隔是以秒为单位的浮点小数每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示例如:time 模块下函数ti原创 2017-12-15 09:47:52 · 406 阅读 · 0 评论 -
[Python] - 爬虫之Beautiful Soup的基本使用
Beautiful Soup的简介Beautiful Soup 是一个可以从HTML 或 XML 文件中提取数据的 Python 库,最主要的功能是从网页抓取数据官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。原创 2017-12-24 16:36:50 · 957 阅读 · 0 评论 -
[Python] - JSON
文章从简书转入,只因它已不再是以前的简书We can’t give up trying. The fight was worth it. 我们不能放弃尝试,奋斗是值得的。JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数: - json.dumps(): 对数据进原创 2017-12-16 11:33:04 · 362 阅读 · 0 评论 -
[Python] - XML 解析
文章从简书转入,只因它已不再是以前的简书All I ever wanted was a single thing worth fighting for. 我想要的不过就是一件让我奋不顾身的事儿。XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言XML 被设计用来传输和存储数据XML是一套定义语义标原创 2017-12-16 11:34:07 · 510 阅读 · 0 评论 -
[Python] - 多线程
文章从简书转入,只因它已不再是以前的简书If you shut the door to all errors, truth will be shut out. 你如果拒绝面对错误,真相也会被挡在门外。多线程类似于同时执行多个不同程序,多线程运行有如下优点: - 使用线程可以把占据长时间的程序中的任务放到后台去处理 - 用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以原创 2017-12-16 11:36:49 · 558 阅读 · 1 评论 -
[Python] - 正则表达式
文章从简书转入,只因它已不再是以前的简书My life is in these books. Read these and know my heart. 我的人生就在这些书中,读完他们就能读懂我的心。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配re 模块使 Python 语言拥有全部的正则表达式功能re.match 函数 re.match 尝试从字符串的起始原创 2017-12-15 09:47:16 · 505 阅读 · 0 评论 -
[Python] - 爬虫之 Selenium 的使用
Selenium 介绍安装安装 SeleniumMac OS 系统安装浏览器驱动器 Drivers快速入门简单尝试使用 Selenium 写测试案例页面操作和网页交互填充表单拖放弹出对话框导航历史和位置Cookies元素查找总体概述通过 ID 查找通过 Name 查找通过 XPath 查找username 查找方法Clear 按钮查找通过链原创 2018-01-06 18:14:44 · 1165 阅读 · 0 评论 -
[Python] - 模块
文章从简书转入,只因它已不再是以前的简书Life is the art of drawing without an eraser. 生活是一门没有橡皮擦的艺术。模块简介类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.py文件中),n个 .py 文件组成的代码集合原创 2017-12-15 09:41:50 · 395 阅读 · 0 评论 -
[Python] - 迭代器与生成器
文章从简书转入,只因它已不再是以前的简书The simplest answer is often the correct one. 最简单的答案通常是正确答案。迭代器迭代是Python最强大的功能之一,是访问集合元素的一种方式可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator迭代器是一个可以记住遍历的位置的对象迭代器对象从集合的第一个元素开始访问,直到所有的元素原创 2017-12-15 09:38:57 · 426 阅读 · 0 评论 -
[Python] - 爬虫之简介和基本原理
爬虫简介爬虫,即网络爬虫,可理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛,如果它遇到资源,那么它就会抓取下来。一句话形容爬虫:一段自定抓取互联网信息的程序爬虫的作用取互联网数据,为我所用!简单爬虫架构运行流程URL管理器URL简单介绍 URL,即统一资源定位符,也就是我们说的网址,统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示原创 2017-12-18 15:18:37 · 1291 阅读 · 0 评论 -
[Python] - 爬虫之Urllib库的基本使用
1.获取一个网页HTML内容一个网页,实质上就是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存在于HTML中的,下面我们就写个例子来获取一个网页下来。# 引入 urllib request 模块import urllib.request# 直接请求网页response = urllib.reques原创 2017-12-21 14:39:39 · 2632 阅读 · 0 评论 -
[Python] - 初识和基本操作
文章从简书转入,只因它已不再是以前的简书Python 安装 因为 Python 是跨平台的,它可以运行在 Windows、Mac 和各种Linux/Unix 系统上在 Mac上安装 Python方法一:系统自带,运行终端,输入 python, 即可启动 Python (如果自带版本低,请更新)方法二:从 Python 官网下载 Python 最新版本,双击运行并安装方法三:安装了Home原创 2017-12-14 09:53:25 · 525 阅读 · 0 评论 -
[Python] - 基本数据类型和变量
Get outside every day. Miracles are waiting everywhere. 每天出去走走,奇迹就在身边。标准数据类型Python 3 中有六个标准的数据类型:Number(数字)String(字符串)List(列表)Tuple(元组)Set(集合)Dictionary(字典)Number - 数字 Python 3 支持 int、float、原创 2017-12-14 09:55:56 · 584 阅读 · 0 评论 -
[Python] - 运算符
文章从简书转入,只因它已不再是以前的简书Action may not always bring happiness, but there is no happiness without action. 行动不一定带来幸福,不行动就肯定没有幸福。Python语言支持以下类型的运算符:算术运算符比较(关系)运算符赋值运算符逻辑运算符位运算符成员运算符身份运算符运算符优先级算术运算符以原创 2017-12-14 10:25:53 · 653 阅读 · 0 评论 -
[Python] - 数字(Number)
文章从简书转入,只因它已不再是以前的简书There are no regrets in life, just lessons. 人生中没有后悔,只有教训。Python 数字数据类型用于存储数值。 数据类型是不允许改变的,这就意味着如果改变数字数据类型得值,将重新分配内存空间。Number 对象创建num1 = 1num2 = 10使用del语句删除一些数字对象的引用,删除单个或多个对象的引用用原创 2017-12-14 10:29:29 · 355 阅读 · 0 评论 -
[Python] - 字符串
文章从简书转入,只因它已不再是以前的简书Make everything as simple as possible, but not simpler — Albert Einstein 把每件事,做简单到极致,但又不过于简单 - 阿尔伯特·爱因斯坦字符串是 Python 中最常用的数据类型。我们可以使用引号''或""来创建字符串。str = 'Hello World!'name = "Mazy"原创 2017-12-14 10:32:42 · 506 阅读 · 0 评论 -
[Python] - 列表
文章从简书转入,只因它已不再是以前的简书Either you run the day, or the day runs you. 你不掌握时间,时间就会折磨你。1、列表是最常用的 Python 数据类型2、列表中的每个元素都分配一个数字( 它的位置,或索引),第一个索引是0,第二个索引是1,依此累加3、列表的数据项不需要具有相同的类型4、创建一个列表,只要把逗号分隔的不同的数据项使用方括号原创 2017-12-14 10:35:50 · 641 阅读 · 0 评论 -
[Python] - 元组
文章从简书转入,只因它已不再是以前的简书Patience is better, but its fruit is sweet. 忍耐是痛苦的,但它的果实是甜蜜的。Python 的元组与列表类似,不同之处在于元组的元素不能修改元组使用小括号,列表使用方括号元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可元组与字符串类似,下标索引从0开始,可以进行截取,组合等元祖示例tup1 = () #原创 2017-12-14 10:38:22 · 463 阅读 · 0 评论 -
[Python] - 字典
文章从简书转入,只因它已不再是以前的简书Don’t follow the crowd, let the crowd follow you. 不随波逐流,要引领潮流。字典是另一种可变容器模型,且可存储任意类型对象字典的每个键值key,value对用冒号:分割,每个对之间用逗号,分割,整个字典包括在花括号{}中键必须是唯一的,但值则不必值可以取任何数据类型,但键必须是不可变的,如字符串,数字或原创 2017-12-14 11:17:31 · 544 阅读 · 0 评论 -
[Python] - 条件判断和循环语句
文章从简书转入,只因它已不再是以前的简书Human life is ephemera, which makes it precious. 生命短暂,所以珍贵。条件语句Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码if 语句 Python 中用 elif 代替了 else if,所以if语句的关键字为:if – elif – elsescore =原创 2017-12-14 11:32:37 · 844 阅读 · 0 评论 -
[Python] - 爬虫之Requests基本使用
Requests 是一个非常强大的 HTTP 请求库,基于 urllib,使网络请求变的非常简洁 官方文档Requests 官方文档安装利用 pip 安装 $ pip3 install requests利用 easy_install easy_install requests初步尝试首先我们引入一个小例子来感受一下import requestsr = requests.get("htt原创 2017-12-22 17:05:58 · 849 阅读 · 0 评论 -
[Python] - 爬虫之抓取 Boss直聘 数据到 Excel 中
声明:此博客爬取的数据只为学习爬虫使用,绝非广告程序介绍文件目录├── Zhipin_spider # 文件夹│ ├── spider_main.py # 调度器。是爬虫的入口,管理各个类│ ├── html_downloader.py # 下载器,负责网页内容的下载│ ├── html_parser.py # 解析器,负责解析数据,获取有价值的数据原创 2018-01-07 17:47:27 · 7002 阅读 · 0 评论