
Python
Alst0n
这个作者很懒,什么都没留下…
展开
-
十分钟入门Pandas
文章目录1 创建对象1.1 Series1.2 DataFrame2 查看数据3 选择3.1 获取行、列3.2 设置行、列4 缺失值4 操作4.1 统计4.2 Apply4.3 直方图4.4 字符串函数5 合并5.1 Concat5.2 Join5.3 Append6 Grouping7 Reshaping7.1 Stack层叠7.2 Pivot tables8 Time series9 Cate...原创 2019-12-16 11:46:25 · 482 阅读 · 0 评论 -
Python3爬虫笔记 -- 解析库Beautiful Soup
1、简介Beautiful Soup:Python的一个HTML或XML的解析库,借助网页的结构和属性等特性来解析网页。有了它,我们不用再去写一些复杂的正则表达式,只需要简单的几条语句,就可以完成网页中某个元素的提取。Beautiful Soup在解析时实际上依赖解析器,这里推荐使用lxml解析器,在初始化Beautiful Soup时,把第二个参数改为lxml即可:from bs4 i...原创 2019-10-28 12:13:39 · 873 阅读 · 1 评论 -
Python3爬虫笔记 -- 解析库XPath
XPath概述:XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索。XPath常用规则表达式描述nodename选取此节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点…选取当前节点的...原创 2019-10-27 19:39:21 · 564 阅读 · 0 评论 -
Python3爬虫笔记 -- 正则表达式
常用的匹配规则:模式描述\w匹配字母、数字及下划线\W匹配不是字母、数字及下划线的字符\s匹配任意空白字符,等价于[\t\n\r\f]\S匹配任意非空字符\d匹配任意数字,等价于[0-9]\D匹配任意非数字的字符\A匹配字符串开头\Z匹配字符串结尾,如果存在换行,只匹配到换行前的结束字符串\z匹配字符串结尾,如...原创 2019-10-25 17:47:08 · 324 阅读 · 0 评论 -
Python3爬虫笔记 -- requests
requests在request中,所有的请求都可以用以请求名称命名的方法来调用:r = requests.get('https://www.baidu.com/')r = requests.post('http://httpbin.org/post')r = requests.put('http://httpbin.org/put')r = requests.delete('htt...原创 2019-10-22 20:44:04 · 267 阅读 · 0 评论 -
Python3爬虫笔记 -- urllib
urllib库是Python内置的HTTP请求库,不需要额外安装。它包含如下4个模块:request:HTTP请求模块error:异常处理模块parse:提供URL处理方法,包括拆分、解析、合并等robotparser:识别网站等robot.txt文件1、urllib.request连接URL,获取返回页面的源代码;默认请求方式为GETimport urllib.req...原创 2019-10-19 18:52:43 · 975 阅读 · 0 评论 -
Python网络编程 - TCP
TCP编程客户端Socket:表示打开了一个网络链接,需要知道目标计算机的IP地址、端口号和协议类型。1、创建一个Socket连接:# 导入socket库:import socket# 创建一个socket:s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 建立连接:s.connect(('www.sina.com...原创 2019-10-08 21:22:24 · 638 阅读 · 0 评论 -
Python网络编程 - UDP
UDP编程服务器1、绑定端口s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)# 绑定端口:s.bind(('127.0.0.1', 9999))SOCK_DGRAM:指定了这个Socket的类型是UDP。绑定端口和TCP一样,但是不需要调用listen()方法,而是直接接收来自任何客户端的数据:2、接受数据print(...原创 2019-10-08 23:06:29 · 172 阅读 · 0 评论