
技能竞赛
smallumbrella
前进--缓慢而坚定
展开
-
爬虫之POST、GET
HTTP 方法: GET 对比 POST 两种最常用的HTTP方法是:GET 和 POST。 什么是HTTP? 超文本传输协议(HTTP)的设计目的是保证客户端和服务器之间的通信。 HTTP的工作方式是客户端与服务器之间的请求-应答协议。 web浏览器可能是客户端,而计算机上的网络应用程序也可能作为服务器端。 举例:客户端(浏览器)向服务器提交HTTP请求:服务器向客户端返回响应。响应包含关于请求的状信息以及可能被请求的内容。 两种HTTP请求方法:GET 和POST GET - 从指定的资源请求数据转载 2021-07-17 15:21:31 · 234 阅读 · 0 评论 -
爬虫之基本的HTML语言知识
整理内容来自W3School HTML简介 什么是HTML? 用来描述网页的一种语言 指的是超文本标记语言(Hyper Text Markup Language) 不是一种编程语言,而是一种标记语言(markup language) 标记语言是一套标记标签(markup tag) HTML 使用**标记标签来描述网页 HTML 标签 HTML 标记标签通常被称为 HTML 标签(HTML tag)。 由尖括号包围的关键词,比如 通常是成对出现的,比如和 标签对中第一个标签是开始标签,第二个标签是结束标原创 2021-07-17 11:49:10 · 294 阅读 · 0 评论 -
大数据技能练习之爬虫
爬虫提纲 基本的HTML语言知识(了解href等大学计算机课程) 学习网站(POSTGET)分包概念 一些js的知识 第1个正则表达式:背包技术,而且必须是最基本的。 XPATH分析语言 Beautifulsoup 请求与响应 爬虫与反爬虫 urllib库 requests库 爬虫框架实现 破解反爬技术 代理池实现 模拟登陆 pyspider框架 APP的抓取 Scrapy框架 ...原创 2021-07-17 11:22:30 · 142 阅读 · 0 评论