- 博客(5)
- 收藏
- 关注
原创 手把手教你爬虫入门之urllib库的作用(以爬取baidu首页为例)
在正式文章之前呢,先讲一下 HTTP headers 何为 headers 呢, HTTP Headers是HTTP请求和相应的核心,它承载了关于客户端浏览器,请求页面,服务器等相关的信息。 通俗的来说,headers就是用户发送给网页的信息。 那么headers对我们开发爬虫来说有什么实际意义呢? 我们使用python开发爬虫去爬取网页,很容易被服务器识别为“非人类”,从而被服务器拒绝访问,导致我们无法爬取页面,而我们利用headers就可以让爬虫伪装成“人类”获取网页信息。 一般我们要使用的header
2021-09-11 18:50:31
1156
1
原创 python中对爬虫开发环境的搭建——Windows系统
前言: 本文旨在介绍搭建爬虫开发环境,帮助新手安装爬虫所需的必备库: 本文所涉及内容: python3.2以上版本自带的pip使用说明; 如何安装selenium库; Chrome驱动的下载与调试; 配置Chrome驱动和selenium包; 安装其他爬虫工具包; 注:本文介绍内容均在 Windows 10 系统中测试,对于 Linux 系统并不适用! pip: pip是一个安装和管理python包的工具,通过pip来安装python包将变得很简单,省去了繁琐的过程,pip的安装依赖于setuptools
2021-09-10 15:53:48
1530
6
原创 (数据结构)在C++环境下实现顺序表以及一个初学者对顺序表的理解
将线性表的抽象数据类型定义在顺序表存储结构下用C++类实现,其模板机制如下。 const int MaxSize = 100; template <typename DataType> class SeqList { public: SeqList( ); //建立空顺序表 SeqList(DataType a[ ], int n); //建立长度为n的顺序表 int Length( );
2021-09-08 21:33:19
574
2
原创 C++文件的基本读写操作(极度简单,适合新手)
文件操作大概可以分为以下几个步骤: 打开(或者创建)文件; 对文件进行操作; 关闭文件; 看上去非常简单也非常清晰,但是实际操作最为重要。 要用到的头文件为 fstream . 为了让大家清晰,我们进行分步操作。 打开文件操作: #include<iostream> #include<fstream> using namespace std; int main() { ofstream file1;//这里是对文件指针进行声明,ifstream是读文件的方式打开,of
2021-03-30 20:37:15
991
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人