- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 前端高频面试题(15K级别)
1.简单描述一下 Babel 的编译过程? 首先,Babel的作用是 从一种源码到另一种源码,充当转换编译器的作用,可以简述为 解析(解析JS代码)->转换(解析和修改AST)->重建(将修改后的AST转换成另一种JS代码) 2.JavaScript 中的数组和函数在内存中是如何存储的? 数组,JS里的数组主要就是 以连续内存形式存储的FixedArray、以哈希表形式存储的HashTable 函数,函数属于引用数据类型,存储在堆中,在栈内存中只是存了一个地址来表示对堆内存中的引用。当解
2021-07-23 23:07:52
2658
1
原创 爬虫_Day 6 学习requests库这一篇文章足够
目录 requests安装 requests使用get请求 requests伪装头信息 requests使用ip代理 request使用post请求 request设置超时参数 request忽略ssl证书验证 requests携带cookies请求 并利用selenium获取cookies 1.安装 在ubuntu中 Ctrl+Alt+T 进入终端,输入 ...
2020-04-19 18:42:28
327
原创 爬虫_Day 5 当你斗图失败后又被封了ip啥感受
昨天跟女朋友斗图 被狠狠挖苦了一番 额…… 那都不重要 于是想起来,老子最近学了爬虫 你很开心准备去安排她一波 我们准备下手的网站 http://www.adoutu.com 突然发现可以进行搜索 那我们就找“装逼”的相关图片 https://www.doutula.com/search?key...
2020-04-19 18:41:33
229
原创 爬虫_Day 1 正则表达式
当我开始对爬虫下手的时候心情是这样的 信心满满打开了教程,,看到第一节“正则表达式” md 不会正则表达式学么爬虫!!! 盘他! 正则表达式是干啥用的,简单的讲就是需要在众多的信息中过滤出来自己需要的信息 我整了张表,请看 表一:通用字符 import re # 导包 string = "I like python 2020_3_21" # 定义演示字...
2020-04-19 18:40:06
177
1
原创 爬虫_Day 4 听说有个叫selenium的库可以解放双手 wandou
这几天已经被网课快逼疯了 课程不仅枯燥时间还长 于是决定在安排他一波 实现自动点击以及答题 开开电脑刷就完了 打会王者他不香吗 于是今天的主角就是selenium 配合Google Chrome 分享一个插件 Katalon Recorder 这个插件可以实现录制然后翻译出py代码 是不是很爽 说实话这个库,纯是为了偷懒才发现的 开始装逼了 需要自己安装一下 p...
2020-04-19 18:34:06
339
原创 爬虫_Day 3 伪装请求头
上次成功的爬取到了纵横中文网24小时热销排行榜 他是没有反爬机制的 所以我们很顺利就获取到 l 但是遇到反爬怎么办,我们也丝毫不慌 我们就来伪装一下他的“头部” 这次我们使用豆瓣来测试一下 首先我们用python访问一下 import urllib.request url = "https://www.douban.com/" respinse = urllib.req...
2020-04-19 18:33:04
510
原创 爬虫_Day 2 urllib 模块实战
DuangDuangDuang 上个笔记说了正则表达式 这次实战一下还有urllib模块 这次来爬“纵横中文网”24小时畅销榜名单 经过一顿装逼后 不 操作 成功 怎么搞的呢 首先,介绍一个模块“urllib” """ 这个模块主要记住三个模块(有5个的): 1、request:用于访问读取url(主讲) 先说这几个函数:urlopen() info() ge...
2020-04-19 18:30:50
160
原创 Ubuntu系统中使用Firefox浏览器提示代理服务器拒绝连接
今天换了一下局域网的ip,打开电脑发现在Ubuntu系统中使用Firefox浏览器要是出现这个情况 我们可以打开’首选项’然后划到最后网络设置 刷新一下即可解决问题 ...
2020-04-10 17:02:26
2083
原创 ubuntu 系统 selenium+webdriver安装
Firefox为例 首先我们需要下载一下selenium 终端中输入 pip --default-timeout=100 install selenium 不建议使用国内的镜像源,导入的时候会报错 然后下载geckodriver 各版本geckodriver 下载好了之后进行解压 tar zxvf geckodriver-v0.22.0-linux64.tar.gz 解压好了将解压的文件mv到...
2020-04-06 17:43:17
926
原创 UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 21-23: ordinal not in range(12
今天本打算爬一个斗图网站在做个微信机器人,却被网址中存在中文问题难道 报错: UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 21-23: ordinal not in range(128) 百度一番 全都是 python2的解决把办法比如: import sys reload(sys) sys.setd...
2020-03-31 20:27:54
394
selenium笔记.md
2020-05-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人