自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 怎么有人能不知道自己的IP地址吗呢(python最简单的查询IP地址的方法)

你平常是不是经常听别人说啥ip协议,代理ip,你却说生无可恋的连自己IP是啥都不知道 小编今天就帮你搞定 先不废话了,上代码!!! 如上图,res就是IP地址

2022-09-11 22:10:00 297

原创 听说你还在用bs4快看看lxml吧

家里

2022-09-09 18:44:54 358

原创 不会JS逆向还说自己是爬虫人?从负(负基础)开是逆向JS有道翻译

引言-啥是JS逆向?: 这个问题我在网上搜过,答案大多都似是而非😦,很多都是关于JS加密的释译😨.在这里解释一下,大概就是反JS做的反爬,也就是说,它属于反反爬的一种,但难度又略高于普通的反反爬 1,它JS加密在哪了 2,人家加密了,这可咋整-思路 3,开干 4,源码 1,它加密在哪了 有句话叫你只有知道自己是咋凉的才知道自己要咋搞,那小编先带大家凉一次试试(当然这里的凉指的不是从入门到入土为安😝,而是总结经验痛定思痛),先看一下正常人的脑回路: (1)导入库:import requests

2022-08-21 13:11:41 877

原创 看不懂爬虫教程?看看是不是不知道这几个前端概念(前端0基础也能看懂)

引言-你看不懂的原因😎: 不知大家是否有过这种感觉:自己找的基础教程一看就懂,以为自己啥都会了😎,想看一下大牛教程,结果呢?人家都说"人生苦短,我用python"😎,结果你倒好,直接看的怀疑人生😱,不知所云,为啥会这样呢😬?基础不会😂?会呀😎!玩的不熟😶?熟呀😎,一提爬虫能的不得了😎,还一套一套的😎!那为啥呢?因为人家都那种水平了,肯定学爬虫不会只学爬虫,前端人家也玩的六,到但你不一样呀,你是小白呀😵,为了让大家了却这桩心事😇,我就写了这篇文章让你哭的舒服点😎 目录: 元素 各种节点 DOM 总

2022-08-18 16:00:47 214 1

原创 你说python慢?终端像个黑匣子太丑?...?那是因为你不懂IPython

引言: 啊😱!!!这是无数个python技术人的感慨(不知,你此时是不是会说,听君一席话,如听一席话??😎,先别哭的太早,因为IPython几乎会解决你对python的一切不良感慨),那还等啥?接着往下看呗 为啥要IPython 咋安装,咋用(别慌,IPython不用搭建环境,真的很简单的) 本篇完 1,为啥要IPython 因为它能解决你有关python的一切不良感慨😎😎😎,比如: (1)慢😱 (2)解释器黑不溜秋的跟个黑匣子似的,😂连字符高亮都没有,代码即不易读,又没有黑客风范 (3)交

2022-08-15 10:50:20 382

原创 开干,BeautifulSoup爬取小说,宅家也能快乐过眼瘾(大白话讲解,后面附源码)

引言: 不瞒大家,小编学编程之前就有一个梦想,夏日在家开空调,喝可乐,在别人面前装逼,在电脑前一顿操作(自然也少不了让人欲罢不能的小说)😎,今天就让大家实现这一最基本的人生目标 目标网址:https://m.qb5.tw/book_8227 1,爬取网页源码 2,在网页源码中提取带章节url的元素 3,在元素中提取出url,并对提取的url进行请求,把爬到的文章下载下来 ps:此教程为基础教程,代码是小编用最基本的语法自己写的,所以代码可读性应该还行😎,代码质量若有不足之处还请大佬指正😳🙏, 以

2022-08-12 16:51:18 4117 1

原创 史上最简单最容易理解的爬虫原理的讲解(零基础也能看懂)

其实很多人都会写爬虫,但这只是最表层的东西罢了.相信真正了解爬虫原理的寥寥无几. 爬虫是何: 互联网是什么上一章已经说过了,我们可以抽象的把它看为蜘蛛网,你的电脑可以看做蜘蛛网上的一只蜘蛛,一个个网业你可以看做蜘蛛网上的昆虫,就好比蜘蛛网上有一首诗,那只蜘蛛就会把那那首诗背下来展现在电脑上,这就是爬虫(模拟浏览器向目标服务器发送请求) 那么你在某度上是如何进行搜索的呢? 其实当你在某度的搜索框上输入目标网址时,你的电脑就回用各种方法(DNS协议)找到那个网址的IP地址,那个IP地址又是什么呢?其是就

2022-08-09 18:19:40 228

原创 通俗浅谈分布式爬虫

什么是分布式😦😵??? 你开发的网站只有部署在分在服务器上别人才能看见,因为互联网是很多电脑上的系统按一定协议组合在一起所形成的大网,也就是说你弄的东西发布在互联网上后所有电脑都能看到,因为服务器本身就是服务于互联网的. 但服务器所承受的太多了可能就会负载...,说白了就打个比方阿,就好比服务器他是个人,服务器是服务于所有访问者的,所以你要同时应对多个,你要服务的人,要同时应对多个任务,但你毕竟是个人阿😵😭!!!工作太多你可能会emo😅,同理服务器虽然工作能力很强,但毕竟不可能是无限度的,工作太多了可能

2022-08-08 16:58:36 228

原创 有史以来最通俗,最详细,最全面的BeautifulSoup讲解(老少皆宜)

引言: 面相(新手and老手)的教程 提起BeautifulSoup相信大家都有些了解,但有没有这种经历:一看大佬开源项目一头雾水--这是啥!!?😵😭 看了看官方文档,完全看不懂... ,没事,我来救你 什么?...你说你完全没听过,没事,赶紧过来我来救你 1,最基本的--是啥 BeautifulSoup是一个用来解析提取源码信息的第三方库...,说白了就是从源码中拿走你要的信息的工具🔧,适用于爬虫领域🐛,如果你连爬虫是啥都不知道,建议你先了解一下(用法本人上上篇讲过) 2,咋用 先要解析源.

2022-08-05 13:36:08 600 1

原创 python超好用 超简洁的模块介绍

1,fuckit 本人最喜欢的模块😍 用法:fuckit("文件名") (1)事例:错误代码 a.py: i print(1) 终端:语法错误:i (2)fuckit: import fuckit fuckit("a") 终端:1 2,requests 可以好不夸张的说4行实现爬虫: import requests as r url="https://music.163.com"#网易云网址reponse=r.get(url) print(reponse.text) 终端:.

2022-08-01 22:21:01 261 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除