
学习Python
文章平均质量分 83
如果大家在学习中遇到困难,想找一个python学习交流环境,可以加入我们一起学习,QQ峮:810735403
小白^-
这个作者很懒,什么都没留下…
展开
-
牛逼,我用Python实现哈哈镜捉弄女友,女友气的拉黑了我
在游乐场或者商场中,大家可能会见到过哈哈镜,哈哈镜通过凹凸不平的镜面,将人物或者是物件在镜面显示中进行扭曲,让人看起来非常的搞笑。对于哈哈镜的成像效果,有两种的方式,一个是下图中间的缩小的效果,另一种则是下图中右侧的放大效果。小编趁着自己的闲暇时间,自己做了一个哈哈镜的软件,用来捉弄一下自己的朋友,大家一起来看看是如何实现的吧。01.公式原理对图片进行哈哈镜的操作处理,其实就是像素点位置坐标的一个坐标映射关系的变化,我们来结合下图进行讲解。上图中,图像的左上角...转载 2021-02-22 09:41:31 · 672 阅读 · 0 评论 -
围观大神是如何用 Python 处理文件的?
在这个世界上,人们每天都在用 Python 完成着不同的工作。而文件操作,则是大家最常需要解决的任务之一。使用 Python,你可以轻松为他人生成精美的报表,也可以用短短几行代码快速解析、整理上万份数据文件。当我们编写与文件相关的代码时,通常会关注这些事情:我的代码是不是足够快?我的代码有没有事半功倍的完成任务? 在这篇文章中,我会与你分享与之相关的几个编程建议。我会向你推荐一个被低估的 Python 标准库模块、演示一个读取大文件的最佳方式、最后再分享我对函数设计的一点思考。下面,让我们进入第一个原创 2021-02-20 10:15:35 · 279 阅读 · 0 评论 -
用 Python 爬取各类基金数据并动态展示
去年接触基金,体会到了基金的香(真香),这几天也是过年后开始交易的日子,今天爬取『蛋卷基金』数据,通过pyecharts动图可视化方式展示基金的涨跌情况。本文将围绕这三点去进行爬取数据,动图可视化展示数据: 近一月涨跌幅前10名 基金各个阶段涨跌幅 近30个交易日净值情况 一、数据获取1.数据来源本文的数据来源:『蛋卷基金』https://danjuanapp.com/2.数据分析接下爬取的数据涉及五大类(五种基金) 股票型基金 .原创 2021-02-19 17:02:18 · 2172 阅读 · 0 评论 -
四种Python爬虫常用的定位元素方法对比,你偏爱哪一款?
在使用Python本爬虫采集数据时,一个很重要的操作就是如何从请求到的网页中提取数据,而正确定位想要的数据又是第一步操作。本文将对比几种 Python 爬虫中比较常用的定位网页元素的方式供大家学习 传统BeautifulSoup操作 基于BeautifulSoup的 CSS 选择器(与PyQuery类似) XPath 正则表达式 参考网页是当当网图书畅销总榜:http://bang.dangdang.com/books/bestselle...原创 2021-02-19 10:50:34 · 625 阅读 · 0 评论 -
用 Python 创建你自己的 Shell
介绍很多人讨厌bash脚本。每当我要做最简单的事情时,我都必须查阅文档。如何将函数的参数转发给子命令?如何将字符串分配给变量,然后作为命令调用该字符串?如何检查两个字符串变量是否相等?如何分割字符串并获得后半部分?等等。不是我找不到这些答案,而是每次都必须查找它们。但是,我们不能否认将整个程序当作纯粹的功能发挥作用的能力,以及将一个程序的输出传递到另一个程序的自然程度。因此,我想知道,我们能否将bash的某些功能与Python结合起来?基础知识让我们从一个类开始。这是一个简单的方法,将其初始原创 2021-02-05 10:10:21 · 1162 阅读 · 1 评论 -
轻松识别文字,这款Python OCR库支持超过80种语言
OCR是什么?有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。OCR的全称叫作“Optical Character Recognition”,即光学字符识别。这算是生活里最常见、最有用的AI应用技术之一。细心观察便可发现,身边到处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。OCR本质是图像识别,其包含两大关键技术:文本检测和文字原创 2021-02-04 17:40:15 · 1149 阅读 · 2 评论 -
年前福利 | 小白如何学习python?【干货】Python线路
这篇文章是给零基础小白整理的如何系统的真正学会Python。呕心沥血整理了3天的内容,一定不要错过,可以先收藏起来。思维导图附有可跳转的链接地址(回复“入门”获取)学Python首先要摆正心态,没有所谓的速成方法,如果有的话就是“死磕”。我那会自学Python的根本没那么多资料,更别说什么视频,连书籍都少得可怜。那会我是怎么学呢?一遍又一遍的啃书,每天至少花3个小时看书敲示例代码,做demo项目,我记得那会去面试的时候面试官问我做过什么项目,我就把自己做的一个聚合网站演示给他看,..原创 2021-02-04 10:06:35 · 420 阅读 · 2 评论 -
Github上的这个Python黑魔法手册,能学到很多!
全球最大的同性交友网站——Github!因为逛逛网站就能学习很多姿势!这不,又发现了一个牛比的项目这个项目在Github上有1.6k star!是一个讲述Python黑魔法的项目项目地址是:https://github.com/iswbm/magic-python项目介绍了很多少有人知的一些 Python 冷门知识,Python Shell 的多样玩法,各种令人疯狂的 Python 炫技操作,Python 的超详细进阶知识解读,还有不断扩充完善适合所有 Python.原创 2021-02-04 09:57:09 · 687 阅读 · 0 评论 -
疯狂!丈母娘让我用 Python 算领证吉日!
决定和女朋友去领证了,心里那个激动啊,无以言表!我们俩都是比较随性的,准备拿到户口本就去领。可谁知女朋友回家拿户口本的时候,跟我说:最近可能领不了了!what?到手的鸭子要飞了?我心里咯噔一下。询问后才知道,丈母娘说领证可以,但是要选择一个良辰吉日,要求有俩:一个是看万年历,选取宜“婚假”的日子;一个是需要选择农历的双数日期,双数代表吉利。听了之后,我拍着胸脯说没问题。接着准备去翻万年历了,可不想这时候女朋友来一句:你个呆子,还准备一天天地去翻啊?写个小程序不就1秒钟的事吗?我拍了拍..原创 2021-02-03 10:04:05 · 298 阅读 · 0 评论 -
Python自动化读取邮件基础代码讲解
这篇文章将分别介绍两个很实用的收取及读取邮件的库:imbox和poplib,主要将讲解: imbox收取邮件 poplib收取邮件 keyring存储密码 确定配置好了之后就可以继续阅读今天的文章!一、poplib库poplib模块提供了poplib.POP3和poplib.POP3_SSL两个类,分别用于连接普通的 POP 服务器和基于 SSL 的 POP 服务器。连接到服务器后,按照POP3 协议与服务器交互。注意:虽然 POP...原创 2021-02-02 09:38:32 · 1267 阅读 · 1 评论 -
骚操作 | 高效办公,Python 自动化教你一键获取日志!
1. 前言对大部分的人来说,解决 Bug 都是依靠关键字去日志去定位问题!在调试情况下,我们可以实时在控制台查看日志;但对于部署到服务器上的应用,日志都存放在服务器某个目录下,没法通过本地查看到这种情况下,就需要我们先登录服务器,然后进入到日志目录文件夹,最后通过日志文件去定位问题;如果涉及到 K8s 容器,可能还需要使用 kubectl 命令进入到服务对应的容器中,进入到日志目录,才能开始定位问题,这一切显得非常繁琐且低效本篇文章介绍一款 Python 依赖库:pexpect,作为一款命令原创 2021-02-02 09:29:11 · 271 阅读 · 0 评论 -
牛逼了!Python Web 接口优化,性能提升25倍!
背景我们负责的一个业务平台,有次在发现设置页面的加载特别特别地慢,简直就是令人发指让用户等待 36s 肯定是不可能的,于是我们就要开启优化之旅了。投石问路既然是网站的响应问题,可以通过 Chrome 这个强大的工具帮助我们快速找到优化方向。通过 Chrome 的 Network 除了可以看到接口请求耗时之外,还能看到一个时间的分配情况,选择一个配置没有那么多的项目,简单请求看看:虽然只是一个只有三条记录的项目,加载项目设置都需要 17s,通过 Timing, 可以看到总的请求原创 2021-01-30 13:39:06 · 403 阅读 · 0 评论 -
吹爆了这个可视化神器,上手后直接开大~
今天给大家推荐一个可视化神器 - Plotly_express ,上手非常的简单,基本所有的图都只要一行代码就能绘出一张非常酷炫的可视化图。以下是这个神器的详细使用方法,文中附含大量的 GIF 动图示例图。注:源代码(.ipypnb文件)的获取方式,我放在文末了。记得下载1. 环境准备本文的是在如下环境下测试完成的。 Python3.7 Jupyter notebook Pandas1.1.3 Plotly_express0.4.1 其中 P...原创 2021-01-30 13:36:59 · 1496 阅读 · 0 评论 -
Python正则表达式,看完这篇文章就够了!
玩转正则表达式本文中介绍的是主要是3个知识点: 正则表达式的相关知识 Python的中re模块,主要是用来处理正则表达式 一个利用re模块通过正则表达式来进行网页数据的爬取和存储 使用的系统Python版本和其他环境分别如下: npython 3.7.5 MacOS jupyter notebook re # re 模块 requests 2.23.0 # 发送请求 1、正则表达式1.1 正则表...原创 2021-01-30 13:26:00 · 4573 阅读 · 0 评论 -
Python爬取所有人位置信息,制作任意区域人流量显示图
最近偶然看到了腾讯的大数据星云图,非常漂亮,如下图:这些数据代表使用腾讯定位服务的用户实际地理位置,例如微信、QQ、腾讯地图等,所以使用量还是表达的,此图可以间接显示人流量情况该网站还可以查看区域热力图:但是只有个别区域于是我萌生一个想法,用python任意区域人员流量图经过不懈努力,没想到还真给实现了,下面带大家一起学习一下这一过程:一、首先是数据获取数据获取腾讯其实开放了数据接口,但是只能商用:但是不用怕,我们还有其他办法获取进入主页:https://xi原创 2021-01-29 13:11:02 · 2013 阅读 · 5 评论 -
Python 基于 Socket 实现群聊
互联网时代,怎么能不懂点网络编程?套接字(Sockets)是双向通信信道的端点,本文详细介绍了使用Socket实现类似微信群聊的功能,快进来一起学习下吧!1.前言套接字(Sockets)是双向通信信道的端点。套接字可以在一个进程内,在同一机器上的进程之间,或者在不同主机的进程之间进行通信,主机可以是任何一台有连接互联网的机器。套接字可以通过多种不同的通道类型实现:Unix域套接字,TCP,UDP等。套接字库提供了处理公共传输的特定类,以及一个用于处理其余部分的通用接口。1.1 sock.原创 2021-01-29 09:51:21 · 775 阅读 · 0 评论 -
14个超有趣的数据分析项目,数据集都给你整理好啦(建议收藏)
对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个!项目分为三种类型: 可视化项目 探索性数据分析(EDA)项目 预测建模 可视化项目最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。1. 新冠病毒可视化学习如何使用Plotly构建动态可视化数据,展示冠状病毒是如何在全球范围内传播的。Plotly很好用,它可以做动态可视化,好看且操作简单。难..原创 2021-01-29 09:41:45 · 10920 阅读 · 2 评论 -
5分钟掌握 Python 随机爬山算法
随机爬山是一种优化算法。它利用随机性作为搜索过程的一部分。这使得该算法适用于非线性目标函数,而其他局部搜索算法不能很好地运行。它也是一种局部搜索算法,这意味着它修改了单个解决方案并搜索搜索空间的相对局部区域,直到找到局部最优值为止。这意味着它适用于单峰优化问题或在应用全局优化算法后使用。在本教程中,您将发现用于函数优化的爬山优化算法完成本教程后,您将知道: 爬山是用于功能优化的随机局部搜索算法。 如何在Python中从头开始实现爬山算法。 如何应用爬山算法并检查算法结果。..原创 2021-01-29 09:35:15 · 1809 阅读 · 0 评论 -
5行代码搞定14种常见图的python可视化库,还自带16种优美主题,真是太喜欢了
有时候我们做数据可视化并不需要特别复杂的功能,仅仅是想把简单的数据用图形展示出来今天就给大家介绍一种非常适合新手的python可视化库--pygalpygal比较小众,专注于SVG图,擅长交互,最主要的是它能用非常少的代码就可画出非常漂亮的图形pygal能绘制Line(折线图)、Bar(柱状图)、Histogram(直方图)、Pie(饼图)、Radar(雷达图)、Funnel(漏斗图)、Gauge(仪表盘图)等14种常见可视化图而且自带16种漂亮的主题,色调相当柔和,感觉很适合我这样细腻原创 2021-01-28 16:55:49 · 391 阅读 · 0 评论 -
调试Python代码,不要再用Print了!
相信大部分人学习Python,肯定会用print()这个内置函数,来调试代码的。那么在一个大型的项目中,如果你也是使用print来调试你的Python代码,你就会发现你的终端有多个输出。那么你便不得不去分辨,每一行的输出是哪些代码的运行结果。举个例子,运行下面这个程序。num1=30num2=40print(num1)print(num2)输出结果。3040这些输出中哪一个是num1?哪一个又是num2呢?找出两个输出可能不是很困难,但是如果有五个以上...原创 2021-01-28 09:25:38 · 595 阅读 · 0 评论 -
Excel中的xls、xlsx、xlsm混合文件,看我用Python如何统一处理......
引言Python语言,近几年在办公自动化这一领域来说,真的超级火爆!用它做批量处理确实比VBA要方便很多。今天带大家探讨Python处理Excel文件时,遇到的一些问题。在Python中,有几个常用的库专门用来处理Excel文件,分别是xlrd、xlwt和openpyxl,简单介绍一下: xlrd只能读取数据,可以处理xls和xlsx; xlwt只能写数据,只能处理xls; openpyxl可以读数据和写数据,但只能处理xlsx; 如果待处理的文件,既有xls,又有..原创 2021-01-28 09:18:29 · 747 阅读 · 0 评论 -
收藏 | 学习Python的11个顶级Github存储库
如果您是程序员,肯定已经了解平台GitHub。对于刚起步的人来说,GitHub不仅仅是一个托管代码的地方。在这里, 您可以与其他开发人员合作,并使用一系列专用工具来在线管理代码存储库。对于想学习编程语言的人来说,GitHub是一个不错的起点。本文将介绍学习Python的GitHub存储库。1. The AlgorithmsStars:91.8kForked by :27.1kGitHub地址:https://github.com/TheAlgorithms/Python.原创 2021-01-28 09:15:26 · 332 阅读 · 0 评论 -
什么,3行Python代码就能获取海量数据?
一谈起数据分析,首先想到的就是数据,没有数据,谈何分析。毕竟好的菜肴,没有好的原材料,是很难做的~所以本期小F就给大家分享一个获取数据的方法,只需三行代码就能搞定。「GoPUP」,大佬造的轮子,大概有100+的免费数据接口。GitHub:https://github.com/justinzm/gopup使用文档:http://doc.gopup.cn/#/README主要有指数数据、宏观经济数据、新经济数据、微博KOL数据、信息数据、生活数据、疫情数据等。#安装gop.原创 2021-01-27 10:11:50 · 353 阅读 · 0 评论 -
干货!教你用Python可视化分析股票
关于股票数据,网上已经有相对成熟的接口了,我们可以直接调用接口来获取股票的所有数据。可以使用一下 baostock 这个库来调用它们的股票数据接口。你可以通过 pip 安装一波:pip install baostock安装完之后导入,调用 login 方法,返回登录成功就可以调用接口来获取相关的数据了:你可以在官方文档中看到各种参数的使用:比如我们要获取茅台这一只股票的数据就可以这样:很多人学习python,不知道从何学起...原创 2021-01-26 17:12:13 · 5155 阅读 · 2 评论 -
解决安装Pycharm后在C盘下生成大文件的问题
前言上次在整理C盘时,无意间发现了一个这样的文件。在我的用户目录下,有个.PyCharm2019.3这样的文件夹,我猜想和Pycharm可能有什么py关系。那这个文件有多大呢,来操作一下康康。雾草,竟然0.5个G了,我才刚用没多久唉!这对于我这强迫症来说很难受哎,蚂蚁在我心上爬。PyCharm2019.3文件夹的用途是什么呢???里面会有一些配置信息,项目缓存啥的,不重要但是是必须的东西解决办法 将我们C盘下的.PyCharm2019.3文件夹,挪到其他盘.原创 2021-01-26 13:28:01 · 1267 阅读 · 0 评论 -
三行Python代码提取视频中的音频
身处数据爆炸增长的时代,各种各样的数据都飞速增长,视频数据也不例外。我们可以使用 python 来提取视频中的音频,而这仅仅需要安装一个体量很小的python包,然后执行三行程序!语音数据在数据分析领域极为重要。比如可以分析语义、口音、根据人的情绪等等。可以应用于偏好分析、谎话检测等等。提取音频需要用到 python 包 moviepy,这里是moviepy 的 github 地址:https://github.com/Zulko/moviepy安装 python 包安装 movie原创 2021-01-26 10:08:05 · 2283 阅读 · 1 评论 -
干货 | 超全整理|Python 操作 Excel 库 xlwings 常用操作详解!
在Python中还有其他可以直接操作 Excel 文件的库,如xlwings、xlrd、xlwt等等,本文就将讲解另一个优秀的库xlwings开头还是想说一下,各个库之间没有明确的好坏之分,每个库都有其适合的应用场景,并且xlwings和openpyxl许多区别决定了它们的能力是互为补充:“xlwings:需要安装有 Excel 软件,支持.xls和.xlsx格式;可以调用 Excel 文件中 VBA 写好的程序;和matplotlib以及pandas的兼容性强open...原创 2021-01-25 16:55:48 · 1449 阅读 · 0 评论 -
8个Python数据清洗代码,拿来即用
不管你承不承认,数据清洗着实不是一件简单的任务,大多数情况下这项工作是十分耗时而乏味的,但它又是十分重要的。如果你经历过数据清洗的过程,你就会明白我的意思。而这正是撰写这篇文章的目的——让读者更轻松地进行数据清洗工作。事实上,我在不久前意识到,在进行数据清洗时,有一些数据具有相似的模式。也正是从那时起,我开始整理并编译了一些数据清洗代码(见下文),我认为这些代码也适用于其它的常见场景。由于这些常见的场景涉及到不同类型的数据集,因此本文更加侧重于展示和解释这些代码可以用于完成哪些...原创 2021-01-25 09:41:10 · 2556 阅读 · 0 评论 -
用Python写几行代码,一分钟搞定一天工作量,同事直呼:好家伙!
大概是这样,一个文件夹下有多份会议通知信息(本文以 7 份文件为例)每一份通知打开格式基本类似,如下所示????现在需要将每份会议文档中的 学习时间、学习内容、学习形式、主持人 四项关键信息提取出来,整理到 Excel 表格中:在他真实需求中,会议通知四年积累下来有快 1000 份(四年开了这么多次会也是很厉害...),用人力挨个打开文件并录到 Excel 中工作量实在太大。好家伙,这种重复的无聊工作, 不就是一份非常适合交给 Python 的自动化工作吗?我不允许我的粉丝还原创 2021-01-24 13:38:46 · 228 阅读 · 0 评论 -
看我用 Python 一秒发送数百份邮件,让财务部妹子追着喊 666!
需求描述最近公司要发奖金,需要财务部妹子给每个员工发一封邮件,现在全公司 10 个部门每个人的奖金情况已经计算好了,并根据部门分别制作了 10 张表格:每个奖金表格内容大致如下:同时有一份 Excel 文件邮件地址.xlsx,里面有各部门负责人的邮箱:首先第一个需求很简单:给各部门负责人发送相应部门的奖金附件这个需求不同于群发,只要把所有人邮件地址加进来一键发送就可以,而是需要点对点的单发邮件。如果部门或者收件人的数量继续增加,无非会增加工作难度、降低工作效率,因此需要原创 2021-01-23 17:36:20 · 724 阅读 · 0 评论 -
7个适合初学者的Easy Python项目[附源码]
Python正在迅速成为当今编程中最强大的语言之一。它在Web开发,数据科学,数据分析,机器学习,游戏开发等许多领域中找到了无数的应用程序,并且清单还在继续。除了了解Python作为一种语言的重要性之外,新开发人员还具有棘手的任务,即发现有用的项目来工作。这很重要,因为要成为熟练的软件开发人员,您必须尽可能多地学习。初学者从事项目工作会有所帮助;培养您作为软件开发人员的信心 了解编程基础 发展解决问题的能力 通过探索新技术来学习新概念如果下面下载链接失效,请关注我进群 810735.原创 2021-01-23 11:10:34 · 491 阅读 · 0 评论 -
25条很棒的干货!Python一行代码,建议收藏!
自从我用Python编写第一行代码以来,就被它的简单性、出色的可读性和特别流行的一行代码所吸引。在下面,我将给大家介绍并解释一些Python一行程序。可能有些你还不知道,但对你未来的Python项目很有用。1、交换两个变量#a=4b=5a,b=b,a#print(a,b)>>5,4让我们通过交换两个变量作为一个简单的开始。此方法是最简单、最直观的方法之一,无需使用临时变量或应用算术操作即可编写。2、多个变量赋值...原创 2021-01-23 09:57:49 · 408 阅读 · 1 评论 -
Python办公自动化不得不会的十大文件操作!
日常对于批量处理文件的需求非常多,用Python写脚本可以非常方便地实现,但在这过程中难免会和文件打交道,第一次做会有很多文件的操作无从下手,只能找度娘。本篇整理了10个Python中最常用到的文件操作,均采用内置函数实现,无论是批处理还是读取文件都会用到,相信这个梳理对大家有所帮助。1. 显示当前目录当我们想知道当前的工作目录是什么的时候,我们可以简单地使用os模块的getcwd()功能,或者使用pathlib的cwd(),如下所示。>>>#第一种方法:显示当前目录..原创 2021-01-23 09:46:39 · 127 阅读 · 1 评论 -
总结了pandas提取数据的15种方法,统统只需1行代码,真香!
pandas是python数据分析必备工具,它有强大的数据清洗能力,往往能用非常少的代码实现较复杂的数据处理今天,鸟哥总结了pandas筛选数据的15个常用技巧,主要包括5个知识点:1.比较运算:==、<、>、>=、<=、!=2.范围运算:between(left,right)3.字符筛选:str.contains(pattern或字符串,na=False)4.逻辑运算:&(与)、|(或)、not(取反)5.比较函数:eq, ne, le, lt, ge,...原创 2021-01-22 16:19:29 · 2435 阅读 · 4 评论 -
30行python代码帮秘书小姐姐填了上百份表格,成功俘获了小姐姐的芳心
事情是这样的,昨天下班的时候,偶然发现秘书小姐姐情绪很不好,本着乐于助人的原则,我主动凑上前去献温暖经过小姐姐的一番诉苦,原来是这样,马上要下班了,老板却突然发来一个表格,内容如下图:大概有300名左右的人员信息,老板要求小姐姐将这些信息按照如下模板进行填写,每人1张表,今天弄完:就算1张表格半分钟,300张表格搞完也要2个半小时咱怎么能让小姐姐受这罪呢,于是很豪爽的把这件事揽下来了,当时小姐姐看我的眼神都不一样了最后我用30行python代码,然后花了5分钟把这些表格自动填..原创 2021-01-22 11:42:00 · 287 阅读 · 0 评论 -
GitHub热榜,近2万赞! 500个Python趣味案例,一次学到吐!!
大家在学习Python的过程中,在掌握基础的前提下,都想学习一下案例,来进一步巩固Python的基础知识,并提升自己的Python编程能力。基于此,本公众号也长期的为大家通过原创,来为大家提供了大量Python趣味案例,让大家进行学习。小编在浏览GitHub时,发现了一个Python的热门项目,项目的名字就叫Python。该项目提供了近五百个Python的小案例,并且已经接近2万个star,下面就跟随小编一起来学习一下这个项目吧。01.项目介绍该项目的地址为https://g...原创 2021-01-22 10:00:54 · 162 阅读 · 1 评论 -
浅谈Python网络爬虫
一 相关背景网络爬虫(Web Spider)又称网络蜘蛛、网络机器人,是一段用来自动化采集网站数据的程序。如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络爬虫不仅能够为搜索引擎采集网络信息,而且还可以作为定向信息采集器,定向采集某些网站下的特定信息,如:汽车票价,招聘信息,租房信息,微博评论等。二 应用场景图1 应用场景爬虫技术在科学研究、Web安全、产品研发、舆情监控等领域可以做很多事情。如:在数据挖掘、机器学习、图像处理等科学研究领域,如果没有数据,则可以原创 2021-01-21 11:19:27 · 449 阅读 · 0 评论 -
卧槽!一行代码让 Python 的运行速度提高100倍
python一直被病垢运行速度太慢,但是实际上python的执行效率并不慢,慢的是python用的解释器Cpython运行效率太差。“一行代码让python的运行速度提高100倍”这绝不是哗众取宠的论调。我们来看一下这个最简单的例子,从1一直累加到1亿。最原始的代码:import timedef foo(x,y): tt = time.time() s = 0 for i in range(x,y): s += i原创 2021-01-20 10:08:25 · 267 阅读 · 0 评论 -
终于,我用爬虫批量保存了P站的靓图
今天我决定爬虫下 P站的图片,我们首先打开网站研究下。不好意思,手抖打错了,应该是下面这个网站。众所周知,插图网站 pixiv 别名叫 P站,所以今天我用爬虫批量保存二次元P站的靓图。P站主要分为四个模块,插画、动图、漫画、小说,小说和漫画都是日文,看不懂,所以今天的目标就是插画和动图了。图片链接规律分析今天就以插画为例,进入插画模块,我们先找到怎么下载单张插画的图片的方法,我们打开 F12 进入 Network,发现这个页面会返回每个插画的 id。很多人学习pyth原创 2021-01-19 17:01:13 · 1421 阅读 · 0 评论 -
Python 爬虫进阶 - 前后端分离有什么了不起,过程超详细!
我们要抓取下面这个网站上的所有图书列表:https://www.epubit.com/books1) 探索研究创建一个新的python文件,写入如下代码:import requestsurl = 'https://www.epubit.com/books'res = requests.get(url)print(res.text)运行发现打印结果如下:这里面根本没有图书的信息。但使用浏览器检查器可以看到图书的信息:我们碰到了一个基于前后端分离的网站,或者说一个用JavaS原创 2021-01-18 11:42:42 · 970 阅读 · 1 评论