python笔记图片_python学习笔记-抓取网页图片脚本

最新推荐文章于 2024-11-28 09:47:50 发布

最新推荐文章于 2024-11-28 09:47:50 发布 · 67 阅读

文章标签：

#python笔记图片

这是一个简单的Python脚本，用于从指定网站抓取并下载所有JPEG图片。用户输入网址后，脚本通过正则表达式匹配图片src属性，并使用urllib模块下载到当前目录的img1文件夹中。

初学者一枚，代码都是模仿网上的。亲测可用~

运行脚本的前提是本机安装了httplib2模块

#!/usr/bin/python

import os

import re

import string

import urllib

#author:reed

#date:2014-05-14

def GetWebPictures():

url=raw_input('please input the website you want to download:')

imgcontent=urllib.urlopen(url).read()

urllist=re.findall(r'src="(http.+?\.jpg)"',imgcontent,re.I)

if not urllist:

print 'not found...'

else:

filepath=os.getcwd()+'\img1'

if os.path.exists(filepath) is False:

os.mkdir(filepath)

x=1

print 'begin to get pictures...'

for imgurl in urllist:

temp=filepath+'\%s.jpg' % x

print 'it is downloading the %s pictures'% x

print imgurl

urllib.urlretrieve(imgurl,temp)

x+=1

print 'download completely...is saved at '+filepath

GetWebPictures()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39841640

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬虫爬取网站全部图片实战

xixi20200的博客

10-13

1万+

一.获得图片地址和图片名称 1.进入网址之后按F12 打开开发人员工具点击elemnts 2.点击下图的小箭头选择主图中的任意一个图片那我们这里点击第一个图片 3.显示控制台为了验证xpath是否正确 4.通过xpath获得a的href 和 title. (请放大看)我们看到他提示的是有10个我们回到网站中看一下在主页上数一下他确实是10个也就是说我们获得的href 和title是没有任何问题的那么留着为我们后面使用. ...

python_study:python学习笔记

03-30

以上内容是根据【标题】"python_study:python学习笔记"和【描述】"python_study Python学习笔记 脚本案例"所涉及的主要知识点，涵盖了Python的基础、语法、脚本应用及进阶主题。通过学习这些内容，你将能够全面掌握...

参与评论您还未登录，请先登录后发表或查看评论

python抓取网页图片的脚本

hello_lxc的博客

10-27

794

首先要在D盘建立pic文件夹然后进入建立beautify的文件夹，然后就可以直接运行python的脚本就可以了import urllib2, re, requests path = r"D:\pic\beautify" url = 'http://huaban.com/favorite/beauty' i_headers = {"User-Agent": "Mozilla/5.0 (Windows

Python 爬虫：获取网页图片

12-26

2342

#coding=utf-8 import urllib import re import os weburl = "http://36kr.com/" #爬取网页 tardir = "F:\\0000\\kk" #保存路径

利用python爬虫大量爬取网页图片

耶律大石的博客

05-02

9314

最近要进行一类图片的识别，因此需要大量图片，所以我用了python爬虫实现主要参考：https://www.cnblogs.com/franklv/p/6829387.html 爬取网页：https://www.ivsky.com/search.php?q=罂粟花库介绍：https://www.cnblogs.com/mzc1997/p/7813801.html https://blog.cs...

python爬虫入门教程：爬取网页图片

热门推荐

qq_46145027的博客

04-05

7万+

在现在这个信息爆炸的时代，要想高效的获取数据，爬虫是非常好用的。而用python做爬虫也十分简单方便，下面通过一个简单的小爬虫程序来看一看写爬虫的基本过程：准备工作语言：python IDE：pycharm 首先是要用到的库，因为是刚入门最简单的程序，我们主要就用到下面这两： import requests //用于请求网页 import re //正则表达式，用于解析筛选网页中的信息其中re是python自带的，requests库需要我们自己安装，在命令行中输入pip install

python网页图片抓取_python学习笔记-抓取网页图片脚本

weixin_39789370的博客

12-02

初学者一枚，代码都是模仿网上的。亲测可用~运行脚本的前提是本机安装了httplib2模块#!/usr/bin/pythonimport osimport reimport stringimport urllib#author:reed#date:2014-05-14def GetWebPictures():url=raw_input(‘please input the website you wa...

python获取网页图片_python学习笔记-抓取网页图片脚本

weixin_39950057的博客

11-26

Python爬取小红书笔记信息加图片（仅供学习参考）

weixin_74305707的博客

11-28

1万+

在本文中，我们将详细介绍如何使用Python对小红书的公开数据进行采集。以下代码不仅能够完成从小红书获取笔记信息，还支持解析、清洗和存储数据。希望对从事数据分析与爬虫的朋友有所帮助。

Python课堂笔记_python_源码

10-02

12. **自动化脚本**：Python因其易学易用的特性，也常用于编写自动化脚本，例如文件管理、系统维护等任务。这份"Python课堂笔记.pdf"应包含了以上提到的多个方面，详细讲解了Python的基础和进阶知识，对于深入理解...

Python爬虫学习入门基础课件与实战笔记项目_网络数据抓取_网页解析_数据提取_反爬虫策略_自动化脚本_多线程爬虫_代理IP使用_数据存储_实战案例分析_学习路径规划_代码示例详.zip

08-28

Python网络爬虫学习笔记项目-详细记录Python爬虫基础概念与实战技巧-涵盖网页获取信息提取数据保存自动化程序等核心内容-用于系统学习网络数据抓取技术并掌握常见反爬应对策略-.zip

11-03

网络爬虫是一种自动获取网络数据的程序或脚本，它通过模拟浏览器访问网页并从中提取所需数据。学习网络爬虫对于数据科学、信息检索等领域非常重要。Python由于其简洁性和强大的库支持，成为了编写网络爬虫的首选语言...

基于Python语言的爬虫技术学习笔记设计源码

10-03

本学习笔记项目通过一系列精心设计的源码文件，向学习者展示了如何利用Python及其丰富的第三方库来构建一个功能完备的网络爬虫。项目共包含37个文件，其中21个为Python源代码文件，这些文件是项目的核心，它们包含了...

基于Spring Boot的家校通管理系统的设计与实现源码.zip

12-07

基于Spring Boot的家校通管理系统的设计与实现源码.zip

【大数据+舆情分析】前端模板落地即用零踩坑！.zip

12-07

【大数据+舆情分析】前端模板落地即用零踩坑！.zip

最优潮流直流最优潮流(OPF)课设（Matlab代码实现）

12-07

【最优潮流】直流最优潮流(OPF)课设（Matlab代码实现）内容概要：本文档主要围绕“直流最优潮流(OPF)课设”的Matlab代码实现展开，属于电力系统优化领域的教学与科研实践内容。文档介绍了通过Matlab进行电力系统最优潮流计算的基本原理与编程实现方法，重点聚焦于直流最优潮流模型的构建与求解过程，适用于课程设计或科研入门实践。文中提及使用YALMIP等优化工具包进行建模，并提供了相关资源下载链接，便于读者复现与学习。此外，文档还列举了大量与电力系统、智能优化算法、机器学习、路径规划等相关的Matlab仿真案例，体现出其服务于科研仿真辅导的综合性平台性质。; 适合人群：电气工程、自动化、电力系统及相关专业的本科生、研究生，以及从事电力系统优化、智能算法应用研究的科研人员。; 使用场景及目标：①掌握直流最优潮流的基本原理与Matlab实现方法；②完成课程设计或科研项目中的电力系统优化任务；③借助提供的丰富案例资源，拓展在智能优化、状态估计、微电网调度等方向的研究思路与技术手段。; 阅读建议：建议读者结合文档中提供的网盘资源，下载完整代码与工具包，边学习理论边动手实践。重点关注YALMIP工具的使用方法，并通过复现文中提到的多个案例，加深对电力系统优化问题建模与求解的理解。

基于Python与机器学习技术构建的智能数据分析与可视化平台_集成数据清洗特征工程模型训练深度学习框架自动化报告生成交互式图表实时仪表盘预测性分析自然语言处理异常.zip

12-07

Car-eye车辆管理系统服务器端核心源码与设计实现_车辆设备管理平台_车辆监控_车辆数据统计_车辆管理_分层次架构_客户端API接口_通信网络_GPS上传_OBD数据_流媒体平台.zip

12-07

出口报关系统源代码出口报关管理工具