Python学习笔记(9)采集图片网址并下载图片——以途牛旅游网为例

最新推荐文章于 2021-02-04 14:01:22 发布

原创

最新推荐文章于 2021-02-04 14:01:22 发布 · 719 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#Python #爬虫 #数据挖掘

一、操作步骤

爬虫不仅能抓到网页上的文本、网址数据，还可以批量下载图片到电脑中。无论是列表页还是详情页上的图片，只要能获取图片网址都可以用爬虫来下载图片。下面就以途牛网的自助游网页为案例，操作步骤如下：

**注意事项：**从爬虫软件V9.0.0开始，图片下载后的存储位置有了很大改变，但是定义规则过程不变，请注意看第五步里面的说明和相应的链接。

二、案例规则+操作步骤

样本网址：http://www.tuniu.com/tours/210299425
采集内容：旅游名称、价格、图片网址。

如果纯粹采集图片，就不知道图片来源于哪里，所以，我们通常会把网页上的文本信息“旅游名称”“价格”也采集下来，最后可以用excel把它们匹配起来。文章《采集网页数据》已经详细讲过前两步操作了，下面就从第三步操作开始讲。

第三步：采集图片网址

3.1，点击小图可以定位到它的IMG节点。我们不直接采集大图，因为大图是由小图放大的，并且只显示一张，也就只能抓到一张大图，但是小图可以全部抓到，最后用excel处理就能变成大图，所以，类似这种网页的情况抓小图就容易多了。

3.2，再双击展

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Python老王

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python 爬虫实战：在途牛网抓取自驾游路线推荐数据，规划自驾之旅

u014481728的博客

02-03

1205

通过本文的 Python 爬虫实战，我们成功抓取了途牛网的自驾游路线推荐数据，并进行了数据分析和可视化。通过爬虫技术，我们可以快速获取大量的自驾游路线推荐信息，通过数据分析，可以洞察不同目的地的热门路线和推荐指数分布，为规划自驾之旅提供参考。在实际应用中，可以根据需求进一步扩展爬虫功能，例如抓取更多维度的数据、进行更深入的数据挖掘和分析等。

网站数据采集，自动下载图片，更改图片地址

02-01

任意设置采集字段，名称，规则。数据采集，采集代码，采集动画，采集图片，自动按时间和关键字转拼音简历文件夹保存文件，自动修改采集下来后的图片和动画的正确路劲。远程数据库管理相当于一个SQLSERVER的企业管理器，数据库备份和回复，百度关键字采集。感觉好用的帮忙赞一个。

参与评论您还未登录，请先登录后发表或查看评论

python如何采集图片

seo与编程的结合

08-11

631

python 单个图片下载到本地 #coding utf-8 import requests url='https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X3BuZy90cm01Vk1lRnA5a0pIejVYc2YwM1lCa0tnOTNyd3I2S0p1c2xWb3BpYXpBVW1WOWNEeG5sYzlZMWdWeExyWGMxUUxXWTdhZG9DSzJUNnozZDdYNEs5MmcvNjQw?x-oss-

数据采集的利器，python网络爬虫，图片的获取

Derllk的博客

05-17

833

在大数据时代作为数据的源头，python网络爬虫，数据采集的利器本文介绍的是python爬虫图片的获取，家可以加一下python技术交流裙、适合初学者和进阶的同行业交流 ![里面又相关的python入门学习资料及进阶实战视频文档] 点击链接加入群聊【Python技术交流】：https://jq.qq.com/?_wv=1027&k=5SvRhJ9 好了下面开始撸代码走你 import ...

使用python在途牛旅游网站根据传入的出发地，目的地，舱等，舱位，乘客信息，完成自动机票生单

pachongpapa的博客

10-09

2871

# -!- coding: utf-8 -!- import requests import json import re import time def get_flight(parameter): # {"success": false, "msg": "很抱歉，您访问的太快了，休息一下吧，或者登录您的途牛帐号继续访问。", "errorCode": 179991, "atd": n...

途牛旅游网CSS3动画特效特效代码

03-20

途牛旅游网作为知名的在线旅行服务平台，其网站采用了CSS3动画特效来提升用户体验，吸引用户注意力。下面将详细解析CSS3在途牛旅游网中的应用及其关键知识点。 1. **过渡（Transitions）** CSS3过渡允许元素从一种...

社会网络视角下京沪游客旅游线路研究——以山东省为例整理.pdf

12-20

《社会网络视角下京沪游客旅游线路研究——以山东省为例》这篇文章主要探讨了从社会网络角度分析京沪两地游客在山东省旅游线路的选择和差异。社会网络分析是一种社会科学工具，它关注个体之间的相互影响和依赖，强调...

基于大数据的湾区旅游功能外溢趋向研究——以粤港澳大湾区为例.pdf

最新发布

04-26

本文以粤港澳大湾区为例，探讨了区域旅游资源共享背景下，旅游功能在城市之间的外溢现象。研究基于百度旅游、户外助手、途牛旅游等大数据平台的庞大数据集，这为全面了解旅游供给和需求提供了新的视角和方法。研究...

jQuery仿途牛多样式图片轮播代码

04-07

《jQuery仿途牛多样式图片轮播代码解析与实践》在网页设计中，图片轮播是一种常见的元素，用于展示一组图片或信息，为用户提供友好的交互体验。本篇文章将详细解析一款基于jQuery的仿途牛多样式图片轮播代码，帮助...

Python爬虫之Selenium爬取途牛全国的酒店数据进行地图可视化

我不是秃头的博客

02-04

9262

因为找不太到途牛的url规律,就只能慢慢爬取数据,由于页面加载的时间很慢,用一台电脑爬取4000+数据可能需要数小时,这里只是简单实现了每个城市的第一页数据,可以在这个基础上实现多个页面一起爬和强化翻页个功能爬去全国酒店数据+可视化爬去数据可视化Flask+Echarts 爬去数据一个py文件和一个文本文件就可以爬取了首先是py文件 import json from selenium import webdriver from selenium.webdriver.common.action_cha

途牛旅游项目-导航条（后端数据测试）

水巷石子的博客

10-05

2417

温馨提示： (1）数据是最重要的 (2）开发一层测试一层 (3）基础:登录思维导图： CategoryServiceTest package com.tuniu.service; import com.tuniu.domain.Category; import org.junit.Test; import java.util.List; public class CategoryServiceTest { @Test public void test01(){

scrapy爬取途牛网站旅游数据

u014257192的专栏

08-20

6309

描述：采取了scrapy框架对途牛网旅游数据进行了爬取，刚开始练手，所以只爬了四个字段用作测试，分别是景点名称、景点位置、景点开放时间、景点描述，爬取结果存的是json格式。部分数据：部分代码：遇到的问题：start_urls是不能动态添加URL的，这个还需要研究，这里只是简单把所有待爬取的网址全扔进了start_urls里面，这是可行的，但是对网址的预处理就很耗时间了。然后是对

Python实践-简单的爬取图片

Allenzyg的博客

06-22

2094

1.准备工作： Python的安装：到官方网站下载：https://www.python.org/ 下载后，安装，配置环境变量，之后检查安装是否成功：win+r，输入cmd，再敲命令python，出现如下情况，说明安装成功 Python开发工具Pycharm：下载地址：https://www.jetbrains.com/pycharm/ 2.开始爬虫今天我们来爬取图片，有的人可能会问为什么要爬取图片呢，我可以直接下载啊，一张、两张是可以手动下载，如果成千上万张，手动下载就太浪费时

Python爬虫获取图片并下载保存至本地

huang714的专栏

08-12

1738

import urllib.request import os #to open the url def url_open(url): req=urllib.request.Request(url) req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.3; WOW64; rv:51.0) Gecko/20100101 Fire...

【python】根据图片链接（地址）抓取图片

神创的博客

03-22

6041

参考：https://bbs.youkuaiyun.com/topics/391929530成功了import urllib urllib.urlretrieve('图片链接http://', 'f:/自己的本地地址.jpg')

手把手教你爬取途牛网旅行路线数据，告诉你五一去哪儿玩！

程序人生的博客

04-30

3565

作者 | timber 本文经授权转自数据森麟（ID: shujusenlin）五一假期将至，送给大家一个用于途牛网爬取旅行线路线获取的爬虫，预祝大家都度过一个愉快的五一假期。本爬虫最先是用 Scrapy 写的，很多地方没完善好最终停歇了（定制起来比较难），笔者觉得用 Scrapy 展示出来并不是那么优雅，所以就拆了出来。主要运用到的知识点：PyQuery、Selenium、My...

python 爬取图片网站图片链接并下载收集