一起学python爬虫第四天

最新推荐文章于 2024-12-23 16:45:06 发布

原创最新推荐文章于 2024-12-23 16:45:06 发布 · 204 阅读

0 ·

CC 4.0 BY-SA版权

陆岑卿

文章标签：

#python #爬虫

个人同时被 2 个专栏收录

19 篇文章

订阅专栏

python爬虫

4 篇文章

订阅专栏

本文指导如何使用Python爬取新浪新闻，通过get请求和params参数传递实现搜索功能，演示了从输入关键词到获取URL的完整过程。

今天我们写一爬取新浪新闻的小项目。
爬取一个数据的时候我们第一步肯定就是要找到这个网址，比如我们去找朋友去玩，首先肯定得知道这个朋友家的地址吧。

http://search.sina.com.cn/

url双手奉上

进入网页按下F12，第一次去朋友家肯定得需要确认一下是不是朋友
在这里插入图片描述
如果不是我们就继续找，如果是就是拜访朋友

import requests

response = requests.get(url='http://search.sina.com.cn/')

print(response.text)

打印出来的结果就是网页源代码
在这里插入图片描述
然而我们看到的界面是具备搜索功能的

这就需要用到params
当我们输入一个百度的时候

就会看到有个

这个是我们需要找的内容，就需要在代码中加上

name = input("请输入查找的内容：")
params = {
    'q': name,
    'c': 'news',
    'from': 'index'
}

下面是完整的代码。

import requests
name = input("请输入查找的内容：")
params = {
    'q': name,
    'c': 'news',
    'from': 'index'
}

response = requests.get(url='http://search.sina.com.cn/', params=params)

print(response.url)

我们打印的是输入需要查找的内容的url，效果如下：
在这里插入图片描述今天就分享到这里啦。拜拜啦!

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陆岑卿

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

万字博文教你python爬虫XPath库【详解篇】

孤寒者的博客

09-29

58万+

万字博文教你python爬虫XPath库【详解篇】

【Python爬虫】10个Python爬虫入门实例！快来一起学习吧！！！

lhx1771584985的博客

06-05

3092

在数字时代，数据成为了我们生活和工作中不可或缺的一部分。想象一下，如果你需要快速获取某个城市的天气信息，但又不希望打开繁琐的网页，这时Python爬虫就能派上用场了。今天，我们就来分享一个关于Python爬虫的实战案例——抓取天气信息。首先，我们需要选择一个提供天气数据的网站，比如中国天气网。然后，利用Python的requests库发送HTTP请求，获取网页的HTML内容。接下来，我们需要对HTML进行解析，以提取出我们需要的天气数据。

1 条评论您还未登录，请先登录后发表或查看评论

python爬虫详解

小仙儿

07-11

5万+

python爬虫简介 1、基本概念 1.1、什么是爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。例如：传统的通用搜索引擎AltaVista，Yahoo!和Google等，作为一个辅助人们检索信息的工具也存在着一定的局限性，通用搜索引擎的目标是尽可能大的网络覆盖率，返回的结果包含大量用户不关心的网页，为了解决上述问题，定..

爬虫可以做什么？Python爬虫入门必看保姆级教程！（学习资源+学习路线）

2301_78095812的博客

08-26

2536

Python爬虫，也称为Python网络爬虫或网页蜘蛛，是一种使用Python编程语言编写的程序，用于自动地抓取互联网上的信息。这种程序按照预设的规则，模拟浏览器请求站点的行为，从网站上抓取数据并进行分析提取。Python爬虫的工作原理可以大致分为以下几个步骤：1.发起请求：使用Python的HTTP库（如requests库）向目标网站发起请求，发送一个包含请求头、请求体等信息的Request。

Python爬虫数据可视化_python爬虫可视化

2401_84692299的博客

04-29

880

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。爬取数据：此方法只适用于表格。

探索优快云博客数据：使用Python爬虫技术

热门推荐

孤寒者的博客

08-09

64万+

【Python爬虫必备—＞Scrapy框架快速入门篇——上】

两万字博文教你python爬虫requests库【详解篇】

孤寒者的博客

07-12

63万+

两万字博文教你python爬虫requests库【详解篇】

__init__() got an unexpected keyword argument ‘options‘

program_Mr_lu的博客

11-26

9392

我们在学习爬虫中如果出现这个错误： Traceback (most recent call last): File “E:/pythonwork/第三阶段/day06/1.selenium结合Chrome浏览器.py”, line 18, in driver = webdriver.Chrome(executable_path=r’E:\软\chromedriver_win32\chromedriver.exe’, options=options) TypeError: init() got an une

每个进制之间的转换

program_Mr_lu的博客

12-10

2084

什么是进制？进制也就是进位计数制，是人为定义的带进位的计数方法（有不带进位的计数方法，比如原始的结绳计数法，唱票时常用的“正”字计数法，以及类似的tally mark计数）。对于任何一种进制—X进制，就表示每一位置上的数运算时都是逢X进一位。十进制是逢十进一，十六进制是逢十六进一，二进制就是逢二进一，以此类推，x进制就是逢x进位。我们常用的进制有：二进制、八进制、十进制、十六进制。 ** 进制转换** 　在数字后面加上不同的字母来表示不同的进位制。B（Binary)表示二进制，O（Octal）表示八进

异常报错：Message: Currently focused window has been closed.

program_Mr_lu的博客

11-26

1468

selenium.common.exceptions.NoSuchWindowException: Message: Currently focused 解决方案：第一步：打开IE，工具->Internet选项->高级->重置，弹出窗口，选项“删除个人设置”打上勾，确定重置，回到原始默认状态；（如果出现需要关闭打开的，就在资源管理器中找到你打开的相关文件，然后关闭再进行操作）第二部：打开IE，工具->Internet选项->安全四个图标都中的启用保护模式都勾选然后

Pyinstaller 打包程序出现.No module named 错误

program_Mr_lu的博客

06-24

1377

当我们使用Python打包成exe的时候，会出现 No module named 'xxxxx’，这个表示没有这个模块，有很多人就会安装，或者执行一下源代码，发现有这个模块或者可以执行源程序。我也是百度了很多遍终于把这个问题解决了。 pyinstaller -F xx.py --hidden-import sklearn.neighbors.typedefs 执行这条命令就可。 ...

ubuntu进入数据库报Can‘t connect to local MySQL server through socket ‘/var/run/mysqld/mysqld.sock‘ (2)的错误

program_Mr_lu的博客

04-23

1102

这个是我解决的办法：可能是权限的问题。首先在终端上： cd /var/lib/mysql 查看是否有mysql 再输入： chown -R mysql:mysql /var/lib/mysql 接着启动服务器，终端输入： /etc/init.d/mysql start 然后登录mysql 看看可以启动了吗？ mysql -u root -p 如果有更高的解决办法请留意评论。一起讨论！ ...

PyQt5基础学习

program_Mr_lu的博客

06-11

700

pyqt5-基础 PyQt5是一套来自Digia的Qt5应用框架和Python的粘合剂。支持Python2.x和Python3.x版本。 PyQt5以一套Python模块的形式来实现功能。它包含了超过620个类，600个方法和函数。它是一个多平台的工具套件，它可以运行在所有的主流操作系统中，包含Unix，Windows和Mac OS。PyQt5采用双重许可模式。开发者可以在GPL和社区授权之间选择。 PyQt5的类被划分在几个模块中，下面列出了这些模块： QtCore ：模块包含了非GUI的功能设计。这个

Python爬虫教程：深入理解单继承机制

视频文件"爬虫python入门-21-单继承.ev4.mp4"很可能是这个系列教程中的一个章节，专注于讲解如何在Python爬虫开发中使用单继承的概念。由于教程是面向入门者的，所以内容应该是从基础到具体应用的逐步深入，包括理论...