Python爬虫商品信息

最新推荐文章于 2025-06-10 17:36:07 发布

在努力的望舒7

最新推荐文章于 2025-06-10 17:36:07 发布

阅读量1.5k

点赞数 1

CC 4.0 BY-SA版权

文章标签：爬虫 python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_53336761/article/details/129816773

首先，我们需要确认爬取的网站地址。在本例中，我们要爬取的是京东电脑商品信息，因此我们需要找到京东网站的搜索页面地址：https://search.jd.com/Search?keyword=电脑&enc=utf-8

import requests

url = 'https://search.jd.com/Search?keyword=电脑&enc=utf-8'

response = requests.get(url)

html = response.text

接着，我们用 Python 代码发送 HTTP 请求，获取搜索页面的 HTML 内容。这里我们使用 requests 模块来发送请求：

import requests url = 'https://search.jd.com/Search?keyword=电脑&enc=utf-8' response = requests.get(url) html = response.text

然后，我们使用 Beautiful Soup 模块来解析 HTML 内容，提取我们需要的信息。我们可以通过浏览器的页面审查工具来确定需要提取的标签和类名（这里我只爬取了电脑名称，价格，和商品链接）：

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'html.parser')

items = soup.select('.gl-item')

for item in items:

name = item.select('.p-name em')[0].text.strip()

price = item.select(

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。