2022国庆采集了某医药网医药数据帮助买药浅析(独家)

原创已于 2022-10-04 12:43:31 修改 · 154 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #pycharm #vscode

于 2022-10-04 12:22:34 首次发布

爬虫专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一段Python代码，该代码使用多个库如requests和parsel来从网页中抓取特定的商品信息，包括商品标题、规格、价格及制造商等，并通过正则表达式解析价格数据。此外还提供源码下载服务，以便读者可以进一步分析所获取的数据。

下面是用到的Python 库：

import time
import requests
import re
import os
import parsel
import string
import re
import csv

并提供了源码下载服务，后续篇章基于数据进行Python 大数据分析，生成具有巨大价值的数据图表。

一下为程序核心代码片段：

for div in divs:
    title =div.css('.tit a::attr(title)').get()
    href='http:'+div.css('.tit a::attr(href)').get()
    spec =div.css('.c_name::text').get()[3:]
    prices =div.css('.pdPrice').get()
    price=re.findall('\d+',prices)[0]+'.'+re.findall('\d+',prices)[1]
    manufacturer =div.css('.madeIn::text').get()[3:]
    print(title,spec,price,manufacturer,href)