京东数坊人群追踪报告数据无法下载

本文介绍如何通过模拟登录和正则表达式清洗网页源码,实现自动获取京东数坊的人群追踪报告数据,从而节省手动操作的时间成本。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

实现自动获取网页内容,节省复制粘贴时间成本

在这里插入图片描述

模拟登陆
def Land_Stage(url):  # 设置浏览器并打开
    option = webdriver.ChromeOptions()
    prefs = {'profile.default_content_settings.popups': 0}
    option.add_experimental_option('prefs', prefs)
    driver = webdriver.Chrome(options=option)
    driver.implicitly_wait(20)
    driver.get(url)
    return driver

定位到目标报告,查看报告并拿到网页源码

pather = '//div[contains(text(), {})]/parent::td/../td[@class="textLeft process"]/div/div[1]'.format(fname)
    driver.find_element_by_xpath(pather).click()
    page = driver.page_source
利用正则,简单粗暴清洗网页源码,拿到目标数据
def Extraction_Data(page):  # 清洗为字典
    goal = re.findall('推广目标:(.*?)<', page)
    reach = re.findall('活动触达总人数.*?<span class="size">(.*?)<', page)
    buy = re.findall('购买人数<br><span>(.*?)</span>', page)
    B_rate = re.findall('购买率<br><span>(.*?)</span>', page)
    new_buy = re.findall('新客人数<br><span>(.*?)</span>', page)
    old_buy = re.findall('老客人数<br><span>(.*?)</span>', page)
    Touch_no_buy = re.findall('触达未购人数<br><span>(.*?)</span>', page)
    Touch_buy = re.findall('触达已购人数<br><span>(.*?)</span>', page)
    new_buy_rate = re.findall('新客购买率<br><span>(.*?)</span>', page)
    old_buy_rate = re.findall('老客复购率<br><span>(.*?)</span>', page)
    old_buy_Proportion = re.findall('老客占比<br><span>(.*?)</span>', page)
    new_buy_Proportion = re.findall('新客占比<br><span>(.*?)</span>', page)
    data = {
        '推广目标:': goal,
        '触达总人数:': reach,
        '总购买人数:': buy,
        '购买率:': B_rate,
        '新客人数:': new_buy,
        '老客人数:': old_buy,
        '触达已购:': Touch_buy,
        '触达未购:': Touch_no_buy,
        '新客购买率:': new_buy_rate,
        '老客购买率:': old_buy_rate,
        '新客占比:': new_buy_Proportion,
        '老客占比:': old_buy_Proportion
    }
    return data
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值