python+selenium搜狗微信主页抓取

# coding:utf-8

from selenium import webdriver
from selenium.webdriver.common.action_chains import *
import time

url = 'http://weixin.sogou.com/'

for i in range(0, 22):

    browser = webdriver.PhantomJS()
    browser.get(url)
    browser.refresh()

    # 鼠标悬停‘更多’
    implement = browser.find_element_by_xpath("//a[@id='more_anchor']")
    ActionChains(browser).move_to_element(implement).perform()
    time.sleep(2)

    # 点击标签
    browser.find_element_by_xpath("//a[@id='pc_"+str(i)+"']").click()
    x = browser.find_element_by_xpath("//a[@id='pc_"+str(i)+"']")
    # print x.text

    # 点击‘加载更多内容’
    browser.find_element_by_xpath("//a[@id='look-more']").click()
    time.sleep(2)
    browser.find_element_by_xpath("//a[@id='look-more']").click()
    time.sleep(2)
    for j in range(0, 40):
        title = browser.find_element_by_xpath("//a[@uigs='pc_"+str(i)+"_"+str(j)+"_title']")

        detail = browser.find_element_by_xpath("//a[@uigs='pc_"+str(i)+"_"+str(j)+"_title']/../..//p")

        s = x.text+'  '+title.text+'  '+detail.text
        print s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值