爬取泡面小镇每日第一条新闻

wuqi356

于 2019-03-15 15:09:03 发布

阅读量394

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wuqi356/article/details/88575031

版权

python 专栏收录该内容

14 篇文章

订阅专栏

爬取泡面小镇每日第一条新闻

# -*- coding: utf-8 -*-
"""
Created on Thu Feb 21 15:14:43 2019

@author: Administrator
"""
from selenium import webdriver
import time
import re
#打开浏览器和网页
dr=webdriver.Chrome()
dr.get('http://www.pmtown.com/archives/category/%E6%97%A9%E6%8A%A5') #获取泡面早报链接
xpath='//*[@id="wrap"]/div/div/div/ul/li[1]/div/h2/a' #早报第一条链接
dr.find_element_by_xpath(xpath).click()
#进行 xpath 整合
time.sleep(5)
sreach_window=dr.window_handles #获取所有打开的窗口
dr.switch_to_window(sreach_window[-1])   #获取最后一个窗口
url=dr.current_url
com_id = re.match(".*archives/(\d+)", url) #读取链接的数字
#print( com_id.group(1))
xpath1='//*[@id="post-%s"]/div/div[2]' %str(com_id.group(1)) #替换数字
print(dr.find_element_by_xpath(xpath1).text)
dr.quit()

博客等级

码龄14年

15
原创

15
点赞

116
收藏

19
粉丝

关注

私信

分类专栏

python 14篇

最新评论

输入企业名称，爬取企业地址
wxb_118: 怎么运行呀
python + openpyxl 输出Excel单元格大小自适应和填充
Zandon Cao: openpyxl提供了get_column_letter方法（导入方式import openpyxl.utils import get_column_letter) ,这个方法可以将列数转为列名，如1转为A
爬取1688商家信息
qq_41730968: 楼主模拟登入那里怎么修改定位呢 1688网页
python excel神器xlwings，用于合并excel
weixin_43407688: 我这样写行吗？ [code=python] sht2 = wk.sheets("sheet2") last_row2 = sht2["a1048576"].end("up").row print(last_row2) sht3 = wk.sheets("sheet3") list3 = sht3.range("A1").expand("table").value print(list3) sht2.range("a"+str(last_row2+1)).value = list3 [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。