python模拟登录前程无忧,发送简历

本文介绍了一个针对51job网站的爬虫程序实现,包括登录验证、手动输入验证码、搜索并抓取相关公司的招聘信息及发送简历等功能。通过Python的requests和BeautifulSoup库实现了网页的请求与解析。

主要想模拟登录,抓取相关公司,发送简历。 已经实现验证码手动输入,抓取相关公司,发送简历这个功能现在在想如何实现。

import requests
from bs4 import BeautifulSoup
import re


s = requests.session()
#用户名和密码
login_data = {'username': '用户名',
              "userpwd":"密码",
}

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.81 Safari/537.36'}
#模拟登录查看是否有验证码,如果有,手动输入。
# r=s.get("http://my.51job.com/my/My_SignIn.php")
# r.encoding="gb2312"
# a= BeautifulSoup(r.text).find(class_="verifyPicChangeClick").get("src")
# print(a)
#
# if a:
#
#     data=s.get(a)
#     f=open("test.png","wb")
#     f.write(data.content)
#     f.close()
#     verifyCode=input("please input code:")
#     login_data["login_verify"]=verifyCode
#
#
# print(login_data)
#r=s.post("http://my.51job.com/my/My_Pmc.php",data=login_data,headers=headers)
#不同的搜索条件,设置不同的URL,每页有50个公司
req=s.get("http://search.51job.com/jobsearch/search_result.php?fromJs=1&jobarea=040000%2C00&funtype=0000&industrytype=00&keyword=android&keywordtype=1&lang=c&stype=2&postchannel=0000&fromType=1")
#print(req.text)
soupList=BeautifulSoup(req.text).find_all(href=re.compile(r"http://search.51job.com/job/[\d]+.?"))
href=[ i.get("href") for i in soupList]
print(href)

转载于:https://my.oschina.net/sldk/blog/422381

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值