from selenium import webdriver
import os
import pandas as pd
base_place=os.getcwd()
os.chdir(base_place)
import datetime
the_time=datetime.datetime.now().strftime('%Y-%m-%d %H-%M-%S')
os.makedirs('截图'+" "+the_time)
companies=pd.read_excel("待查公司.xlsx")["公司名"]
print(companies)
all_files_place=os.getcwd()+"\\"+'截图'+" "+the_time
os.chdir(all_files_place)
for company in companies:
os.makedirs(company)
chromedriver=base_place+"\\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
browser = webdriver.Chrome(chromedriver)
normal_name_url={
"03. 中华人民共和国国家发展和改革委员会网站":"https://so.ndrc.gov.cn/s?siteCode=bm04000007&ssl=1&token=&qt=",
"05. 国家税务总局重大税收违法案件信息公布栏网站":"http://www.chinatax.gov.cn/s?siteCode=bm29000002&qt=",
"07. 中华人民共和国生态环境部网站":"http://www.mee.gov.cn/qwjs2019/?searchword=",
"08. 中华人民共和国工业和信息化部网站":"https://www.miit.gov.cn/search/index.html?websiteid=110000000000000&pg=&p=&tpl=&category=&q=",
"12. 国家外汇管理局网站":"http://www.safe.gov.cn/safe/search/index.html?q=",
"14. 中国银行保险监督管理委员会网站":"http://www.cbirc.gov.cn/cn/view/pages/index/jiansuo.html?keyWords=",
"17. 中国盐业协会网站":"http://www.cnsalt.cn/owsc/search.htm?searchCondition=",
"18. 中华人民共和国国家统计局网站":"http://www.stats.gov.cn/was5/web/search?channelid=288041&andsen=",
"19. 中国电力企业联合会网站":"https://cec.org.cn/search/index.html?search=",
"20. 电力建设企业能力及信用信息查询系统网站":"http://credit.cepca.org.cn/Corp_list.aspx?key=",
"21. 国家能源局网站":"http://so.news.cn/was5/web/search?channelid=229767&searchword=",
"22. 国家市场监督管理总局":"http://www.samr.gov.cn/so/s?qt=",
"24. 中华人民共和国农业农村部网站":"http://www.moa.gov.cn/was5/web/search?searchword=",
"25. 中华人民共和国海关总署网站":"http://search.customs.gov.cn/search/pcRender?pageId=f5261418ddc74f03b27e3590c531102b&q=",
"26. 中华人民共和国住房和城乡建设部网站":"http://search.mohurd.gov.cn/?tn=mohurd&lastq=%24wstquerystring%24&sort=last-modified+desc&rn=10&auth_info=&table_id=%24wsttableid%24&pn=0&query=",
"28. 全国资源公共交易平台":"http://www.ggzy.gov.cn/information/info/news/news.shtml?qt="
}
normal_names=normal_name_url.keys()
add_dict={"08. 中华人民共和国工业和信息化部网站":"&jsflIndexSeleted=",
"12. 国家外汇管理局网站":"&siteid=safe&order=releasetime",
"22. 国家市场监督管理总局":"&x=0&y=0&token=849&siteCode=bm30000012"
"24. 中华人民共和国农业农村部网站""&channelid=233424&orderby=-DOCRELTIME",
"25. 中华人民共和国海关总署网站":"&ext=siteId:300632&sr=score%20desc"}
for normal_name in normal_names:
base_url=normal_name_url[normal_name]
for company in companies:
if normal_name in add_dict.keys():
true_url=base_url+company+add_dict[normal_name]
else:
true_url=base_url+company
browser.get(true_url)
os.chdir(all_files_place+"\\"+company)
picture_name=company+'-'+normal_name[5:]+'.png'
browser.save_screenshot(picture_name)