解决的主要需求
专利信息来源:
知识产权数据库:点击跳转网站
这个网站原来叫“吉江数据”,最近更名为“知识产权数据库”。在该网站检索前需要注册账号并登录,并且该网站的反爬机制比较完善,如果各位需要爬取的单位地址比较多,建议各位事先多准备几个账号以备使用。
代码
# Author: LSY
import openpyxl
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
from bs4 import BeautifulSoup
import random
driver = webdriver.Chrome(executable_path='你的路径')
driver.get('https://www.iprdb.com/user/login.html')
wait = WebDriverWait(driver, 1)
account = driver.find_element_by_css_selector('#account')
account.send_keys("账号名/电话")
password = driver.find_element_by_css_selector('#password'</

本文介绍如何使用Python爬虫从知识产权数据库中抓取专利信息。网站要求注册登录,并存在反爬机制,建议准备多个账号以应对挑战。
最低0.47元/天 解锁文章
1533

被折叠的 条评论
为什么被折叠?



