
python
秦艽
这个作者很懒,什么都没留下…
展开
-
python爬取动态网页PAT
背景最近刷PTA写题解的时候,需要复制每个题目到md文件,很繁琐,就想着用爬虫将PTA的题目都爬取出来,可查看网页源代码后发现是动态页面,需要用selenium进行爬取。静态页面:数据都在源代码中(并不是F12控制台中的)动态页面:以PTA为例,源代码中无题目信息技术选型selenium 爬取动态页面html2text 将html解析为md项目代码代码讲解(完整代码文章末)导入库from selenium import webdriverfrom selenium.web原创 2020-05-25 10:46:09 · 840 阅读 · 0 评论 -
python爬取动态网页selenium
安装selenium安装浏览器驱动https://www.cnblogs.com/wenchaoz/p/7875365.html代码比如爬取pat网页题目写上自己浏览器驱动的位置找到的是WebElement对象,并不是htmlimport timefrom selenium import webdriverurl = "https://pintia.cn/problem-sets/994805260223102976/problems/type/7"# init browser原创 2020-05-24 19:40:09 · 279 阅读 · 0 评论 -
IDEA中java语言使用Runtime调用py文件出现 Cannot run program "python“系统找不到指定文件
参考博客:https://blog.youkuaiyun.com/qq_26591517/article/details/80441540这里我使用的是第三个方法 使用Runtime.getRuntime()执行脚本文件(推荐)py文件import numpy as np a = np.arange(12).reshape(3,4)print(a)java文件import java.io....原创 2019-05-20 19:39:48 · 3767 阅读 · 2 评论 -
Python 中的 if __name__ == '__main__' 该如何理解
http://blog.konghy.cn/2017/04/24/python-entry-program/转载 2019-05-25 11:33:07 · 133 阅读 · 0 评论 -
Python大佬用20行代码带你打造一个微信聊天机器人(附代码)
https://www.jianshu.com/p/2f439d8e98ba转载 2019-05-24 10:28:20 · 944 阅读 · 0 评论