
python
Liu-HangYu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
三,正则表达式 特殊字符汇总 笔记
符号 正则表达式含义点 (.) 匹配任意字符星 (*) 匹配0个或者多个字符加号(+) 匹配1个或者多个字符问号(?) 要么0个要么1个【非贪婪模式】$ 以…为结尾| 或^ 1 . 中括号内表示取反2 . 中括号外表示以…为开始注:当我们在提取数据的过程中,遇到上述字符在我们要提取的内容之中,若不加转义,即出现报错。因此,对上述字符要格外原创 2021-07-10 12:35:04 · 128 阅读 · 0 评论 -
二,正则表达式 多字符匹配 笔记
二,多字符匹配1.星号(*):匹配零个或多个字符没有 * ,就是从起始位置进行匹配,匹配到第一个有 * ,从起始位置进行匹配,匹配[ ] 内容零次或多次有 * ,从起始位置进行匹配,匹配[ ]内容零次或多次,这里为什么会把整个电话匹配出来?有 * ,从起始位置进行匹配,匹配[ ] 内容零次或多次,为什么结果为空?2. 加号(+):匹配一个或多个有+,对[ ] 内容匹配一次或多次 (至少有一次)为什么报错?从起始位置开始匹配有+, 对[ ] 内容匹配一次或多次 (至少有原创 2021-07-10 12:33:08 · 819 阅读 · 2 评论 -
2020-10-22-liunx系统更改默认pip 和 python 的软连接 -笔记
*#更改默认软连接sudo ln -s /usr/bin/python3.6 /usr/local/bin/python3 # 应该是将原来的python3.6,改为现在需要使用的python3的版本sudo ln -s /usr/local/bin/pip3.8 /usr/local/bin/pip # 更改原来python3.8.5自带的pip3.8 将原来的pip3.8 改为 pip,*#最后检查是否正确设置pip –Vpip list...原创 2020-10-22 09:02:25 · 680 阅读 · 0 评论 -
2020-10-21创建爬虫scrapy框架步骤-笔记
1.创建爬虫框架:scrapy startproject <爬虫程序的名字> douban2.使用cd命令,进入到我们第一步创建的爬虫框架里面执行:scrapy genspider douban "目标网址的域名"3.运行爬虫程序:scrapy crawl <spider>4.编写一个main.py文件导入 scrapy中的cmsline模块,可以实现控制终端运行from scrapy import cmdline使用 execute()方法,输入运行scrapy爬虫的命原创 2020-10-21 10:16:25 · 271 阅读 · 2 评论 -
2020-10-14 queue对象的常用方式
原创 2020-10-14 22:35:36 · 123 阅读 · 0 评论 -
2020-10-14 定时,选取了schedule模块,它的用法非常简洁,官方文档里是这样讲述-笔记
import scheduleimport time#引入schedule和timedef job(): print("学习python创造出生产力,目标")#定义一个叫job的函数,函数的功能是打印'Working in progress...'#部署情况schedule.every(10).minutes.do(job) #部署每10分钟执行一次job()函数的任务schedule.every().hour.do(job)原创 2020-10-14 13:22:49 · 223 阅读 · 2 评论 -
2020-10-13 Selenium用来提取数据的常用方法,笔记
Selenium用来提取数据的常用方法#方法 # 作用find_element_by_id # 通过元素的id来选择find_element_by_class_name # 通过元素的class来选择find_element_by_tag_name # 通过元素的标签名(tag)来选择find_element_by_name # 通过元素的name来选择find_element_by_link_kext # 通过链接的文本来获取超链接find_eleme原创 2020-10-13 13:42:02 · 242 阅读 · 0 评论 -
2020-10-13 把Chrome浏览器设置为静默模式
把Chrome浏览器设置为静默模式import timefrom selenium import webdriver # 从selenium库中调用webdriver模块from selenium.webdriver.chrome.options import Options # 从options模块中调用options类chrome_options = Options() # 实例化Options对象chrome_options.add_argument('--headless原创 2020-10-13 12:15:50 · 1655 阅读 · 0 评论 -
liunx uos deepin安装Python3.8.5
安装Python3.8.5一、安装编译所需要的组件sudo apt updatesudo apt install make build-essential libssl-dev zlib1g-dev liblzma-devsudo apt install libbz2-dev libreadline-dev libsqlite3-dev llvmsudo apt install libncurses5-dev libncursesw5-dev xz-utils tk-dev二、下载最新版原创 2020-10-06 15:39:32 · 3447 阅读 · 1 评论 -
对Excel文件进行读写
对Excel文件进行读写相对来讲,对Excel文件读写的情况较为复杂。首先我们要使用pip install openpyxl。然后我们还得稍微熟悉一下Excel文档的基本概念一个Excel文档也称为一个工作薄(workbook),每个工作薄里可以有多个工作表(wordsheet),当前打开的工作表又叫活动表。每个工作表里有行和列,特定的行与列相交的方格称为单元格(cell)。比如上图第A列和第1行相交的方格我们可以直接表示为A1单元格。import openpyxl# 引用openpyxlwb原创 2020-10-02 10:26:12 · 492 阅读 · 0 评论 -
对学习Python语言初学者的建议必会的3款代码编辑器
我们在使用Python来编程的时候,也需要一个厉害的武器帮助我们提升编程效率,编辑器就是一个非常实用的工具。其实对于Python初学者来说,如何选择编辑器就是首先面对的难题,今天我就以Python常用的3款编辑器为例,帮助大家快速入门。1.初学阶段—Python自带编辑器IDLEPython编程学习可以从这个IDLE编辑器开始,可以在交互环境中输入语句练习,查看执行结果,也可以调试和执行一些简单的小程序,在入门之后,就需要功能更多Python调试工具,即集成开发环境,以便更好的管理和调试那些大程序。原创 2020-10-01 16:23:13 · 356 阅读 · 0 评论 -
chrome浏览器和chromedriver的安装
更新pip版本:pip install --upgrade pip查看已经安装的包有哪些pip listpip freeze简述地址:https://www.jianshu.com/p/366a5da9ed10chrome浏览器的版本:版本 85.0.4183.121(正式版本) (64 位)chromedriver下载的版本:85.0.4183.87/注意:版本一定要对应上路劲问题:默认下载的chromedriver的路径在Downloads:/home/lhy/Downloads/c原创 2020-09-30 20:23:23 · 629 阅读 · 0 评论 -
python-Pycharm中自动-添加时间-日期-作者等信息
在Pycharm中自动添加时间日期作者等信息2.设置相关代码:##!/usr/bin/python3# -*- coding: utf-8 -*-# @Time : ${DATE} ${TIME}# @Author : 菜鸟IT# @FileName: ${NAME}.py# @Software: ${PRODUCT_NAME}可用的预定义文件模板变量为:$ {PROJECT_NAME} - 当前项目的名称。$ {NAME} - 在文件创建过程中在“新建文件”对话框中指定的原创 2020-09-30 09:10:34 · 3824 阅读 · 0 评论 -
python-爬虫第七课Excel格式存储数据-openpyxl 模块
学习目标:提示:这里可以添加学习目标例如:一周掌握 Java 入门知识#学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习时间:提示:这里可以添加计划学习的时间例如:1、 周一至周五晚上 7 点—晚上9点2、 周六上午 9 点-上午 11 点3、 周日下午 3 点-下午 6 点...原创 2020-09-29 00:41:32 · 210 阅读 · 0 评论