- 博客(26)
- 资源 (1)
- 收藏
- 关注
原创 Python为Word文档添加书签并打包成exe
由于一些工作场景,需要从多个Word文档中找到出现的关键词,并阅读关键词的上下文内容。文件可能几十个,手动操作太要命了。所以python尝试处理。
2025-03-23 18:41:59
598
原创 HiveSQL:提取json串内容(含key为中文情况)——get_json_oject和json_tuple
提取json串中内容,json格式示例如下......get_json_object和json_tuple的一些不同......
2024-08-18 11:54:36
1555
原创 SQL:NOT IN与NOT EXISTS不等价
在对SQL语句进行性能优化时,经常用到一个技巧是将IN改写成EXISTS,这是等价改写,并没有什么问题。问题在于,将NOT IN改写成NOT EXISTS时,结果未必一样。
2024-05-04 18:48:13
1032
1
原创 SQL:窗口函数之OVER()
窗口函数 通用格式 “函数 OVER (PARTITION BY 分组 ORDER BY 排序依据 升降序)”。这里记录下OVER()的使用方法current row 当前行n preceding:往前n行n following:往后n行unbounded: 起点,对应前面的n
2024-03-22 14:42:57
3459
3
原创 python计算两个DataFrame的指定两列中,相同的数据有多少
经过json数据提取和字符串清洗,统计结果A和结果B中,red列和blue列是一样的数量有多少。
2024-02-03 22:10:26
1242
1
原创 SQL:一行中存在任一指标就显示出来
当想要统计的两个指标不在一张表中时,需要做关联。没有办法保证有其中一张表的维度是全的,借助full join处理,好处是,不需要额外构建一个维度表。
2024-01-13 13:56:26
684
1
原创 python中字符串转列表
python字符串转列表提到字符串转列表听着好像就是一件事情,但往往因为大家的需要不同,解决方法不一定都适用。废话不多说,这是我遇到的两种情况。1、字符串存的是一个列表内容# 字符串转为列表# 第一种情况# 字符串存的是一个列表内容,希望直接把这个内容变为列表str2 = "['早上', '吃', '什么', ',', '有', '什么']"list2 = eval(str2)print(type(str2))print(type(list2))# PS:我其实是利用这个方法,去处理数
2021-04-29 13:03:41
2114
原创 python利用正则表达式读取文件中指定内容
说明:txt文件中按行存储了不同的数据。目的:从文件中取出公司名称。变更2021-03-30 16:27:272021-03-30 16:27:2720深圳市永顺康商贸有限公司{"…2021-03-30 16:27:292021-03-30 16:27:2919深圳市汇百荟科技有限公司思路:利用正则匹配每行以“公司”字样结尾的行,存入到列表中,即可获取文件中的所有公司名。import re# 读取每行结尾是“公司”的行,存入list# input_file:存储公司名称的
2021-04-19 18:24:34
5284
2
原创 爬虫selenium处理警告框(弹出框)
爬虫selenium处理弹出框使用爬虫时候,处理弹出框,并选择确认。from selenium import webdriverimport timedriver = webdriver.Chrome()driver.get('http://gsxt.gdgs.gov.cn/')time.sleep(1)# 打印网页title# print(driver.title)# 处理警告框alert = driver.switch_to.alertalert.accept() #接受现有弹
2021-03-30 10:24:54
888
1
原创 chrome88.0版本修改selenium的window.navigator.webdriver
修改selenium的window.navigator.webdriver为undefined使用selenium写爬虫的时候window.navigator.webdriver的值是true,容易被识别,需要隐藏起来,都说这个execute_cdp_cmd的方法有效。但经实验,window.navigator.webdriver的值仍然为true。是因为chrome版本升级到了88.0版本,所以失效了。# 处理window.navigator.webdriver防止被识别,chrome88.0版本失效
2021-02-17 21:45:01
1511
原创 python读取json串指定字段-并先清空文件再读写文件
python读取json串指定字段,先清空文件再读写文件背景:jsonString.txt中存储了一个json串目的:将json串“B”中的人名(StockName字段)提取出来,并写入新的文件jsonElements.txt中。并且每次执行不需要手动清空jsonElements.txt文件。其中jsonString.txt内容如下:{"A":[{"CompanyId":"","StockName":"黄俊童","RealCapi":"50","CapiDate":null,"Or
2020-12-07 13:29:47
1511
原创 pip安装库提示超时-解决办法
重新安装python,把之前压缩版的卸载了,所以涉及第三方库也要重新安装。在cmd中使用pip install xxx命令安装第三方库时,报错提示超时。解决方法:更换下载源:清华:https://pypi.tuna.tsinghua.edu.cn/simple/阿里云:http://mirrors.aliyun.com/pypi/simple/豆瓣:http://pypi.douban.com/simple/如下载pandas:在后面加上 -i 加上网址 就可以了,而且速度超快。pip
2020-07-25 15:32:17
595
原创 压缩版python安装、pip包安装
最近为了图方便,所以选择了压缩包版本的python,下面记录一下安装过程,以及没有pip包的问题:一、安装压缩包版python1.下载python官网地址https://www.python.org/downloads/选择需要的版本,然后选择zip安装包(我当时下载的3.7.7版本)2.配置环境变量在path中新建变量,也就是安装包的解压路径:D:\software\Python3.7.73.测试打开cmd,输入python,出现如下,说明python安装成功。二、安装pip1.
2020-07-24 13:45:26
8497
3
原创 安装完MySQL,在命令行客户端输入密码闪退解决方法
问题:MySQL输入密码闪退MySQL安装成功,之前也都没出问题,而今天使用Navicat连接数据库显示“无法连接”,在 MySQL命令行客户端 输入密码发生闪退,在服务列表里也找不到MySQL服务。(在命令行输入“cmd”,出现命令窗口后,输入services.msc即可打开服务列表)尝试启动MySQL,在cmd窗口中输入net start mysql,提示服务无效。解决方法:找...
2019-06-28 17:14:02
3854
6
原创 一个数组赋值给另一个数组
把一个数组赋值给另一个数组把数组map的内容全部赋值给另一个数组a,当一个数组a改变的时候,map也发生了变化,该如何解决?var map = new Array("china","america","japan","canada");var a = map;a.unshift("aa");console.log(a);console.log(map);// a 结果[ "aa", ...
2019-05-09 11:51:50
32213
转载 Git命令
Git常用命令之前只用过SVN管理代码,所以也想来学习一下Git。找了一些资料来学习Git命令,和大家一起学习,也方便自己以后查找,yeah!本篇文章转发自https://www.cnblogs.com/chenwolong/p/GIT.html常用的有以下6个命令其中:专用名词译名Workspace工作区Index / Stage暂存区Reposi...
2019-05-03 13:27:51
226
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人