赶在日落之前-优快云博客

原创勇气--------对于成人更难能可贵

小时候一直不懂为什么数码宝贝的徽章第一位是勇气？直到现在才切身体会，人一定不能没了勇气，哪怕再难再苦也要去面对，也许最后你还是没能解决，还是失败，但至少你这次没有选择逃避，这就是勇气的萌芽！多少人身处安逸，时常抱怨，却还是迟迟迈不出改变的那一步，他们时而哀叹时而彷徨，不敢放弃眼前苟且的生活，因为他们害怕失去明天，他们常常担忧错过了这份生活，会不会变成更坏的生活，今日很苦，明天更苦，但后天很美好...

2018-08-14 20:58:56 632 3

原创雪球网评论抓取

抓取雪球网评论数据

2025-09-01 13:36:02 332 1

原创凡事都有可能，永远别说永远

永远学会看自己有什么，别人再好的成就也装点不了你，再有钱的亲戚人家也不会白白给你钱，打铁还需自身硬，杜渐防萌，慎之在始，我们应该加强自身，只有自己强大那才叫真正的强大，追风赶月莫停留，平芜尽处是春山。最烦那些拿别人的成就来装饰自己的人，总会说我的朋友怎么样，我的亲戚怎么样，人家自己努力达到的，跟你有什么关系，你在这又唱又跳的，看看自己落魄的模样也不害臊，还好意思说别人的成就来吹嘘自己。

2024-11-13 10:08:53 235

原创批量修改文件目录下的所有文件重命名

文件目录下的所有文件分类到不同文件夹里面。

2024-03-04 16:13:53 291

原创遇见HTML 实体编码文本内容并解密

根据实体编码表，"其" 对应的字符是 "位"，"持" 对应的字符是 "元"，"有" 对应的字符是 "所"，"公" 对应的字符是 "佄"，"司" 对应的字符是 "构"，"股" 对应的字符是 "鹅"，"票" 对应的字符是 "悸"。HTML 实体编码过的文本。HTML 实体编码是一种将特殊字符转换为实体编码（entity encoding）的方法，通常用于在 HTML 页面中显示特殊字符而不会被解释为 HTML 标记。综合起来，这串编码代表的文字是 "位元所佄构鹅悸"。

2024-03-01 15:57:09 1509

原创实现div 下面的input的全选操作

【代码】实现div 下面的input的全选操作。

2023-10-18 16:59:18 333

原创 python 连接ssh

【代码】python 连接ssh。

2023-09-11 17:28:12 510

原创数据库上亿大数据去重

快速对数据实现大数据去重

2023-08-07 15:44:12 479

原创快速实现txt文档内字典的单引号替换为双引号

【代码】快速实现txt文档内字典的单引号替换为双引号。

2023-04-11 10:50:02 419

原创 mysql 字段索引的相关常识

mysql基础

2023-01-29 17:15:20 371

原创解决c盘满了怎么清理垃圾而不误删的问题

电脑常见问题

2022-06-16 11:09:55 1686 1

原创 python pandas对某列数据根据条件替换相应内容

有两种实现方式：1匿名函数df['address'] = df['address'].apply(lambda row: row if row.endswith("法院") else row+"法院")print(df['address'])2where条件df["address"] = np.where(df["address"].str.endswith("法院"), df["address"],df["address"]+"法院")print(df['address'])

2022-03-01 14:32:19 4181

原创越想越气，博客提问分配酬金是不是有问题

特么最烦那些提问上链接，一句话不说，难道天生是哑巴吗，粘贴过来的还是别人的，何况明明一个有效回答都没有，还分配给他们，那些垃圾菜鸡，不知道就瞎胡说，答非所问，气死我了，我愤怒，我抗议，这不公平的机制...

2022-02-23 11:04:30 282

原创关于大批量数据快速更新的代码分享

由于某些场景需求需要涉及到大批量数据更新，于是我在问答开始付费征求秒级处理数据的思路，但是一无所获，于是我自己便写了一版效率不是很高但是勉勉强强还能使用 for i in range(0,len(data),10000): #分批次预处理数据,一次一万条 solve_data =data.iloc[i:i+10000,:] # print(solve_data) try: id_list = tuple(so

2021-12-15 14:16:00 475

原创 python 读取pdf文件内容

from pdfminer.layout import LAParams, LTTextBoxfrom pdfminer.pdfpage import PDFPagefrom pdfminer.pdfinterp import PDFResourceManagerfrom pdfminer.pdfinterp import PDFPageInterpreterfrom pdfminer.converter import PDFPageAggregatorfrom pdfminer.convert.

2021-11-22 09:57:27 1300

原创关于不同数据用pandas来比较，并生成结果

import jsonimport pandas as pdimport numpy as npimport requestsfrom lxml import etreedef resolveJson(path): file = open(path, "rb") fileJson = json.load(file) data_list = [] for i in fileJson: first_name = i['name'] .

2021-11-17 15:23:52 1052

原创 DeprecationWarning: find_element_by_* commands are deprecated. Please use find_element()解决

老版本，已经被弃用，很快就失效了 driver.find_element_by_xpath("//input[@id='keyword']")需要改成下面的这样格式driver.find_element(By.XPATH, "//input[@id='keyword']")

2021-11-15 15:00:24 5240

原创 mysql去重，根据唯一字段来去重保留任一条

DELETE FROM `gov_departmental_documents` WHERE title IN (SELECT a.title FROM (SELECT title FROM gov_departmental_documents GROUP BY title HAVING COUNT(title) > 1) AS a)AND id NOT IN (SELECT b.aa FROM (SELECT min(id) AS aa FROM gov_depart.

2021-07-05 17:24:06 471

原创 gitlab建立分支并上传本地项目

1git branch 分支名2git checkout 分支名3git add .4git commit -m "提交的信息"5git remote add origin 远程仓库地址6git push -u origin 分支名

2021-05-25 15:14:34 461

原创 python 正则匹配字符串中括号[]中内容

import restring = '已在[东营港]起航'data = re.findall("\[(.*?)\]",string, re.I|re.M)[0]print(data)

2021-05-18 11:13:47 5511

原创 Python读取mat文件并转换为dataframe格式数据

from scipy.io import loadmatimport pandas as pdfilename = r'D:\python_project_lzz\a1405.mat'data = loadmat(filename)dfdata = pd.DataFrame(data=data['data'][1:],columns=['date','time','open','high','low','close','volume','amount','position']).astype(s.

2021-04-20 14:28:44 2347

原创批量修改文件名称

import osfiles = os.listdir("D:/pdf/")#获取当前目录下的文件for filename in files: os.rename(filename, filename+'.pdf')#修改

2021-04-02 17:27:40 122

原创运行scrapy pipelines ModuleNotFoundError解决办法

说明在该前环境并没有安装这第三个包在当前环境重新安装在Terminal 命令框输入以下指令pip3 install 第三方包查看相关包的版本号scrapy version -v

2021-03-05 10:49:13 332 1

原创 Python 打印输出当天每一秒时刻具体到毫秒的函数

from datetime import datetime,timedeltaimport timestartdate = '09:00:00.499'end = '15:23:20'i = 0.5while True: date = (datetime.strptime(startdate, '%H:%M:%S.%f') + timedelta(seconds=i)).strftime('%H:%M:%S.%f') end_time = date.replace(':','').

2021-01-29 14:05:43 947

原创解决2143replace或者3125replace等中间跳转页面的问题

这是因为给你篡改你网页书签的后缀名导致的，如下图：这是由于在下载一些病毒软件给你篡改书签导致的，具体详细解释看这个：https://www.zhihu.com/question/263958523

2020-11-24 14:58:57 3222

原创 Python爬虫：中国结算，关于新开股票账户数等参数数据的爬取

1数据来源：http://www.chinaclear.cn/zdjs/tjyb1/center_tjbg.shtml2获取内容：09到至今的主要指标概览数据内容3可参考代码，直接用就行import requestsimport reimport datetimedef get_month_range(start_day,end_day): months = (end_day.year - start_day.year)*12 + end_day.month - start_

2020-11-20 10:09:12 994

原创 Python Qt Designer功能详细介绍

一，图表对应介绍：二，详细介绍2.1 Layouts 布局2.2 Vertical Layout 纵向布局2.3 Horizontal Layout 横向布局2.4 Grid Layout 栅格布局2.5 Form Layout ...

2020-11-12 11:22:15 3599 1

原创当你的才华还撑不起你的野心时,那你就应该静下心来学习

人生苦短，在这物质恒流的社会，我们保持初心更是不易，人人都想发大财，但是满脑子天天空想是毫无意义的，所以必须脚踏实地的丰富自己，比方说提高自己的学历，懂得人情世故把情商提高提高，扩大自己的交际圈，多出去外面走走，开阔下自己的视野。当你的才华还撑不起你的野心时,那你就应该静下心来学习，不断提高编程技术是每个程序员必做之事，如果没有一个好学的心，迟早被这个社会残酷淘汰。加油，老骥伏枥志在千里，年龄不是问题，好好学习，追逐梦想！...

2020-10-14 11:12:36 703 1

原创 Python Sep 14, 2020 2:37:48 PM格式转换为正常的时间格式

import timedate = 'Sep 22, 2020 1:52:24 PM'.replace(' AM','').replace(' PM','')newdate = time.strptime(date, '%b %d, %Y %H:%M:%S')# 转换为时间戳timestamp = int(time.mktime(newdate))print(timestamp)# 1600710744# 转换为正常时间time2 = time.strftime("%Y-%m-%d", t.

2020-09-30 15:31:15 1528

原创国内pip源

豆瓣(douban) -i http://pypi.douban.com/simple/清华大学 -i https://pypi.tuna.tsinghua.edu.cn/simple/阿里云 -i http://mirrors.aliyun.com/pypi/simple/中国科技大学 -i https://pypi.mirrors.ustc.edu.cn/simple...

2020-09-23 16:43:52 860

原创 pandas 将多个DataFrame.to_excel写入不同的Sheet

话不多说直接上代码：path = r"C:\Users\Administrator\Desktop"if not os.path.exists(path): os.mkdir(path)path1 = path + r'\test.xlsx'book = xlrd.open_workbook(r'C:\Users\Administrator\Desktop\多个sheet的测试数据表.xlsx')with pd.ExcelWriter(path1) as writer:..

2020-09-23 14:13:26 1727

原创 pandas处理时间的方式

data1['date'] = pd.to_datetime(data1['date'], format='%Y-%m-%d') data1['date'] = data1['date'].apply(lambda x: x.strftime('%Y%m%d'))

2020-09-22 16:57:54 308

原创两个dataframe比较，取两个不共有的数据

import pandas as pdtable1 = r'C:\Users\Administrator\Desktop\result2.xls'data1 = pd.read_excel(table1, sheet_name = 2)df1 = pd.DataFrame(data1.iloc[:,[0,1,2,3,4,5]], columns=['company','city','strategy','fund_name','manager_name','fund_id'])table2 = .

2020-09-21 09:30:37 2432

TA关注的人

python学习路线.zip

socket.io.js

openbilibili-go-common-master.zip

101_formulaic_factor.rar

101_formulaic_1-40_factor.py

关于郑商所服务 > 易盛商品指数 > 指数行情的爬虫

如何进行python的API接口开发

python 读取数据库上亿级数据如何去重呢

python批量更新mysql,还要注意避免溢出，处理千万级别的数据

多线程爬虫，url唯一，但是传的data不一样，如何来实现

python dataframe如何按行数分组

国家企业信用信息系统，有没有可以爬到详情页的具体内容