自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 《数据库索引设计与优化》译本查错(1)

今天在学习《数据库索引设计与优化》第十一章第198页的时候遇到一个问题,即参数的文字描述与实际不符。我看的是从网络上找到的译本,许多喜欢白嫖的朋友可能也会像我一样遇到这种问题。

2025-02-24 23:32:14 436

原创 使用sklearn训练语种识别模型

训练语种识别模型使用的是sklearn的MultinomialNB方法,MultinomialNB是一种基于贝叶斯定理的分类算法,特别适用于处理具有离散特征的分类问题,如文本分类中的单词计数。它属于朴素贝叶斯算法的一种,主要应用于高维度的特征空间,常见于文档分类、垃圾邮件识别等领域‌。识别结果与模型的内容和大小有关,结果不一定准确,仅供参考。

2025-01-10 16:07:02 243

原创 git使用

白色:git commit提交之后的文件变成白色。红色:修改、创建、删除过的文件都显示红色。绿色:git add添加了的文件显示绿色。

2024-12-30 16:27:58 391

原创 python langid识别一段字符串是哪国语言

在利用爬虫抓取亚马逊网站的数据时,有时会出现所抓页面的语言类型发生错误的情况(如抓取沙特站数据时想要英文页面,抓到的确是阿拉伯语页面)。在数据量大的时候人工排查这类异常情况是非常麻烦的,这时候就可以用到langid模块。但langid模块的识别结果并不完全正确,但是用作参考还是够用的。

2024-12-24 18:14:20 346

原创 JavaScript获取两个日期的天数差

利用绝对值差除以一天的时间(毫秒级)得到的就是两个日期的天数差。使用new Date(日期).getTime()函数将两个时间都转化为时间戳;计算两个时间戳的绝对值差;

2024-12-03 13:57:57 508

原创 SlickGrid复选框

SlickGrid复选框

2024-11-26 17:47:23 235

原创 SlickGrid点击/双击事件

SlickGrid点击/双击事件

2024-11-20 12:12:26 242

原创 Jquery前端loading加载动画

Jquery前端loading加载动画

2024-11-19 10:50:18 256

原创 安装python时Install launcher for all users灰色无法选中解决方法

解决办法:可能是上一次卸载python没卸载干净,在控制面板中卸载,把Python Launcher卸载掉。卸载完后,就可以正常安装了。

2024-10-30 11:31:28 1657 1

原创 SlickGrid简单使用——一个高性能的datagrid库

SlickGrid是一个极速的JavaScript网格/电子表格库,提供现代化的数据处理和展示功能,在大数据量展示方面表现极好。与easyui和layui的datagrid相比,SlickGrid在大数据量展示方面具有极高的流畅性。本人实测,使用SlickGrid一页存放790000条数据时性能表现极佳。

2024-10-24 11:33:03 694

原创 将jinjia2后端传到前端的字典数据转化为json

将jinjia2后端传到前端的字典数据转化为json

2024-10-23 18:10:27 492

原创 python ftplib下载文件(断点续传)

ftplib下载文件时因网络问题(或其他问题)导致下载失败,在断点处继续下载。

2024-09-03 15:28:34 417

原创 python ftplib上传文件(断点续传)

ftplib上传文件时因网络问题(或其他问题)导致上传失败,在断点处继续上传。

2024-09-02 16:25:00 296

原创 pymongo修改多条数据仅提交一次

使用pymongo的UpdateOne方法来实现。

2024-08-28 17:04:38 216

原创 python字典列表排序

排序代码(根据字段zxs排序)

2024-08-23 16:50:58 138

原创 MongoDB配置文件及创建root用户

【代码】MongoDB创建root用户。

2024-08-21 14:20:49 246

原创 python报错:SyntaxError: Non-UTF-8 code starting with ‘\xe8‘ in file解决方法

python报错:SyntaxError: Non-UTF-8 code starting with '\xe8' in file提示编码不能正确解码。在文件开头位置声明编码格式即可解决。

2024-07-22 17:09:04 994

原创 python ftplib大文件分片上传(解决上传时间过长导致ftp断连问题)

python ftplib大文件上传时间过长导致ftp断连问题解决方案

2024-07-16 18:13:10 515

原创 JavaScript生成Excel文件

【代码】JavaScript导出Excel文件(手搓代码版)

2024-07-11 17:38:25 1012

原创 python生成PDF文件(画线/插图/写文字)

【代码】python生成PDF文件。

2024-06-26 12:13:47 597

原创 python matplotlib画折线图

【代码】python matplotlib画折线图。

2024-06-21 15:12:55 186

原创 python生成/读取Excel文件

安装模块。

2024-06-21 14:25:17 469

原创 URL符号转义问题

符号“+”在url中会被认为是空格,因此需要使用“%2B”来替代。

2024-06-20 12:31:38 443

原创 jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框

jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框

2024-05-11 16:34:19 381 1

原创 python csv模块简单使用

python csv模块简单使用

2024-05-11 14:00:43 121 1

原创 python获取chrome里的cookies

这段代码只能在Windows系统运行。

2024-05-10 14:34:14 926 2

原创 python selenium常用操作

找到对应系统及chrome版本号的驱动下载链接,例如我用的win32系统115.0.5763.x版本的chrome​。

2024-05-10 14:17:19 291 1

原创 MongoDB查询、索引、修改、删除字段

【代码】MongoDB索引。

2024-05-08 17:47:51 514

原创 python提取PDF文档文字/转图片/分割、合并PDF文档

python提取PDF文档文字/转图片/分割、合并PDF文档

2024-05-08 11:33:07 583

原创 python时间戳与时间字符串的转化

【代码】python时间戳与时间字符串的转化。

2024-05-07 14:35:18 1556

原创 python ftplib模块常用方法

创建一个简单的ftp客户端。

2024-05-07 13:39:40 279

原创 jquery-easyui+flask单/多文件上传

在文件框的标签加上multiple,使得上传文件时可以多选文件,再加上id,方便JavaScript获取文件。后端request.files接收到的是一个Dict类型的变量,遍历这个变量就可以挨个获取上传的文件。经过多方查找资料并借鉴其他框架的多文件上传,成功实现了jquery多文件上传的功能。先获取文件框里待上传的所有文件,创建文件类型变量,并遍历拼接文件型变量。

2024-04-30 17:35:01 672 2

原创 虚拟机Linux Hadoop部署

参照B站黑马程序员2023大数据课程Hadoop部署过程课程,分享我的成功部署经历,由于所用的虚拟机和软件与课程上的不一样,所以部署过程也有些许不同,但最终还是成功部署

2023-07-26 17:21:49 532 1

原创 双击.bat文件,弹出提示:Windows找不到文件,请确定文件名是否正确后,再试一次

ComSpec 环境变量出现异常

2023-04-24 15:17:30 7647 9

原创 python设计模式:工厂模式

在面向对象编程中,术语“工厂”表示一个负责创建其他类型对象的类。通常情况下,作为一个工厂的类有一个对象以及与它关联的多个方法。客户端使用某些参数调用此方法,之后,工厂会据此创建所需类型的对象,然后将它们返回给客户端。

2023-04-06 15:17:29 3599

原创 当Selenium遇上referer防爬时怎么处理

使用selenium解决referer防爬的方案

2023-03-17 18:53:28 1701 1

原创 python设计模式:单例模式

单例模式是一种经过时间考验的成熟方法,能够在不带来太多缺陷的情况下提供全局访问点。

2023-03-02 18:57:55 230

原创 Python协程

协程是单线程下的并发,又称微线程、纤程。协程是用户程序自己控制调度的,在计算机层面并没有协程,而是程序员根据代码实现的CPU的切换。

2023-02-23 16:49:01 240

原创 MySQL从文件导入数据:LOAD DATA INFILE简单使用

LOAD DATA INFILE语句用于高速的从文本文件读取行,并装入一个表中。文件名必须为一个文字字符串。

2023-02-21 15:48:16 3695

原创 Celery简单使用

Celery是基于Python开发的分布式任务调度工具,简单、灵活可靠,专注于实时任务处理。

2023-02-13 13:06:07 953 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除