- 博客(40)
- 收藏
- 关注
原创 《数据库索引设计与优化》译本查错(1)
今天在学习《数据库索引设计与优化》第十一章第198页的时候遇到一个问题,即参数的文字描述与实际不符。我看的是从网络上找到的译本,许多喜欢白嫖的朋友可能也会像我一样遇到这种问题。
2025-02-24 23:32:14
436
原创 使用sklearn训练语种识别模型
训练语种识别模型使用的是sklearn的MultinomialNB方法,MultinomialNB是一种基于贝叶斯定理的分类算法,特别适用于处理具有离散特征的分类问题,如文本分类中的单词计数。它属于朴素贝叶斯算法的一种,主要应用于高维度的特征空间,常见于文档分类、垃圾邮件识别等领域。识别结果与模型的内容和大小有关,结果不一定准确,仅供参考。
2025-01-10 16:07:02
243
原创 git使用
白色:git commit提交之后的文件变成白色。红色:修改、创建、删除过的文件都显示红色。绿色:git add添加了的文件显示绿色。
2024-12-30 16:27:58
391
原创 python langid识别一段字符串是哪国语言
在利用爬虫抓取亚马逊网站的数据时,有时会出现所抓页面的语言类型发生错误的情况(如抓取沙特站数据时想要英文页面,抓到的确是阿拉伯语页面)。在数据量大的时候人工排查这类异常情况是非常麻烦的,这时候就可以用到langid模块。但langid模块的识别结果并不完全正确,但是用作参考还是够用的。
2024-12-24 18:14:20
346
原创 JavaScript获取两个日期的天数差
利用绝对值差除以一天的时间(毫秒级)得到的就是两个日期的天数差。使用new Date(日期).getTime()函数将两个时间都转化为时间戳;计算两个时间戳的绝对值差;
2024-12-03 13:57:57
508
原创 安装python时Install launcher for all users灰色无法选中解决方法
解决办法:可能是上一次卸载python没卸载干净,在控制面板中卸载,把Python Launcher卸载掉。卸载完后,就可以正常安装了。
2024-10-30 11:31:28
1657
1
原创 SlickGrid简单使用——一个高性能的datagrid库
SlickGrid是一个极速的JavaScript网格/电子表格库,提供现代化的数据处理和展示功能,在大数据量展示方面表现极好。与easyui和layui的datagrid相比,SlickGrid在大数据量展示方面具有极高的流畅性。本人实测,使用SlickGrid一页存放790000条数据时性能表现极佳。
2024-10-24 11:33:03
694
原创 python报错:SyntaxError: Non-UTF-8 code starting with ‘\xe8‘ in file解决方法
python报错:SyntaxError: Non-UTF-8 code starting with '\xe8' in file提示编码不能正确解码。在文件开头位置声明编码格式即可解决。
2024-07-22 17:09:04
994
原创 python ftplib大文件分片上传(解决上传时间过长导致ftp断连问题)
python ftplib大文件上传时间过长导致ftp断连问题解决方案
2024-07-16 18:13:10
515
原创 jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框
jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框
2024-05-11 16:34:19
381
1
原创 python selenium常用操作
找到对应系统及chrome版本号的驱动下载链接,例如我用的win32系统115.0.5763.x版本的chrome。
2024-05-10 14:17:19
291
1
原创 jquery-easyui+flask单/多文件上传
在文件框的标签加上multiple,使得上传文件时可以多选文件,再加上id,方便JavaScript获取文件。后端request.files接收到的是一个Dict类型的变量,遍历这个变量就可以挨个获取上传的文件。经过多方查找资料并借鉴其他框架的多文件上传,成功实现了jquery多文件上传的功能。先获取文件框里待上传的所有文件,创建文件类型变量,并遍历拼接文件型变量。
2024-04-30 17:35:01
672
2
原创 虚拟机Linux Hadoop部署
参照B站黑马程序员2023大数据课程Hadoop部署过程课程,分享我的成功部署经历,由于所用的虚拟机和软件与课程上的不一样,所以部署过程也有些许不同,但最终还是成功部署
2023-07-26 17:21:49
532
1
原创 python设计模式:工厂模式
在面向对象编程中,术语“工厂”表示一个负责创建其他类型对象的类。通常情况下,作为一个工厂的类有一个对象以及与它关联的多个方法。客户端使用某些参数调用此方法,之后,工厂会据此创建所需类型的对象,然后将它们返回给客户端。
2023-04-06 15:17:29
3599
原创 Python协程
协程是单线程下的并发,又称微线程、纤程。协程是用户程序自己控制调度的,在计算机层面并没有协程,而是程序员根据代码实现的CPU的切换。
2023-02-23 16:49:01
240
原创 MySQL从文件导入数据:LOAD DATA INFILE简单使用
LOAD DATA INFILE语句用于高速的从文本文件读取行,并装入一个表中。文件名必须为一个文字字符串。
2023-02-21 15:48:16
3695
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人