
Python
文章平均质量分 52
还是你最会玩Python
落难Coder
这里是我的笔记,而你恰好看到
展开
-
使用MinHash和LSH进行大规模文本数据去重
假设我们有一组包含简单中文文本的数据。我们首先对每条文本进行分词,然后计算每条文本的MinHash值,并使用LSH将这些值插入到一个可查询的结构中。最后,我们查询每个文本的MinHash,找出所有相似的文本。这种方法特别适合处理语义上相似的文本,而不仅仅是字面上完全相同的文本。在这个例子中:文档0和文档3非常相似,因为它们都描述了“今天天气好,适合出去玩”的情景,尽管用词略有不同。文档2和文档4虽然都提到了“明天有雨”,但用词和句式的不同可能使得它们的相似度低于阈值。原创 2024-08-08 14:14:56 · 935 阅读 · 0 评论 -
centos7 安装 python3.9
登陆账户(root账户或者拥有 sudo 权限的账户)使用 wget 下载 python3.9。使用 tar 解压压缩包。配置 python 安装。原创 2023-03-22 18:27:28 · 986 阅读 · 0 评论 -
条形图、柱状图绘制实战
条形图、柱状图绘制实战原创 2022-12-07 13:58:58 · 177 阅读 · 0 评论 -
Python之Matploylib简单使用教程
plt.locator_params(‘‘x’,nbins=20)只调整y轴:plt.locator_params(‘‘y’,nbins=20)有时候显示日期会重叠在一起,非常不友好,调用plt.gcf().autofmt_xdate(),将自动调整角度。格式如下: 作为开始和结束符,如\omega $,中间的将解析出公式中的符号。fill_beween填充函数交叉区域。传颜色参数,支持以下几种方式。fill填充函数区域。原创 2022-11-03 23:50:18 · 358 阅读 · 0 评论 -
Python实现PDF转为Word
Python实现PDF转为Word原创 2022-11-03 23:13:47 · 693 阅读 · 0 评论 -
使用python实现图像对比度增强
使用python实现图像对比度增强原创 2022-10-30 01:52:48 · 1648 阅读 · 0 评论 -
Python进行数字前置补零操作
python进行数字前置补零操作原创 2022-09-19 10:23:55 · 883 阅读 · 0 评论 -
Sklearn库中的数据集
scikit-learn是Python语言开发的机器学习库,一般简称为sklearn,目前算是通用机器学习算法库中实现得比较完善的库了。其完善之处不仅在于实现的算法多,还包括大量详尽的文档和示例。其文档写得通俗易懂,完全可以当成机器学习的教程来学习。原创 2022-08-20 21:09:05 · 4236 阅读 · 0 评论 -
使用cython加速代码运行
Cython是Python和C/C++之间的一个中间步骤。它允许你编写纯Python代码,并且只需要做一些小修改,然后将其直接翻译成C代码。你对Python代码所做的惟一调整就是向每个变量添加类型信息。x = 5这告诉Cython,我们的变量是浮点类型,就像我们在C中所做的一样。对于纯Python,变量的类型是动态确定的。Cython中类型的显式声明使转换为C成为可能,因为显式类型声明是必须的。...原创 2022-08-18 18:48:17 · 414 阅读 · 0 评论 -
即学即用的30个python常用代码
以下方法可检查给定的字符串是否为回文结构。该方法首先将字符串转换为小写,然后从中删除非字母数字字符。下面的方法可以检查给定列表中是否有重复的元素。它使用了 set() 属性,该属性将会从列表中删除重复的元素。你可以将 else 子句作为 try/except 块的一部分,如果没有抛出异常,则执行该子句。以下方法使用 fliter() 删除列表中的错误值(如:False, None, 0 和“”)以下方法将以字节为单位返回字符串长度。以下方法使用递归来展开潜在的深度列表。以下方法返回列表中出现的最常见元素。.原创 2022-08-18 18:39:32 · 15122 阅读 · 0 评论 -
初识Numpy
NumPy 是 Numerical Python 的简称,它是 Python 中的科学计算基本软件包。NumPy 为 Python 提供了大量数学库,使我们能够高效地进行数字计算。更多可点击Numpy官网查看。关于Numpy需要知道的几点:NumPy 数组在创建时有固定的大小,不同于Python列表(可以动态增长)。更改ndarray的大小将创建一个新的数组并删除原始数据。NumPy 数组中的元素都需要具有相同的数据类型,因此在存储器中将具有相同的大小。...原创 2022-08-03 19:09:30 · 160 阅读 · 0 评论 -
Python自动导入缺失的库
或者more导入失败问题,通常分为两种:一种是导入自己写的模块(即以 .py 为后缀的文件),另一种是导入三方库。本文主要讨论第二种情况。原创 2022-08-03 19:07:16 · 456 阅读 · 1 评论 -
Python查看大佬Github上全部项目的Star数量和统计
Python查看大佬Github上全部项目的Star数量和统计原创 2022-07-20 01:56:20 · 856 阅读 · 0 评论 -
更换pip源到国内镜像
可以在使用的时候在后面加上参数,指定源:永久修改Linux修改 (没有就创建一个), 内容如下:Windows直接在目录中创建一个目录,如:,新建文件,内容如下:原创 2022-06-09 20:17:02 · 207 阅读 · 0 评论 -
Python实现旋转描记器
旋转描记器是一种几何绘图玩具,可产生各种技术上称为下摆线和下摆线的数学轮盘曲线。它是由英国工程师Denys Fisher开发的,于1965年首次出售。该名称是1998年Hasbro 公司(Hasbro Inc.)的注册商标,此前该公司 收购了Denys Fisher公司。Spirograph品牌于2013年由Kahootz Toys在全球范围内重新推出其原始产品配置,旋描仪可用于绘制各种分形。对于数学部分,您可以参考Wiki:https://en.wikipedia.org/wiki/Spirograph#原创 2022-06-09 20:08:11 · 181 阅读 · 0 评论 -
Python实现生命的游戏
Python 的 Matplotlib 是最常用的图表绘制以及数据可视化库。我们对折线图、柱状图以及热力图都比较熟悉,但你知道用 Matplotlib 还能做简单的动画吗?下面就是用 Matplotlib 制作动画的例子。展示的是 John Conway 的 《The Game of Life》,这是一个 Metis(数据科学夏令营)中的编程挑战题目,同时给了我一个机会让我知道Matpltlib可以制作动图。看看结果的动图:这篇文章的重点还是主要放在 python 中如何用 Matploylib 制作动画。原创 2022-06-08 15:47:03 · 947 阅读 · 1 评论 -
【全网第一详细】Windows下编译使用GPU版本的DLib
因为要用上GPU所以提前准备好:将cuda/bin和cuda/lib/x64以及cuda/include添加到环境变量Path解压CUDNN然后把它对应文件夹中的文件添加到CUDA对应的文件夹目录下https://github.com/davisking/dlib/releases下载最新版本即可Windows下CMake安装教程管理员模式进入到文件夹下,输入:等待编译完成!之前我一直不知道怎么编译好使用,直到我看到这篇文章 ,里面作者详细说明了在Anaconda3中编译使用Dlib,经过我的实践确实可以原创 2022-06-07 11:08:02 · 785 阅读 · 0 评论 -
“念经”python设置
我们先运行以下看看效果:你一定很想知道这是如何实现的吧?如果你对 比较熟悉,就会知道,当你在使用 远程登陆 服务器的时候?会读取 文件加载一些环境变量。 你可以视其为一个 脚本,可以在这里写一些 代码达到你的定制化需求。而在 中,也有类似 的文件,这个文件一般情况下是不存在的。我们需要新建一个用户环境目录,这个目录比较长,不需要你死记硬背,使用 模块的方法就可以获取,然后使用 命令创建它。首先我们进入的,然后:获得目录后,在该目录下新建:里面写入:更骚气的操作:女朋友照片转化字符 ,原创 2022-06-07 11:06:19 · 136 阅读 · 0 评论 -
Python判断身份证是否输入正确
从1999年10月1日起,全国实行公民身份证号码制度,居民身份证编号由原15位升至18位:原创 2022-06-02 11:52:27 · 1839 阅读 · 0 评论 -
Python绘制云图
当我们想快速了解书籍、小说、电影剧本中的内容时,可以绘制 WordCloud 词云图,显示主要的关键词(高频词),可以非常直观地看到结果。一般的云图可以利用在线的云图制作工具就可以满足,例如:TAGUL 、图悦 、Tagxedo 、Tocloud 等。如果我们想要有一个好的云图展示,就需要进行 分词 ,比较好的分词工具有:Pullword 、jieba 等。现在,我们就利用 生成一个云图!首先我们先安装我们所需要的第三方库:测试内容为:原创 2022-06-02 11:51:31 · 5610 阅读 · 0 评论 -
Python第三方库之matplotlib使用基础教程
2. 添加文字-text设置坐标和文字即可3. 添加注释-annotatexy:为备注的坐标点xytext:备注文字的坐标(默认为xy的位置)arrowprops:在xy和xytext之间绘制一个箭头4. 设置坐标轴名称-xlabel/ylabel5. 添加图例-legend6.调整颜色-color传颜色参数,支持以下几种方式7.切换线条样式-marker8.显示数学公式-mathtext格式如下: 作为开始和结束符,如\omega $,中间的将解析出公式中的原创 2022-06-02 11:50:21 · 1092 阅读 · 0 评论 -
Python「剪藏」网页为 PDF
的第三方库 ,这个模块可以将网页、 文件以及字符串生成pdf文件。把我们想要的网页保存到本地PDF文件,再结合PDF神器(Adobe Acrobat Pro DC)高亮标记文章的重点内容,很舒服~下面介绍一下使用pdfkit保存网页、html文件为pdf文件的具体过程。使用pip安装 库:安装wkhtmltopdf.exe文件 是基于 的 封装,需要安装 。 是轻量级软件,非常很容易安装。下载地址:https://wkhtmltopdf.org/downloads.html去官网下载安装好之后,将安装目原创 2022-06-02 11:47:58 · 254 阅读 · 0 评论 -
Python代码加密方案总结(巨全面和详细)
由于 Python 的动态特性和开源特点,导致 Python 代码很难做到很好的加密。社区中的一些声音认为这样的限制是事实,应该通过法律手段而不是加密源码达到商业保护的目的;而还有一些声音则是不论如何都希望能有一种手段来加密。于是乎,人们想出了各种或加密、或混淆的方案,借此来达到保护源码的目的。常见的源码保护手段有如下几种:发行.pyc文件代码混淆使用py2exe使用Cython下面来简单说说这些方案。1.发行.pyc 文件生产.pyc文件:python -m comp原创 2022-05-18 22:22:43 · 4453 阅读 · 2 评论 -
Python生成迷宫
算法简介:生成一张网格,把网格里面的所有边都存进一个列表edgeList里面.从(0, 0)开始,做DFS。每次DFS的时候,随机地选择四周一个没有走过的格子,凿墙过去,把道路打通。凿墙的时候,把edgeList列表中相对应的那堵墙删除掉。将剩下的没有凿开过的墙画出来,就是一个完整的迷宫了。import sysimport matplotlib.pyplot as pltfrom random import randintWIDTH = 60HEIGHT = 40sys原创 2022-05-18 12:31:28 · 3638 阅读 · 1 评论 -
Python的63个内置函数的解释和实战
1 abs()绝对值或复数的模In [1]: abs(-6)Out[1]: 62 all() 接受一个迭代器,如果迭代器的所有元素都为真,那么返回True,否则返回FalseIn [2]: all([1,0,3,6])Out[2]: FalseIn [3]: all([1,2,3])Out[3]: True3 any()接受一个迭代器,如果迭代器里有一个元素为真,那么返回True,否则返回FalseIn [4]: any([0,0,0,[]])Out[4]: False原创 2022-05-18 12:29:54 · 204 阅读 · 0 评论 -
Python获取所有谷歌浏览器上保存的密码
使用谷歌浏览器都知道,非常人性化的一方面就是记住我们在某些网站登录的账号和密码,并且自动填写,那么我们将利用py获取谷歌浏览器上保存的所有账号和密码,对于此程序原身为黑客盗号软件,经过我的改写,它将不会这么邪恶。简易版代码# -*- coding: utf-8 -*-# Software : IDLE# version:Python 3.6.6import osimport shutilimport sqlite3import win32cryptdb_file_path = os.p原创 2022-05-18 12:16:01 · 746 阅读 · 0 评论