
Python
文章平均质量分 56
Python开发笔记。
智绘山河
硕士,AI算法工程师。曾获华为杯中国研究生数学建模竞赛一等奖,省优秀毕业生等。写过几篇中文核心,发过几篇国际会议,还有几个授权专利。喜欢搞搞代码,写写博客,没事还会搞搞LaTeX。愿景:用数学和代码构建智能系统,用逻辑创造价值。
展开
-
【Python】CSV,TSV语料读取的简单操作——内建包csv的使用
总的来说,使用csv内建包,无论数据写入还是数据读取都比较简洁方便,定制化也比较容易,可以根据自己实际的工程需要进行定制化开发。原创 2022-12-17 09:50:57 · 1492 阅读 · 0 评论 -
【Python】标注库中os.path与pathlib中Path的比较
os.path主要是以方法的形式存在,而pathlib中的Path则是以对象形式的存在,如果对地址操作的比较多,需要相关的方法以及对应的属性时,使用Path来创建一个地址对应会更加方便。这里先占个坑,网上有多介绍这个两个包的内容,下载参考文献罗列下来:使用的时候再来直接查就完事了,有时间再将常用的方法汇总过来。原创 2022-12-03 23:19:25 · 604 阅读 · 0 评论 -
【Python】将文件夹中文件按时间排序输出及os.path使用汇总
通常使用获取的文件list是按照文件名进行排序的,但有时需求是按照文件创建时间或修改时间后排序的结果。依然使用的系统自带的功能包。在使用之前我们需要了解几个功能(参考:Python os.path() 模块):在相关使用中,我们可以看到有几个关于获取文件时间的函数:有了这几个函数那么就好办了,以获取文件夹下按照创建时间排序后的文件列表实现如下:...原创 2022-07-09 15:37:32 · 7894 阅读 · 2 评论 -
【python】*args、**kwargs传参使用总结
随着应对业务的复杂度不断增加,合适的传参方法能够为我们在程序编写中提高很多便利。现在就总结一下python中 * args 和 ** kwargs的使用方式。通常函数或方法的参数个数是固定的,有些参数也可以设定默认值。在有默认值时可以不用传入对应的参数,并且如果不想按照顺序传入参数可以使用参数名来指定对应的参数,一旦开始指定对应的参数,从输入的这个参数开始以后的传入的参数都需要使用参数名的方式传参。例如:* args 和 ** kwargs 则是参数的个数不定的。*args 针对的是顺序类型的不定长参数,原创 2022-06-17 00:15:35 · 1262 阅读 · 0 评论 -
【Python】清空指定文件夹下所有文件及文件夹删除-shutil
编程常用技巧——清空指定文件夹下所有文件及文件夹删除背景: 删除一个文件夹时,通常的情况是待删除的文件夹里全是文件,那么对于这些文件一个循环就可以删除了(删除文件和删除文件夹的方式不一样哦),但是有时一个待删除文件夹中还有文件夹,那么删除的方法就是递归地去做一件事了。对于Python来说,当然已经有了相关的python自带的包去解决这个问题了,就是python的包。这个包的功能比较多,感兴趣的话可以去官网查看一下官方文档:https://docs.python.org/zh-cn/3/library/shu原创 2022-06-16 23:44:50 · 2599 阅读 · 0 评论 -
【Python】Python调用Java jar包方式 ——Jpype使用
有些时候,项目中已经有现场功能的包,但是相关的包使用Java开发的。为了能够减少Java转Python的时间,我们可以选择用Python调用Java。Python是比较著名的胶水语言,他的特性就这么地显现出来了。本文就以Java使用Jieba分词构建一个jar包,供Python调用来做一个demo。当然为了能够使用Python调用Jar当然少不了这个“胶水”,本文使用的是Jpype。Github地址:https://github.com/jpype-project/jpype。安装方式:.除此之外,因为需要原创 2022-06-09 23:05:10 · 5079 阅读 · 4 评论 -
【Transformers】BertModel模块的输入与输出
背景通常我们使用bert进行模型fine-tune时,大多是使用Transformer这个包,官方地址:https://huggingface.co/. 如果想使用Bert获取任务对应的动态词向量,那么这时我们就需要了解Bert模型需要的输入与输出了。如果对bert模型不了解的可以看看我之前的文章:【NLP】BERT(BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding)阅读与总结.BertMod原创 2022-05-20 23:16:56 · 22004 阅读 · 4 评论 -
【Pytorch】取反操作符~在Pytorch和python中使用的比较
python中的取反操作在python中取反操作符~是对数字的二进制位进行取反,然后返回取反结果对应的十进制数字。这个可以参考:Python3运算符使用案例如下:num = 60# 查看二进制print(num, bin(num)) # 60 0b111100num_ = ~num # -(x + 1) print(num_, bin(num_)) # -61 -0b111101细心的会发现,经过~处理后的结果并不是对应位置为相反关系。这就需要了解计算机是如何存储负数的了,负数通常是原创 2022-05-03 15:51:09 · 4912 阅读 · 0 评论 -
【Python】matplotlab——双坐标轴数据绘制案例
有时我们需要将两种数据展示在一张图上进行比较,并且这两种数据中有一组相同,我们可以考虑使用双坐标轴去绘制。下面的案例就是将正弦、余弦函数绘制在一起的案例。案例代码如下:import matplotlib.pyplot as pltimport numpy as npimport timedef plot_double_axis(): figure = plt.figure(figsize=(20, 8), dpi=300) ax_sin = figure.add_subplot原创 2022-04-05 20:25:13 · 3198 阅读 · 0 评论 -
【Python】Python 字符串前面加u,r,b,f的使用与含义总结
背景在python程序中,有时我们会看到一些带有一定前缀的字符串,例如字符中有u,r,f,b等等。这些写法又代表什么意思,有什么作用呢?下面总结一下当前遇到的一些情况进行总结。字符串前加u例如:u"这是我测试的中文字符串"作用:后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。字符串前加r例:r"\n\t” 表示一个普通生字符串 \n\t,而不表示换行和tab键了,或者也可以理解为raw。作用:去掉反斜杠的转移机制。(原创 2021-10-22 18:55:22 · 336 阅读 · 0 评论 -
【Python】从指定范围中获取n个不同的数
如题,这个问题经常出现在我们的开发中,倒也不难,记录如下:使用python自带的random函数即可,使用案例如下:原创 2021-03-17 18:39:32 · 1479 阅读 · 2 评论 -
【Python】编程代码书写规范!
程序不仅仅是给机器看的,自己在回顾的时候也会查看。如果在团队开发中,规范的编程习惯以及优良的注释会大大地提高团队的开发效率。现在来看看Python中有哪些编程规范。1 编码无特殊情况,建议Python脚本程序一律使用 UTF-8 编码,并且在文件头部必须加入#-*-coding:utf-8-*-标识,声明文件编码方式,程序文件编码要和声明编码保持一致。2 代码格式缩进: 统一使用 4 个空...原创 2020-03-20 20:00:20 · 1625 阅读 · 0 评论 -
如何使用python进行常规方程求解(Sympy or Scipy)(非线性方程组,一元二次方程,多元一次方程,因式分解等)
前言在科学计算中,我们经常会遇到数值计算,可能遇到高数,线性代数等,在实际的解题中可能会比较麻烦,可能还会出错,这里就对于python在科学计算中对线性方程组,做一简单介绍。在使用python进行线性方程组求解的时候,需要您去安装相应的程序包,scipy或者sympy,其官方文档分别为https://www.scipy.org/、https://docs.sympy.org/latest/in...原创 2018-10-09 23:05:34 · 20109 阅读 · 0 评论 -
wxpython 下拉列表的实现
0 环境准备wxPython坏境的安装(wxPython当前也支持Python3.X版本),在已经配置好的python下,在dos中:pip install wxpython即可,本程序是在win10系统环境下实现。1 代码详解import wx#自定义一个窗口类MyFrameclass MyFrame(wx.Frame): def __init__(self):...原创 2018-06-20 11:12:57 · 11129 阅读 · 0 评论 -
wxPython listBox的使用
0 环境准备wxPython坏境的安装(wxPython当前也支持Python3.X版本),在已经配置好的python下,在dos中:pip install wxpython即可,本程序是在win10系统环境下实现。1 代码详解import wx#自定义一个窗口类MyFrameclass MyFrame(wx.Frame): def __init__(self):...原创 2018-06-20 10:50:00 · 6615 阅读 · 2 评论 -
wxpython分割窗口的实现
0 环境准备wxPython坏境的安装(wxPython当前也支持Python3.X版本),在已经配置好的python下,在dos中:pip install wxpython即可,本程序是在win10系统环境下实现。1 代码详解#分割窗口import wx#自定义一个窗口类MyFrameclass MyFrame(wx.Frame): def __init__(s...原创 2018-06-20 10:25:26 · 4351 阅读 · 0 评论 -
wxpython菜单的创建
0 环境准备wxPython坏境的安装(wxPython当前也支持Python3.X版本),在已经配置好的python下,在dos中:pip install wxpython即可,本程序是在win10系统环境下实现。1 代码详解#导包import wx#自定义一个窗口类MyFrameclass MyFrame(wx.Frame): def __init__(sel...原创 2018-06-20 10:12:14 · 1907 阅读 · 0 评论 -
wxPython的gridSizer布局
0 环境准备wxPython坏境的安装(wxPython当前也支持Python3.X版本),在已经配置好的python下,在dos中:pip install wxpython即可,本程序是在win10系统环境下实现,如图: 1 代码详解import wx#自定义一个窗口类MyFrameclass MyFrame(wx.Frame): def __init__(se...原创 2018-06-20 09:51:32 · 6000 阅读 · 2 评论 -
【Python】如何使用python将多个png图片转为gif
前言最近遇到一个问题是,画了一个过程的图,为了更生动地展示出来,于是就想把这几张图合成一个gif图片,这样起来应该是不错的,于是在网上搜索了一些关于python如何将一些png图片转为gif的程序,自己实现更改如下。环境准备系统:win10python版本:3.6所需安装工具包:imageio (pip install imageio 即可)程序实现import imageioi...原创 2019-01-27 17:35:08 · 6174 阅读 · 0 评论 -
基于python中jieba包的中文分词中详细使用(二)
基于python中jieba包的中文分词中详细使用(二)01.前言02.关键词提取02.01基于TF-IDF算法的关键词提取02.02词性标注02.03并行分词02.04Tokenize:返回词语在原文的起止位置02.05ChineseAnalyzer for Whoosh 搜索引擎03.延迟加载04.其他词典写在最后基于python中jieba包的中文分词...原创 2018-05-07 15:13:13 · 22611 阅读 · 0 评论 -
pandas 中Series的:数据定义,访问,追加,切片,删除
本文测试使用Pandas使用的是Spyder,python3.6版本,已经安装好pandas包。序列:Series 用于存储一行或者一列的数据,以及与之相关的索引集合(类似于列表,但是有索引)数据定义:#序列的导入from pandas import Series#定义,可以混合定义x=Series(['a',True,1],index=['first','second','...原创 2018-09-08 21:21:38 · 44298 阅读 · 0 评论 -
python使用bat批处理简单方式(latex编译文件,dvipng 将dvi文件转为png)
python使用bat简单方式测试环境: 已经写好的批处理文件:@echo offpushd C:\Users\JackPi\Desktop\Task\wxUI607\texlatex temp.texdvipng -png temp.dvi解释: 第一行:不显示执行代码 第二行:进入文件夹C:\Users\JackPi\Desktop\Task\wxUI607\tex中 ...原创 2018-06-07 09:52:58 · 1961 阅读 · 0 评论 -
基于python中jieba包的中文分词中详细使用(一)
基于python中jieba包的中文分词中详细使用(一)01.前言02.jieba的介绍02.1 What02.2特点02.3安装与使用02.4涉及到的算法03.主要功能03.01分词03.02添加自定义词典03.02调整词典04.结束语基于python中jieba包的中文分词中详细使用(一)01.前言之前的文章中也是用过一些jieba...原创 2018-05-06 12:43:21 · 73761 阅读 · 11 评论 -
使用java调用python代码
1.为什么用java调用python2.本程序环境要求3.程序书写3.1.java基本代码书写4.程序结果5.总结1.为什么用java调用pythonjava在web程序具有很大的优势,然而在科学计算,机器学习等领域中不如python,使用java调用python就是为了能够使得一个问题能够更好的解决。2.本程序环境要求java开发环境:eclipse ...原创 2018-03-21 13:22:42 · 5539 阅读 · 4 评论 -
基于python的词云(英文内容)生成
基于python的词云生成(一)1.背景 前段时间网络中出现很多关于很多文字组成的图片,生成的图片看起来还是挺有意思,这里使用python做出词云图片。其中需要解释的是:词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。;2.本博客主要目标 本篇博客主要介绍p...原创 2018-03-13 08:45:29 · 16275 阅读 · 0 评论 -
基于python的词云生成-中文词云(指定词云形状)
基于python的词云生成(二)1.简介 本文是在基于python的词云生成(一)的基础上,进一步对云词进行编写,本文还使用了jieba分词对中文进行分词处理,以做出更好的效果。 jieba分词包(https://pypi.python.org/pypi/jieba/):在自然语言处理过程中,为了能更好地处理句子,往往需要把句子拆开分成一个一个的词语,这样能更好的分析句子的...原创 2018-03-14 19:12:28 · 11685 阅读 · 6 评论 -
Python random() 函数使用方法
Python random() 函数使用方法在使用random()的时候需要先导入函数包:import random 使用介绍:import randomresult1=random.random() #随机生成一个浮点数[0,1)result2=random.randint(1, 10) #产生1-10的一个随机整数result3=random.uniform(1.1, 2...原创 2018-06-07 10:35:56 · 6475 阅读 · 0 评论 -
【Python】Numpy必知必会26问——复旦邱锡鹏深度学习
前言深度学习在如今的火爆程度也不容多说,模型搭建,参数调试也确实需要在理解的基础上进行。当前主流的深度学习框架比较多,相关开源的代码也是如此。万丈高楼平地起,如果想正真理解深度学习的处理过程,是必须要有一定的数学基础,以及编程中的数据结构的表示。在进行数据处理等当前使用比较多的也就是R,Python,相比来说以及就当前形势来看,R语言已经在走下坡路,敌不过Python强大的开源社区等。Pytho...原创 2019-06-13 17:51:26 · 1854 阅读 · 0 评论 -
【Python】python中sort排序使用
本博客原文:【Python】python中你所忽视的一个列表sort排序功能1.前言昨天一学妹问我一个关于python的问题,当时在外忙碌,没时间细看。今天看一下,咋一看我还真的不知道这个问题,bookinfo.sort(reverse=True ,key=lambda x:(x[1],x[1]/x[2]))是如何排序的。但是我猜测应该是按照第二个元素排序,如果第二个元素相同,就按照第二...原创 2019-03-15 21:28:45 · 6038 阅读 · 0 评论 -
9行python代码批量修改window屏保图文件
前言最近看到window10开机壁纸特别好看,想去保存下来,查到其源文件的路径如下:C:\Users\JackPi\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets其中JackPi为用户名称。如果没有发现AppData,在JackPi目录下,把隐藏的文...原创 2018-12-14 16:38:54 · 3099 阅读 · 8 评论 -
使用python批量将word转为pdf
前言最近女票在在某个研究领域有一些想法,想去查看一些相关专利,于是在网上下载一些word文档,然后筛选一番,然后让我去打印,自知word在不同打印店格式可能会发生变化,于是就想去将其转为pdf,在百度上去搜索,无奈搜不到相关程序,于是就使用英语去搜索,“.doc to pdf using python”就在stack overflow上查询到了一个相关案例,实验后,在此分享。环境准备:程序包:...原创 2018-10-22 23:31:34 · 11531 阅读 · 3 评论 -
pandas 中DataFrame使用:数据标准化、数据分组、日期转换、日期格式化、日期抽取
本文测试使用Pandas使用的是Spyder,python3.6版本,已经安装好pandas包。测试数据已放云盘:链接:https://pan.baidu.com/s/1zozpY2BUTIvEJKf238leZg 密码:44zg。如需按照numpy,可以百度搜索如何安装。1数据标准化将数据按比例缩放,使之落入到特定区间,一般我们使用0-1标准化。公式如下:X∗=x−minmax−mi...原创 2018-09-09 14:15:56 · 19075 阅读 · 8 评论 -
pandas 中DataFrame使用:记录抽取,随机抽样,记录合并,字段合并,字段匹配,数据的简单计算
2.7记录抽取根据一定的条件,对数据进行抽取。使用函数为:dataframe[condition],其中condition:过滤条件,返回值为一个DataFrame。常用的条件类型有以下几种。下图为测试的原始数据:比较运算:大于(>),小于(<),大于等于,小于等于,不等于,例如:df[df.comments>1000];#导包from pandas...原创 2018-09-09 14:10:28 · 14620 阅读 · 0 评论 -
pandas 中DataFrame使用:数据导入\出,重复值处理,缺失数据处理,字段抽取,字段拆分
1数据导入1.1csv数据导入方式:#导包from pandas import read_csvdf=read_csv(r"C:\Users\JackPi\Desktop\pandas\data\1.csv",encoding='UTF-8')数据读入前后比对:1.2导入文本文件:使用read_table函数导入普通文本文件,其中read_able函数语法...原创 2018-09-09 14:00:41 · 3313 阅读 · 0 评论 -
pandas 中DataFrame的数据定义,访问,修改,删除,增加,遍历
本文测试使用Pandas使用的是Spyder,python3.6版本,已经安装好pandas包。DataFrame数据框是用于存储多行和多列的数据集合(可以联想到excel中的表格)。数据的定义:from pandas import DataFrame#定义一个数据框df=DataFrame( data={ 'age':[18,19,20], ...原创 2018-09-08 21:25:14 · 33720 阅读 · 0 评论 -
Python 获取不同格式的时间
Python 获取不同格式的时间01.模块time导包:import time01.1 基本案例#普通的时间import time#这里可以根据需要选择写入对应时间的字符如:%Y表示年print(time.strftime("%Y/%m/%d %A %H:%M:%S"))#24小时格式print(time.strftime("%I:%M:%S"))#12小时格式结果:...原创 2018-06-08 14:02:15 · 2040 阅读 · 0 评论