
python
文章平均质量分 69
有为少年
一步步,一点点
展开
-
编码与数学之循环
编写代码过程中,经常会遇到一些奇奇怪怪的需求,有一些问题一眼看上去很复杂,但是实际上通过特定的数学运算过程就可以很方便的实现。这里记录几种比较典型的案例。原创 2022-11-14 10:20:50 · 1412 阅读 · 0 评论 -
PyTorch之F.pad的使用与报错记录
这一函数用于实现对高维tensor的形状补齐操作。模式中,padding的数量不得超出原始tensor对应维度的大小。常见的错误主要是因为padding的数量超过了对应模式的要求。模式中,padding的数量必须小于对应维度的大小。对于padding并没有限制。原创 2022-10-18 16:04:13 · 6602 阅读 · 8 评论 -
从二值 Mask 获取外接矩形坐标
在数字图像处理中,我们有时候会需要计算二值mask对应的外接矩形。本文针对这一问题给出了几种方便的策略。原创 2022-08-30 16:03:22 · 3283 阅读 · 0 评论 -
如何计算质心
本文介绍了质心的概念,以及基于Numpy、Scipy、OpenCV等工具的多种实现方式。原创 2022-08-22 21:42:26 · 13476 阅读 · 0 评论 -
小心你的字典和样板代码
编码错误反思原创 2022-07-30 12:32:01 · 434 阅读 · 0 评论 -
Python数据压缩和存档——zlib/gzip/bzip2/lzma/zip/tar
python 中提供了几种重要的数据压缩算法的支持,包括 zlib、gzip、bzip2 和 lzma 数据压缩算法,同时支持创建 ZIP 和 tar 格式的归档文件,这些归档格式也同样支持这些压缩算法的搭配使用。本文直接将不同压缩算法和归档格式的常用方法和属性进行了整理,全部嵌入到一段完整的代码。通过这样提供上下文的方式来为不同方法的使用提供更具体的展示。原创 2022-03-15 12:00:30 · 3021 阅读 · 0 评论 -
Python之使用Matplotlib绘图小记——使用迭代器形式的子图对象
Python之使用Matplotlib绘图小记——使用迭代器形式的子图对象前言在使用 opencv 构建计算机视觉程序的时候,常会使用 matplotlib 来可视化中间的结果。因为直接为每一个中间结果进行一次单独的输出并不现实,因为如果窗口积累多了,关起来非常麻烦,最好的还是使用子图的形式,每个输出作为一个子图。创建子图子图索引的坑实际操作中,这里会涉及到对于子图的索引。matplotlib 本身对子图的索引是按照行列来区分的。当然,这里有个坑,那就是如果使用一行或者一列,那就应该使用一维索引就原创 2022-01-08 22:06:51 · 10414 阅读 · 0 评论 -
Python之字典以层级形式输出
文章目录问题分析进一步再进一步问题现有字典:a = dict(a0=1, b0=2, c0=3, d0=dict(a1=[1, 2, 3], b1=dict(a2=dict(a3=10, b3=[1, 2, 3])), c1=dict(a2=1)))想将其按照不同的层级进行输出,即如下形式:{ a0: 1 b0: 2 c0: 3 d0: { a1: [1, 2, 3] b1: { a2: {原创 2021-05-26 18:36:54 · 2810 阅读 · 0 评论 -
Python之将多层嵌套列表转化为一维列表或迭代器
将多层嵌套列表转化为一维列表或迭代器前言今天遇到一个问题,即如何将(-1, 0, range(3, 10), 39)这样的序列对象转化为一个一维的列表,仔细尝试了一些方法,这里记录下。尝试V0基于for,不断迭代。依次判断各个元素的类型,如果是int或者float,就将其输出;如果是range就将其转换为list,依次输出。可以得到如下代码:seq = (-1, 0, range(3, 10), 39)def iterate_nested_seq_v0(seq): out = [原创 2021-04-12 23:25:42 · 1280 阅读 · 2 评论 -
我是如何使计算提速>150倍的
我是如何使计算提速>150倍的我的原始文档:https://www.yuque.com/lart/blog/lwgt38书接上文《我是如何使计算时间提速25.6倍》.上篇文章提到, F-measure使用累计直方图可以进一步加速计算, 但是E-measure却没有改出来. 在写完上篇文章的那个晚上, 重新整理思路后, 我似乎想到了如何去使用累计直方图来再次提速.速度的制约虽然使用"解耦"的思路可以高效优化每一个阈值下指标的计算过程, 但是整体的 for 循环确实仍然会占用较大的时间. 又原创 2020-11-30 19:27:46 · 568 阅读 · 0 评论 -
我是如何使计算时间提速25.6倍的
我是如何使指标计算变得更快的原始文档:https://www.yuque.com/lart/blog/aemqfz在显著性目标检测任务中有个重要的评价指标, E-measure, 需要使用在闭区间 [0, 255] 内连续变化的阈值对模型预测的灰度图二值化. 直接的书写方式就是使用 for 循环, 将对应的阈值送入指标得分计算函数中, 让其计算分割后的预测结果和真值mask之间的统计相似度.在显著性目标检测中, 另一个指标, F-measure, 同样涉及到连续变化的阈值二值化处理, 但是该指标计原创 2020-11-30 10:30:34 · 379 阅读 · 0 评论 -
使用Anaconda时让Vim8.2支持Python3(Win10)
让Vim8.2支持Python3(Win10)这里写自定义目录标题让Vim8.2支持Python3(Win10)遇到问题如何配置参考链接遇到问题从官方的GitHub里下载的Vim 64-bit。可以看到,已经支持了python2和python3。另外,我使用了coc-nvim来实现补全等高级功能。Plug 'neoclide/coc.nvim', {'branch': 'releas...原创 2020-04-13 21:07:32 · 2271 阅读 · 1 评论 -
Python创建并写入训练数据到xlsx文件
Python创建并写入训练数据到xlsx文件文章目录Python创建并写入训练数据到xlsx文件前言`Xlwings`&`openpyxl`具体过程前言训练模型后,总是需要测试并保存评估结果,之前一直是将各个数据集和指标对应的结果组成一个字典,直接构造到f-string输出到txt文件中,这样虽然方便,但是却也导致想要使用excel处理数据的时候,来回的复制粘贴。为了爱护双手,爱护指...原创 2020-01-12 15:18:56 · 2098 阅读 · 0 评论 -
PyTorch使用LMDB数据库加速文件读取
PyTorch使用LMDB数据库加速文件读取文章目录PyTorch使用LMDB数据库加速文件读取背景介绍具体操作LMDB主要类`lmdb.Environment``lmdb.Transaction``Imdb.Cursor`操作流程创建图像数据集配合DataLoader参考链接原始文档:https://www.yuque.com/lart/ugkv9f/hbnym1对于数据库的了解较少,文...原创 2019-11-22 22:28:38 · 13128 阅读 · 33 评论 -
使用crontab和python定时下载Bing首页美图
使用crontab定时下载Bing首页美图前言个人比较喜欢Bing首页的图片,想收集下,下载简单,但是每天都去手动下就有点麻烦了。这里简单介绍下使用linux上的crontab设置定时任务来驱动python下载图片。正文首先需要一个脚本文件,需要已经实现了对应的功能。#!/usr/bin/env python3# -*- coding: utf-8 -*-"""@author:...原创 2019-11-05 15:49:29 · 485 阅读 · 0 评论 -
Numpy之numpy.argsort()
Numpy之numpy.argsort()前言关于argsort这个函数一直没有很好的理解,今天算是搞明白了。特此记录。介绍函数原型:numpy.argsort(a, axis=-1, kind=None, order=None)理解这个函数的关键在于明白其返回的是什么。首先明确,对于numpy的数组输出的形式上,横向始终表示的是最后一维的方向(axis=-1)。对于二维的数据a(...原创 2019-08-26 22:53:20 · 726 阅读 · 0 评论 -
PIL之Image.crop的box参数超界的问题
PIL之Image.crop结论Image.crop(box=None)Returns a rectangular region from this image. The box is a 4-tuple defining the left, upper, right, and lower pixel coordinate.This is a lazy operation. Change...原创 2019-05-06 16:51:03 · 3471 阅读 · 0 评论 -
import os, glob, fnmatch--Python os/glob/fnmatch 模块主要函数汇总
import os基于官方3.7文档, 3.6以上都没问题文章目录import os环境变量系统指令系统信息文件(夹)操作路径获取`os.path`路径显示路径判断路径时间路径体积路径规范针对某些操作, 官方推荐这些操作This module provides a portable way of using operating system dependent functionalit...原创 2019-01-17 22:52:14 · 972 阅读 · 0 评论 -
深浅拷贝
深浅拷贝转载 2016-06-25 17:26:42 · 379 阅读 · 0 评论 -
spider for qsbk
关于糗事百科的一个爬虫,模仿他人代码而成。原创 2016-07-31 19:45:00 · 512 阅读 · 0 评论 -
spider for bdtb
模仿中学习 百度贴吧python爬虫系列原创 2016-08-02 13:44:13 · 723 阅读 · 0 评论 -
爱问知识人爬虫与数据库相关
相关补充信息随后会在评论去补充。。包括个人思考转载 2016-08-27 17:49:11 · 753 阅读 · 0 评论 -
使用pelican+git+码云pages建立静态markdown博客全过程
使用pelican+git+码云pages建立静态markdown博客全过程原创 2017-02-20 18:46:11 · 2432 阅读 · 0 评论 -
python2,3并存问题
如果你有一个Python文件叫 hello.py,那么你可以这样用Python2运行它py -2 hello.py类似的,如果你想用Python3运行它,就这样py -3 hello.py原创 2017-05-21 17:08:59 · 482 阅读 · 0 评论 -
我的第一个豆瓣短评爬虫
豆瓣上有着大量的影视剧的评论,所以说,要是想要实现对广大人民群众的观点的分析,对一部片子的理解,综合来看大家的评论是很有必要的。而短评作为短小精干的快速评论入口,是值得一谈的。所以先要实现对其的数据的爬取。目前来看,基本内容是可以爬取的。最大的问题在于速度。后续考虑准备运用多线程的方式处理下。以及可以尝试其他提速的方法。下面是这个程序的构思编写过程。原创 2017-08-17 16:50:20 · 936 阅读 · 4 评论 -
利用豆瓣短评数据生成词云
在之前的文章中,我们获得了豆瓣爬取的短评内容,汇总到了一个文件中,但是,没有被利用起来的数据是没有意义的。前文提到,有一篇微信推文的关于词云制作的一个实践记录,准备照此试验一下。原创 2017-08-18 17:54:05 · 1201 阅读 · 0 评论 -
关于近期爬虫学习的总结
在之前的三篇文章中,我尝试了使用python爬虫实现的对于特定站点的《剑来》小说的爬取,对于豆瓣的短评的爬取,也有对于爬取的短评数据进行的词云展示,期间运用了不少的知识,现在是时间回顾一下。在此之后,我会再关注一些爬虫框架的使用,以及更多的爬虫的优化方法,争取做到尽量多的吸收新知识,巩固旧知识。在参考文章 《爬虫(1)— Python网络爬虫二三事》 的基础上,我写了这篇文章。原创 2017-08-20 21:31:51 · 626 阅读 · 0 评论 -
我的第一个完整的小说爬虫
纪念我的第一个爬虫程序,一共写了三个白天,其中有两个上午没有看,中途遇到了各种奇怪的问题,伴随着他们的解决,对于一些基本的操作也弄清楚了。果然,对于这些东西的最号的学习方式,就是在使用中学习,通过解决问题的方式来搞定这些知识。按需索取,才能更有针对性。大体记录下整个过程。准备构思出于对于python的热爱,想要尝试一些练手的项目,但是不论是看书,还是直接尝试别人的项目,到最后都会沦为不停地复制粘贴…原创 2017-08-13 21:33:38 · 2322 阅读 · 0 评论 -
我的豆瓣短评爬虫的多线程改写
对之前我的那个豆瓣的短评的爬虫,进行了一下架构性的改动。尽可能实现了模块的分离。但是总是感觉不完美。暂时也没心情折腾了。同时也添加了多线程的实现。具体过程见下。原创 2017-08-25 21:00:13 · 887 阅读 · 3 评论 -
C51汇编典型代码&一些org-mode技巧
C51汇编典型代码&一些org-mode技巧文档存放具体内容可见存放的数据。下面主要介绍关键代码。ASM 部分 1;; LCD数据发送============================================================= 2OUT_DATA: 3 PUSH 01H 4 PUSH 02H 5 PUSH...原创 2018-06-24 00:05:28 · 1132 阅读 · 0 评论 -
python爬虫工具集合
python爬虫工具集合 大家一起来整理吧!强烈建议PR。这是初稿,总是有很多问题,而且考虑不全面,希望大家支持! 源文件 主要针对python3常用库urllib - Urllib是python提供的一个用于操作url的模块。 - 在python2中,有urllib库和urllib2库。在pyth...原创 2018-08-03 11:36:56 · 769 阅读 · 0 评论 -
关于import
关于import,你应该知道这些内容在本文中,我们将探讨以下话题:常规导入(regular imports)使用from语句导入 相对导入(relative imports)可选导入(optional imports) 本地导入(local imports) 导入注意事项转载 2016-05-12 23:48:01 · 885 阅读 · 0 评论