
python
机器学习与深度学习
很菜又爱学
这个作者很懒,什么都没留下…
展开
-
乱序图片排序并重命名
乱序图片排序并重命名说明与目的如何计算两张图片的相似度代码说明与目的说明文件夹中存放着乱序的图片,图片名按照顺序排放!以第一张图片为基准,将后面的图片依次与其计算两者的相似度进行排序!实际应用中,避免不了相似度相同的值,因此,特意拷贝图片4和图片5其中5和6是同一张图片,4和8是同一张图片目的我们希望得到的结果如下图箭头指向是拷贝图片的副本如何计算两张图片的相似度//伪代码 有空再补充probability = detect_image(image_1, image_2)代码原创 2022-04-13 20:57:36 · 1050 阅读 · 0 评论 -
扩大数据集
在图像处理中,有时候数据集不够,可以考虑如下方式来增广数据集,降低过拟合,提高网络的泛化能力图像增强原图水平翻转(左右翻转)垂直翻转(上下翻转)逆时针旋转45°逆时针旋转90°逆时针旋转180°逆时针旋转270°综合代码原图水平翻转(左右翻转)垂直翻转(上下翻转)逆时针旋转45°逆时针旋转90°逆时针旋转180°逆时针旋转270°综合代码import matplotlib.pyplot as pltfrom PIL import Imagepath = r"C:\U原创 2021-05-14 20:27:02 · 245 阅读 · 0 评论 -
读json文件,并将其内容作为图像的标签
以垃圾分类为例,这里可分为4大类(厨余垃圾、可回收垃圾、其他垃圾和有害垃圾),也可分为40小类垃圾(具体如下)提取json文件中的信息json文件中的信息目的40小类注意4大类注意json文件中的信息文件中是一个字典,key为数字类别num_classes,value为真实类别truth_classes目的40小类我们需要读取json文件,获取两个列表。一个是数字类别num_classes//num_classesnum_classes=[0,1,2,3,4,5,6,7,8,9,10,1原创 2021-05-13 19:14:47 · 663 阅读 · 0 评论 -
生成图像标签的txt文件
dataset文件夹里有“ants”和“bees”两个子文件夹,这两个子文件夹中分别存放着属于“ants”和“bees”类别的图片import osif __name__ == "__main__": datasets_path = "datasets/" # 数据集地址 # windows系统使用os.listdir()得到顺序排序的文件列表 # Linux系统使用os.listdir()得到乱序排序的文件列表 # 因此使用python自带排序函数sorted原创 2022-03-16 10:01:13 · 400 阅读 · 1 评论 -
图片和标签都放在同一个文件夹
读文件夹(一张.jpg图片对应一个.txt标签)例子目的代码例子.jpg图片和其对应的txt文件名是一样的txt里面是“文件名”+‘空格’+“,”+标签数字目的1、利用os.listdir()遍历文件夹2、判断文件的后缀。若为.txt,则读取该文件,提取数字标签;若为.jpg,则特征提取3、将提取完毕的特征放入imgs列表中,将标签放入label列表中4、将两个列表转为np.asarry格式代码// 下面代码不完整,没有导入相应模块,没有特征提取的具体过程def read_img(原创 2021-05-13 19:46:22 · 642 阅读 · 0 评论 -
tqdm进度条
参数说明官方文档class tqdm(): def __init__(self, #所有参数均为【可选】 iterable=None, #可迭代对象,在手动更新时不需要进行设置 desc=None, #str, 左边进度条描述文章(类似说明) total=None, #总的项目数 leave=True, #迭代完成后是否保留进度条 file=None, #输出指向位置,默认是终端,一般不需要设置 ncols=None, #调整进度条宽度,默认是根原创 2022-03-14 14:54:49 · 794 阅读 · 0 评论 -
文件夹中有10个文件夹,每个文件夹名为数字标签
读文件夹(有10个文件夹)文件夹例子目的代码文件夹例子文件夹D:\da 下有10个子文件夹10个子文件夹的名字是每个类别图片的数字标签目的1、遍历文件夹2、将子文件夹名字作为该类的标签,并添加到列表label中3、将列表label转换为np.asarry格式代码// 下面代码不完整,没有导入相关模块, 传入的path是文件夹地址D:\dadef read_img(path): imgs = [] label = [] dir_path = [] for原创 2021-05-13 20:30:15 · 365 阅读 · 0 评论 -
python 将若干图片生成可播放的mp4格式视频
VideoWriter_fourcc()常见的编码参数cv2.VideoWriter_fourcc(‘M’, ‘P’, ‘4’, ‘V’)MPEG-4编码 .mp4 可指定结果视频的大小cv2.VideoWriter_fourcc(‘X’,‘2’,‘6’,‘4’)MPEG-4编码 .mp4 可指定结果视频的大小cv2.VideoWriter_fourcc(‘I’, ‘4’, ‘2’, ‘0’)该参数是YUV编码类型,文件名后缀为.avi 广泛兼容,但会产生大文件cv2.原创 2021-11-04 10:47:32 · 1001 阅读 · 0 评论 -
常见过拟合、欠拟合原因及解决办法
引言 在机器学习中,我们将模型在训练集上的误差称之为训练误差,又称之为经验误差,在新的数据集(比如测试集)上的误差称之为泛化误差,泛化误差也可以说是模型在总体样本上的误差。对于一个好的模型应该是经验误差约等于泛化误差,也就是经验误差要收敛于泛化误差,根据霍夫丁不等式可知经验误差在一定条件下是可以收敛于泛化误差的。过拟合欠拟合...原创 2022-03-21 15:27:11 · 13700 阅读 · 0 评论