- 博客(92)
- 收藏
- 关注
原创 图像标签格式转换
在做图像检测的时候,不同打标签软件得到的标签格式可能会不一样,此处提供lableimg(txt格式)和lableme(json格式)的互换。
2024-11-25 14:34:51
296
原创 Sklearn 内置数据集简介
sklearn内置了一些机器学习的数据集,其中包括iris(鸢尾花)数据集、乳腺癌数据集、波士顿房价数据集、糖尿病数据集、手写数字数据集、体能训练数据集和酒质量数据集。
2024-11-23 14:51:04
1675
原创 YOLOv5训练自己的数据集并测试(以及踩坑记录)
YOLOv5是一个非常流行的图像识别框架,这里介绍一下使用YOLOv5给自己的数据集进行训练和测试下面逐步来演示一下
2023-08-31 10:32:02
11919
8
原创 【已解决】激活虚拟环境报错:此时不应有Anaconda3\envs\[envs]\Library\ssl\cacert.pem。
此时不应有Anaconda3 envs yolov5 Library ssl cacert.pem。但是之前装的虚拟环境也还能再次激活,base环境也无任何问题,仅新装的虚拟环境无法激活。
2023-08-30 10:33:19
5693
14
原创 【已解决】qt.qpa.plugin: Could not load the Qt platform plugin “windows“ in ““ even though it was found.
翻译:Qt .qpa.plugin:无法在“”中加载Qt平台插件“windows”,即使它被找到。这个应用程序启动失败,因为没有Qt平台插件可以初始化。重新安装应用程序可以解决此问题。查看是否还有PyQt5的库,如果没有的话则表明已清除干净。接下来就是重装PyQt5了。安装成功后,输入labelimg,就可以弹出软件了。
2023-08-30 10:09:59
19750
10
原创 【已解决】Windows10 pip安装报错:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x98
在Pycharm安装YoloV5的依赖包时出现报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x98。的报错一般是因为读取文件出现编码问题导致没法读取文件
2023-08-28 17:46:40
1452
1
原创 Crontab定时任务运行Docker容器(Ubuntu 20)
对于一些离线预测任务,或者D+1天的预测任务,可以简单地采用Crontab做定时调用项目代码运行项目
2023-08-24 15:52:35
3395
原创 Linux虚拟机安装(Ubuntu 20)
最近这段时间使用VMWare安装了一下Ubuntu版本的Linux虚拟机,在这里记录一下安装时参考的文章以及需要注意的细节。
2023-08-24 10:35:22
2576
原创 【解决】Python数据保存为csv再读取后部分数据的格式被更改
我们可以在每次读取数据之后加多一步,将所有非数字列转换为全字符串类型。这是一开始读取出来的数据,全部都是字符串。调用一下这个函数即可解决这个问题。
2023-06-16 20:55:07
1777
1
原创 CNN实现手写数字识别(Pytorch)
CNN(卷积神经网络)主要包括卷积层、池化层和全连接层。输入数据经过多个卷积层和池化层提取图片信息后,最后经过若干个全连接层获得最终的输出。以下基于Pytorch框架搭建一个CNN神经网络实现手写数字识别。
2023-05-04 15:57:09
13832
18
原创 Anaconda安装nbextensions
nbextensions 是 Jupyter 非常好的插件,它是将一系列 js 脚本嵌入到 Jupyter 中,增强 Jupyter 的交互式体验,可以让你的 Jupyter 变得非常强大。
2023-04-28 12:50:14
3383
2
原创 Pandas计算历史均值
在用Python进行时间序列分析时,我们可能经常需要计算历史的一些特征。一般会使用rolling()函数,这里介绍一下计算包括当前行的历史特征和不包括当前行的历史特征。
2022-12-26 23:54:30
1206
原创 SQL开窗函数之percent_rank、first_value、nth的用法
本文主要讲解了SQL开窗函数中percent_rank(), cume_dist(), first_value(), last_value(), nth_value(), ntile() 一共六个函数的用法
2022-12-11 19:34:13
4189
原创 【报错】cannot import name ‘DistanceMetric‘ from ‘sklearn.metrics‘
翻了一下网上的资料,其中一种解决方法是sklearn库版本太低,可以更新库或重装库。
2022-11-22 15:01:43
3986
2
原创 MySQL字符串提取
MySQL字符串切分有两种方式,一个是substring函数,一个是substring_index函数,下面来介绍一下两种切分的用法。
2022-08-16 21:35:11
2977
原创 Typora报错:This beta version of Typora is expired
Typora是一个非常好用的markdown编辑器,但最近开始老版本也需要收费了。网上找了好多解决方法,大佬们都在修改电脑时间,这边找到了一个最简单无脑的解决方法。
2022-07-28 19:18:33
2450
9
原创 Python读取 xlsb 文件格式
xlsb格式是Binary格式存储的excel文件,比普通的xlsx文件的体积要小很多,在数据量极大的场景比较多用。目前有两种方式读取.xlsb格式的文件。
2022-07-27 21:16:23
2295
原创 dataframe统计某列包含某个字符串的个数
有时候需要统计dataFrame里包含某一列某个元素的数量Example此时我们想筛选标签包含商业、关注和引流的名称数量
2022-07-07 12:15:46
2396
原创 pandas+sklearn数据预处理之缺失值处理
1. 查找缺失值df.isnull() # 查看空缺值,可以识别 null / None / Nandf.isnull().any(axis=0) # 查看每行是否有空缺值df.isnull().any(axis=1) # 查看每列是否有空缺值df.isnull().sum() # 统计每行空缺值的个数df.isnull().sum(axis=1) # 统计每列有空缺值的个数df.isnull().sum().sum() # 统计整个df的缺失值df['列名'].isnull().sum(a
2022-05-09 01:54:51
1572
转载 Python-pandas.DataFrame-找出有空值的行
0.摘要pandas中DataFrame类型中,找出所有有空值的行,可以使用.isnull()方法和.any()方法。1.找出含有空值的行方法:DataFrame[DataFrame.isnull().T.any()]其中,isnull()能够判断数据中元素是否为空值;T为转置;any()判断该行是否有空值。import pandas as pdimport numpy as npn = np.arange(20, dtype=float).reshape(5,4)n[2,3] = np.n
2022-04-28 17:51:45
6488
转载 [Pyhton·Pandas]关于pandas使用groupby后apply报错TypeError: unhashable type: ‘list‘这件事
我有一个DataFrame,如下df = pd.DataFrame(data=[[[1,2],[3,4],5,6],[[1,2],[0,0],0,0]],columns=['a','b','c','d'])df输出: a b c d 0 [1,2] [3,4] 5 6 1 [1,2] [0,0] 0 0然后我groupby再applydf.groupby('a').apply(lambda g:g)报错!......pandas\_libs\hashtable_c
2022-04-16 16:21:52
905
原创 DataFrame groupby含重复数据的计算
需求:想计算每个brand有几种type如果直接用groupby().count(), 则会把type里的重复值也一起算了进去。data.groupby(['brand'])[['type']].count().reset_index()因此我们在计算之前要先去一次重# 两种写法都可以data.groupby(['brand']).nunique().reset_index()# data.groupby(['brand']).agg({'type':pd.Series.nunique})
2022-04-16 15:49:03
1191
原创 df分割中英文字符串
需求:有时候我们想把一串带有中英文的字符分成中文和英文部分具体思路:使用中英文正则识别,用re.findall找出来中文识别编码:[\u4e00-\u9fa5]英文识别编码:[a-zA-Z]代码实现import reimport pandas as pd# 中英文编码en = re.compile(r'[a-zA-Z]')cn = re.compile(r'[\u4e00-\u9fa5]')# 提取中英文for i in data.index: data.loc[i,'c
2022-04-16 02:33:34
422
原创 df两列值替换
需求:有时候我们想用右边品牌那列的行业词替换掉,但有可能行业那列的变量较多无法直接使用行业词替代这里介绍两种方法第一种,使用list去循环替换# 先把行业词转换成list, 再用列表推导式循环替代# 这个在面对大量数据的时候效率较慢hy_ls = list(map(str, data['brand'].to_list()))data['brand']=data['brand'].replace([hy for hy in hy_ls], '', regex=True)第二种, 使用lamb
2022-04-16 02:20:29
750
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人