
【日常Debug】
打打杂
数据闲逛人
18级双非本科学生
展开
-
cannot import name ‘just_fix_windows_console‘ from ‘colorama‘
cannot import name 'just_fix_windows_console' from 'colorama'原创 2022-12-01 15:48:16 · 3263 阅读 · 3 评论 -
在使用scikit-optimize中No module named ‘skopt‘
在使用scikit-optimize中No module named 'skopt'原创 2022-11-30 14:23:12 · 662 阅读 · 0 评论 -
Python获取指定时间范围内的工作日、假日日、法定节假日
Python获取指定时间范围内的工作日、假日日、法定节假日原创 2022-08-09 16:18:21 · 9334 阅读 · 0 评论 -
利用selenium框架爬取京东省市区数据时,网页里面内嵌的一个窗口遇到的NoSuchElementException的 bug,原因是iframe
利用selenium框架爬取京东省市区数据时,网页里面内嵌的一个窗口遇到的NoSuchElementException的 bug,原因是iframe原创 2022-07-21 16:08:34 · 294 阅读 · 0 评论 -
PostgreSQL 出现cross-database references are not implemented的bug
bug原创 2022-06-28 18:30:23 · 9673 阅读 · 0 评论 -
/usr/bin/gzip: 1: ELF: not found /usr/bin/gzip: 3: : not found /usr/bin/gzip: 4: Syntax erro
root@DESKTOP-9LANUGK:/opt# tar -zxvf spark-3.2.1-bin-hadoop3.2-scala2.13.tgz/usr/bin/gzip: 1: ELF: not found/usr/bin/gzip: 3: : not found/usr/bin/gzip: 4: Syntax error: "(" unexpectedtar: Child returned status 2tar: Error is not recoverable:原创 2022-06-09 17:47:15 · 2106 阅读 · 1 评论 -
【需求】DBeaver中使用with as,下面使用as出来的表却报错说不存在,ERROR: relation “new_dppp“ does not exist
bugbug如下:Navicat中同样的语句可以使用,但是DBeaver中却不能使用,折腾半天,终于把问题解决了,但是不知道为什么,可能是软件本身设置如此吧解决bug解决方法:不要有换行,猜测是换行是独立片段,没有联系(这估计是DBeaver的特性,Navicat中不会这样)拓展那么的就像换行,空着美观一点怎么办,可以解决,加注释行就可以解决了...原创 2022-05-07 09:45:17 · 1989 阅读 · 6 评论 -
jupyter notebook如何实现连接PostgreSQL,并进行取数的操作
前言 工作中如果我们公司有数据库,那么就经常需要用jupyter notebook连接数据库,把数据拉取进来用python语言进行数据探索,数据处理甚至是数据建模的操作。PostgreSQL介绍PostgreSQL 教程如何连接?# 导入数据库import psycopg2import pandas as pdfrom sqlalchemy import create_engine# postgres:数据库原创 2022-04-12 14:59:32 · 2750 阅读 · 0 评论 -
Input contains NaN, infinity or a value too large for dtype(‘float64‘).
what:建模之前数据预处理,用Smote处理样本不平衡问题,出现这个bugwhy:根据报错提示输入包含NaN、infinity或一个对dtype来说太大的值(‘float64’)经过sum(data.isnull().sum())然后查找最大df.max()找到原因处理掉就可以了...原创 2022-04-03 21:34:32 · 1232 阅读 · 0 评论 -
python中对dataframe格式的某列进行匹配替换,apply与lambda结合,或整列replace替换
前言自己想对dataframe某列进行替换正文前面是有data.insert(11,'discovery_like_count',-10)data.insert(12,'discovery_collect_count',-10)data.insert(13,'discovery_comment_count',-10)(1)apply与lambda结合data['discovery_like_count'] = data['discovery_like_count'].apply(lambd原创 2022-03-26 16:20:28 · 4112 阅读 · 0 评论 -
优快云教写博文的SOP #自己拿来看
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2022-03-24 09:48:23 · 150 阅读 · 0 评论 -
python中想指定某一路径,然后获取该路径下的文件
当某个文件夹里面的文件比较多,自己需要遍历读取,但是又不想一个个自己输入,可以遍历获取存成一个列表,然后自己加一个循环就可以完成多个文件的读取import os # 这里我想指定某一路径,然后获取该路径下的文件def file_name(file_dir): """ root: 当前目录路径 dirs: 当前路径下所有子目录 files:当前路径下所有非目录子文件 """ for root, dirs, files in os.原创 2022-03-18 10:32:07 · 1382 阅读 · 0 评论 -
压缩pdf文件,自行调节清晰度从而调节文件大小,切分pdf文件为多个小文件,控制每个文件大小
前言因为内网,不能发送大于10M的文件,无奈只能将pdf切分进行压缩pdf文件,自行调节清晰度从而调节文件大小import fitzimport osdef covert2pic(zoom): if os.path.exists('.pdf'): # 临时文件,需为空 os.removedirs('.pdf') os.mkdir('.pdf') for pg in range(totaling): page = doc[pg原创 2022-03-13 00:54:06 · 555 阅读 · 0 评论 -
python中批量根据自己指定数据量导出数据到excel表格,可以用excel存储超100w行的数据,分多个表格
def to_excel(data,row): length = len(data) number = length //row for i in range(number+1): data[i*row:(i+1)*row].to_excel('./path.xlsx',index=False)原创 2022-02-23 16:55:25 · 1147 阅读 · 0 评论 -
Consider using the `--user` option or check the permissions.及python操作excel保留原格式
参考此文章解决了这个bug来源:我想使用python中xlwt的包 ,但是我在已经搭好的服务器上使用jupyter,所以我进行下面命令进行安装pip install --user xlwt出现Consider using the --user option or check the permissions.的bug,经查找,定位原因是没有root权限 不能进行全局安装加上–user 只安装在自己的环境就ook了...原创 2022-02-10 10:53:37 · 1156 阅读 · 0 评论 -
取数时出现 Disk I/O的bug
废话不多说,直接上图解决方案INVALIDATE METADATA + Table namewhy:推测 数据冲刷一遍,类比我想到了电脑重启,底层原理不懂,望大神指点一二原创 2022-01-12 11:50:34 · 120 阅读 · 0 评论 -
python中将dataframe输出到excel的不同sheet里面与获取excel的所有sheet的表名
#这里声明一个读写对象writer = pd.ExcelWriter('./A.xlsx',engine='xlsxwriter')for i in range(len(page)): DataFRame_data.to_excel(writer,sheet_name=page['页数'][i],index=False)writer.save() # 这里一定要保存!!!!!!!!!!!!!!write.save() 保存的原因 可以看到建立了一个对象 这个对象可以不断添加不同she原创 2021-12-07 18:42:02 · 8544 阅读 · 0 评论 -
正则表达式网站在线测试
超链接原创 2021-12-01 17:17:53 · 251 阅读 · 0 评论 -
python中DataFame一些性能优化的小小技巧
减少循环,提高运行效率,灵感来源,实习接的一些需求,看到运行时间预计要几小时那瞬间奔溃有点情景: 增加一列进行打标分几个类别套两个循环 结果用isin()优化后for j in tqdm(range(len(bcc_brand_list))): df.loc[df['brand_name'].isin(bcc_brand_list), 'category'] = 'BCC'for j in原创 2021-11-26 16:26:12 · 967 阅读 · 0 评论 -
多大的数据量称得上大数据
前言 前两天突然有个疑惑,多大的数据量才算得上大数据, 后面还联想到现在的硬件存储资源的价格大概是多少?详情可以点击这原创 2021-11-24 10:22:04 · 1985 阅读 · 0 评论 -
《数据挖掘与数据化运营实战》 几个经典的数据挖掘方法论.xmind 数据挖掘与数据湖运营实战12章-15章.xmind 条条大道通罗马.xmind 用户特征分析的典型应用和技术小窍门.xm
文件直接在链接里面下载飞书文档的链接,直接进入下载就可以了原创 2021-11-06 17:54:02 · 122 阅读 · 0 评论 -
质量保障流程和制度
Xmind文件下载链接:https://pan.baidu.com/s/1lO4qe4guBlKkyjIHj4QVeg提取码:snk0原创 2021-11-06 17:47:06 · 172 阅读 · 0 评论 -
数据分析学习技能树 | 养成数据分析师的品质和思维模式
Xmind文件下载链接:https://pan.baidu.com/s/178hB62Mgll268EIwR2q0sw提取码:wfbo原创 2021-11-06 17:45:52 · 414 阅读 · 0 评论 -
短租listing数据分析(探索性数据分析+简单建模尝试)
Xmind文件下载链接:https://pan.baidu.com/s/1jDgGsL2Zp1Cv8ZOlslJyZg提取码:oyqf原创 2021-11-06 17:44:59 · 213 阅读 · 0 评论 -
MATLAB三维画图
Xmind文件下载链接:https://pan.baidu.com/s/1hsgOayjryUj8Y1TJgnY7Hw提取码:ujfu原创 2021-11-06 17:33:17 · 160 阅读 · 0 评论 -
python中的enumerate()函数
enumerate() 函数是用来将一个可以遍历对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据下表和数据对象,一般用在for循环中下面举个例子for ind,each_data in enumerate(sheet_datas[:-1]): print(ind) print(each_data)...原创 2021-08-18 23:42:51 · 288 阅读 · 0 评论 -
python中批量寻找体积大于1M的文件,并将其拷贝到一个文件夹里面
同理可以寻找体积大于10M,100M,而且是.pdf或其他限制逻辑,只要稍微修改一下下就可以了os.path.getsize(path) :返回path参数中文件的字节数。for folderName,subFolders,fileNames in os.walk('D:\\jupyter_file\\Datawhale\\第27期学习'): for filename in fileNames:原创 2021-08-04 16:58:26 · 739 阅读 · 0 评论 -
批量查找特定扩展名的文件(像.pdf,.jpg,.md),不管这些文件位置在哪里,将它们拷贝到一个新的文件夹里面
os.walk(path):传入一个文件夹的路径,在for循环语句中使用os.walk()函数,遍历目录树,和range()函数遍历一个范围的数字类似。不同的是,os.walk()在循环的每次迭代中,返回三个值:1)、当前文件夹称的字符串。2)、当前文件夹中子文件夹的字符串的列表。3)、当前文件夹中文件的字符串的列表。注:当前文件夹,是指for循环当前迭代的文件夹。程序的当前工作目录,不会因为os.walk()而改变。os.path.join()`函数来创建文件名称字符串。# os.wa.原创 2021-08-04 16:54:43 · 271 阅读 · 0 评论 -
python中的os.path.join()的作用与没有这个方法之谈
os.path.join()函数来创建文件名称字符串import osos.path.join('jupyter_file','Datawhale')下面到了假设没有这个方法,我用其他试试看,在此之前先说明一下os.listdir()和os.path.getsize(),**os.listdir(path):返回文件名字符串的列表,包含path参数中的每个文件。os.path.getsize(path):**返回path参数中文件的字节数。然后到了重头戏了,我要统计一个文件夹下的所有文件原创 2021-08-03 10:48:28 · 815 阅读 · 0 评论 -
【需求】pyqt5_tools\designer.exe不见了 找不到
文章目录1 参考这篇文章https://www.jianshu.com/p/8b992e47a0e4出现pyqt5_tools\designer.exe不见了一开始很纳闷,但是已经初入程序员的门槛的我,淡定地喝了口水,然后首先怀疑库版本的问题,进行重装pip install sip //pip install PyQt5 -i https://pypi.douban.com/simplepip install PyQt5-tools -i https://pypi.douban.co原创 2021-07-05 17:50:16 · 543 阅读 · 0 评论 -
pandas中dataframe 构造
result = pd.DataFrame()result['ImageId'] = list(range(1,2001))result['Label'] = resultsresult.to_csv("Sample_submission.csv", index = False)原创 2021-06-21 15:22:10 · 175 阅读 · 0 评论 -
大数据专业学校课程安排 (仅供参考)
大一上:高等数学1A1c语言程序设计大学计算机基础大一下:线性代数高等数学1A2运筹学Matlab程序设计面向对象程序设计(c++)离散数学大二上:概率论与数理统计数值分析数据结构数据库原理与应用java程序设计大二下:数学建模web应用技术操作系统原理及应用Python多元统计分析大三上:数据分析人工智能计算机网络数据挖掘与分析大型数据库技术云计算算法分析与设计智能搜索引擎技术大三下:并行程序设计软件工程大数据构架与技术机器学习数据原创 2021-06-04 20:22:23 · 2090 阅读 · 2 评论 -
Python中批量读取文件,并合并成一个文件,以csv为例
warnings.filterwarnings('ignore')import pandas as pdimport reimport os#数据探索#1 获取所有文件的名称和路径data_path = './data/' #数据存储路径 !!!!!按需修改这里data_names = os.listdir(data_path) #列举出data_path里面所有的文件名称data = pd.DataFrame([])for data_name in data_names:原创 2021-05-27 20:33:01 · 1829 阅读 · 0 评论 -
上推文件到GitHub上
文章目录<1> 打开进入 git<2><3><4>结果成功原创 2021-04-13 20:02:35 · 100 阅读 · 0 评论 -
dataframe导出csv表格,去掉默认索引
1. dataframe导出csv表格,去掉默认索引answer_data.to_csv('./my_model_stacking.csv',index = False)原创 2021-05-02 21:37:48 · 1205 阅读 · 0 评论 -
Message: session not created: This version of Chromedriver only supports Chrome version 88Current br
Sessionnotcreatedexception: Message: session not created: This version of Chromedriver only supports Chrome version 88Current browser version is 90.0.4430.85 with binary path C: Users Administratorappdata Local\ Chrome Application\chrome. exe谷歌浏览器自动更新的泪!!原创 2021-04-22 21:59:37 · 934 阅读 · 3 评论 -
Can only use .dt accessor with datetimelike values
出现了这个bugdata2[‘下单时间’]是这样的开始挺纳闷,不知道是为啥,后来想应该是类型问题想着是不是要pandas版本的问题,因为前面对时间进行处理将,开始在csv中是这样的然后处理变成了感觉可能版本处理应该可以直接将类型处理好,不过底层的东西还是小白,希望有大神教教,找资料说可以这样处理[红色框]然后类型最后bug解决了...原创 2020-06-07 10:56:19 · 10172 阅读 · 3 评论 -
python将时间改为时间格式的数据
将这样的时间2018/6/30 23:58:36 批量改成2018-09-01 00:00:35的在这里插入代码片import pandas as pddata['下单时间'] =pd.to_datetime(data['下单时间']) #data是读取的一个csv文件里面有列"下单时间"表格里面是这样的处理后变成...原创 2020-06-06 11:33:01 · 1392 阅读 · 0 评论 -
解决ubantu下载后显示页面太小了 调节屏幕分辩 ps[这里有bug]
下载安装后发现页面太小,看了很多网上解决方法,主要有两种1安装VMware Tools的方法2也看到了调节屏幕分辩率来弄但是都没弄成功[可能是我太菜了]之前看见一个博客是在终端写命令弄成功了,然后后面做实验好像ubantu坏了,重新下载,想再调一次 ,找那个博客,发现找不到那个博客了连接了!!!后悔没收藏现在找到另外一个解决方案是调节分辨率的1 找到系统设置2 点击显示 3 调节自己喜欢的分辨率这里有个小bug就是选择好分辨率之后,因为页面太小,那个应用的按钮一直按不到!!!解决.原创 2020-11-29 20:01:16 · 393 阅读 · 0 评论 -
杂记
文章目录做异常检测,用Kmeans做聚类,设置较大的K值,小类可能为异常原创 2021-03-18 14:51:52 · 105 阅读 · 0 评论