- 博客(135)
- 资源 (1)
- 问答 (30)
- 收藏
- 关注

原创 TypeError ‘DataFrame‘ object is not callable 程序逻辑都对 但就是出问题 算不对 jupyter notebook 运行中删除代码行导致出现奇怪问题
出现这类情况,你要考虑是否编译器或者变量出问题了,最好刷新再跑一次。运行代码过程中是不能动代码的,尤其是不能删除非末尾的代码,哪怕该代码是被注释了。可能会因被纳入内存中待运行的代码,中途突然缺失,让接下来的程序变量出现混乱。实际案例:我在什么都没改动的情况下,运行代码竟然报错了,而且对该报错的区域我反复验证过,逻辑语法对,单独拿出来运行也对。后来发现原因是在运行的过程中删除了某些没用的代码,导致系统的变量混乱,在重新生成变量的过程中会出现奇怪问题。只要重新刷新,再跑一次代码,问题就会消失了,就这么
2022-03-21 19:04:54
4216

原创 mkvirtualenv: command not found 详细有效解决方案!!
hellopython@ubuntu:~$ mkvirtualenv -p /user/local/bin/python3 dmmkvirtualenv: command not found参考:https://blog.youkuaiyun.com/liu_xzhen/article/details/79293373#commentsedit执行命令sudo apt-get install pyt...
2019-11-09 12:40:59
3197

原创 stale element reference: element is not attached to the page document 本页的标签对象不能应用于其它页
运行程序如下:import reimport requestsimport randomfrom selenium import webdriverimport timeb = 1dri = webdriver.Chrome()dri.get('https://item.jd.com/43546434008.html')a_s = dri.find_elements_by_xpa...
2019-06-03 22:08:36
6726

原创 用selenium驱动浏览器往下滑动,刷新全部数据,实现所有数据都可获取
意义:用selenium访问浏览器时,该网站可能只给你上半部分的数据,爬虫也只能获取这些数据了,你需要滑动到下面,它才给你返回下半部分的网页数据。这样就可以获取到该页面的全部数据。scrollTop=8000的8000是可以自己调整,是指明要滑动的距离(单位:像素) 。在self.dri.get(‘https://search.jd.com/Search?keyword=华为手机&e...
2019-05-30 11:07:53
6772
4
原创 anaconda jupyter notebook themes install jupyter notebook样式更改,取消页面头部,全屏展示!
anaconda中的jupyter notebook主题更改以及教训
2024-10-24 12:21:11
509
原创 pd.merge()避免重置下标 df.loc[] = df 更换中间所有行但不改变顺序 比append,pd.concat()高级,行插入全部列
‘’‘goal:fill df1[df1.C.isnull()] into df.C.values depend on the same A.values,通常来说只需要通过append就能解决,但如果该df不在首尾,而是在中间某处,最好就采取df1.loc[nullDF.index] = addC’’’import pandas as pdimport numpy as npdf = pd.DataFrame({'A':[1,2,3,5],'B':[2,3,4,5],'C':[9,10,4,5]})
2022-03-23 19:27:52
525
原创 df.loc[df[].index,] df.loc[,] 关于df.loc[] 的问题。df.loc 容易出现的错误 下标筛选问题
易错细节问题
2022-03-21 18:46:42
1652
原创 pandas sort_values 原理 排序异常 行上下关系改变 多列排序解决
import pandas as pdimport numpy as npqualDe = pd.read_excel('t1.xlsx',engine='openpyxl')num = 'U06211002309'df = qualDe[qualDe.col1.str.contains(num)]df col1 col22700 U06211002309 2.02701 U06211002309A 1.02702 U06211002309B 2.02703 U062110023
2022-02-15 19:36:04
1283
原创 ‘bool‘ object is not iterable
# 针对网上置顶的好些文章不靠谱,我再写一篇。# 'bool' object 中文意思布尔值对象,在Python中True和False就是布尔值。# 布尔值是表示真(对)或假(错)。# 问题复现如下,看见该报错是表达了布尔值即True,False不支持被dict,list,tuple 等方法做处理。for i,j in zip([True],[False]): print(i,j) print(i==j) print(str(i)) print(dict(j)) #
2022-01-27 17:35:12
6632
原创 python 简单基础笔记
# 类传参的方式,函数方法调用类参数 函数传参class fa(object): o = 444 def __init__(self,n): self.m = 333 self.n = n def ca(self,k): print('k:',k) print('m:',self.m) print('n:',self.n) print('o:',self.o)
2021-12-06 19:10:23
538
原创 往Excel 同一个sheet追加数据 添加数据 一个Excel写入多个不同sheet
通过和大佬们的讨论以及实践发现,网上很多Excel追加数据是没法做到的,按他们的复制粘贴后运行也会出错。报错有:zip file…l.; sheet xxx already exist…。可以插入并生成不同的sheet,就是无法在同一个sheet中添加数据,如今集众人之智慧制作出这个简单的好方法,方便大家使用。import reimport pandas as pdimport numpy as npfrom openpyxl import load_workbookfrom openpyxl.u
2021-12-04 15:49:10
2355
原创 SQL 字段间判断 做行列比较
start_week <= week and week <= end_week让数据库对week列的每个数值做判断,必须在[start_week,end_week]内才能显示,这样就能展示出每一期的有效记录。(以前通常都是用字段与数值或字符作判断,其实字段之间也能做判断)...
2021-11-19 20:07:57
706
原创 解决程序语句错误 找bug 业务问题的方法 流程
明确目标,罗列解决流程,一步步推导和排查问题所在,锁定具体范围后先默认语句逻辑都正确,找到问题数据的归属后锁定具体语句,再想出错的原因。思路真的很重要。有收获的希望麻烦给个点赞...
2021-11-19 20:03:26
202
原创 Python替换多个字符串 replace替换多个
s = "123456"for key, value in {"1": "a", "4": "b","6":"c"}.items(): s = s.replace(key,value)print(s)
2021-11-19 19:59:54
2069
原创 pandas Excel一次写入多个表格 读多个表格 简洁代码
import pandas as pdfilePath = r'C:\\Users\Administrator\Desktop\\21aa.xlsx'dfL = [aF,bF,cF,dF,eF]sheetL = ['a','b','c','d']vL = ['av','bv','cv','dv']writer = pd.ExcelWriter(filePath)for i,j in zip(dfL,sheetL): i.to_excel(writer,j,index=False)wr
2021-11-19 19:48:35
554
原创 qualT_qual.groupby(‘recommend‘) 等分组可用变量来代替
qQGf = qualT_qual.groupby('recommend')qualT_qual.groupby('recommend').first()['member_x'].values==qQGf.first()['member_x'].values#无论是.index还是.values,都全部返回True。
2021-11-19 19:38:52
172
原创 df.groupby().first() 和 df.drop_duplicates() 去重方法对比
dr = data[['recommend']]drF = dr.groupby(dr.recommend).first().reset_index() # 162dF = dr.drop_duplicates()drF.values==dF.valuesout:array([[False],[False],[False],…[False],[False]])但通过我自己写的数组对比程序发现drF和dF的recommend元素是完全一样。猜测是因为它们的排序不同,导致drF.valu
2021-11-19 19:36:47
932
原创 数组找关系(数学归纳法)找出数组之间的关系式以及理解
nL = [1,2,3,4,5,6,7 ,8]rL = [2,3,5,6,8,9,11,12]要求找出nL和nL各元素n,r的一一对应关系,分别生成r=n??, n=r??print([i-j for i,j in zip(rL,nL)])[1, 1, 2, 2, 3, 3, 4, 4]f = (n+1)//2 ,可随n += 2,f += 1,but f start with 2, n+1,else if n//2,n=1 -> f=0;r = n+(n+1)//2n为奇数时
2021-11-19 19:19:02
643
原创 pandas 数组相加 表和表之间做行值相加
1,下标相同的才有值版:s = An+Bns[s.index=='U01070']len(s) == len(Bn) + len(An) - len(Bn[Bn.index.isin(An.index)])# 两者共同的下标。…省略了输出值,其中 True表示相同下标,它们在相加后展示出来且值也相加了,但下标不同的值因缺少相加对象,故相加后值为NaN。2,下标相同的才相加,否则就不变**(推荐)**:baN = Bn[Bn.index.isin(An.index)]baN.values
2021-11-19 19:15:39
1262
原创 # 换列 列位置变换语句
语句1(推荐):dst.insert(loc=dst.shape[1]-4, column='department', value=dst.pop('department'), allow_duplicates=False)语句2:mC = dst.pop('department')dst.insert(loc=dst.shape[1]-3, column='department', value=mC, allow_duplicates=False)差别:语句2 除了稍微长一点,还会出现因为d
2021-11-19 18:46:22
257
原创 ValueError: Columns must be same length as key dataframe一次插入多列
ValueError: Columns must be same length as key 报错不仅限于列值不一致时,还会由于赋值方法不对而报错,比如不能一次赋值多列。d={ 'NUM' : range(3), 'C' : ['c1','c2','c3']}df = pd.DataFrame(data=d)# df[['D']] = [1,2,3]# df[['D','E']] = {'D':[1,],'E':[2]}# df.loc[:,['D','E']] = [1,2,3],[2,
2021-08-18 17:27:38
19396
原创 Python正则 匹配英文字母和中文 只选取匹配的部分内容
import restr = 'class="input">Dzp-动作片<!---->'a = re.findall(r'([A-Za-z]+)\-[\u4e00-\u9F5A]+',str)print(a)[‘Dzp’]^((?!(动作片)).)*$反选则没成功,有待大佬指点##############[\x{4e00}-\x{9fa5}]+sublime text 选取和Python或有些出入,应该是用Java的正则表达式。...
2021-08-06 18:11:23
690
原创 df2=df 改变会影响另一个 互相独立的办法
df2=dfdf2.loc[:,"id"]=35#随后发现df也被改变了import copya = [1, 2, 3]b = a# 把下面2行注释并运行会发现a,b改变数据后会影响彼此b = copy.deepcopy(a) #避免办法1:深拷贝,让b与a相互独立(值相同,但在内存中的ID不同)# a = [1, 2, 3] #办法2:让a重新指向后,b就会指向a指向的对象,而非a本身a[2] = 67b[0] = 99print(a)print(b)print(id(a))
2021-07-17 11:23:42
385
原创 Ubuntu CapsLock 大小写混乱 无法切换大小写
windows7+ vmware15 player+ubuntu18.04 CapsLock打开就无法关闭(一直大写偶尔小写),要等一段时间才会关闭,展开ubuntu右上角的语言栏 > 显示键盘布局 就可看到CapsLock一直在跳动。猜测Ubuntu ibus无法切换小写原因应是:CapsLock有延迟,与windows上的CapsLock关闭有冲突。采用网上的失败方案如下:1,长按CapsLock至少3秒即可关闭(说不定是我的版本不允许,但每次都要长按3秒也慢)2,终端输入:ibus-
2021-07-13 11:46:25
5969
原创 No axis named 2 for object type DataFrame iloc 和[ ]区别
我的报错原因是错误用df.iloc() 作df.iloc[]d = {'id':[1,1,2,3,3,4,3,4,1,5],'product':['p2','p1','p3','p2','p1','p3','p4','p5','p6','p5']}df = pd.DataFrame.from_dict(d)dfdf.iloc(2) # it should be df.iloc[2],not df.iloc(2)!ValueError: No axis named 2 for object t
2021-07-05 16:42:48
6945
1
原创 列表数组找重复值归类组合
pass_al = [[6,1,7],[6,1,7],[6,2,7],[6,3,7],[6,3,7],[6,4,7],[6,3,7],[6,4,7],[6,1,7],[6,5,7],[6,2,7]]pas_a_order = ['p2','p1','p3','p2','p1','p3','p4','p5','p6','p5','p8']dealer = ['PLW48150306', 'V14090921', 'PLW48150306', 'RUC29210220', 'KZA86210612', 'P
2021-07-03 20:46:46
347
原创 dataframe 分组groupby显示方法 (单纯显示,无其它操作如sum,mean)
#总结这是纯显示分组的最佳方法df.groupby('id').apply(lambda x:x[:]).drop(axis=1,columns='id',inplace=False) import pandas as pdd = {'id':[1,1,2,3,3,4,3,4,1,5],'product':['p2','p1','p3','p2','p1','p3','p4','p5','p6','p5']}df = pd.DataFrame.from_dict(d).reset_index(d
2021-07-03 18:37:11
3655
1
原创 tmp_快速搜索引擎.txt
https://www.baidu.com/baidu?&ie=utf-8&wd=优快云搜索:https://so.youkuaiyun.com/so/search/s.do?t=all&s=&tm=&v=&l=&u=&q=写博客:https://mp.youkuaiyun.com/console/editor/html简书:https://www.jianshu.com/writer#/notebooks/39740786/notes/56517413
2021-04-15 15:35:29
491
原创 RecursionError: maximum recursion depth exceeded
folium 画点连线for d in loc_dic: for j in d: folium.Polygon( [d[j], j], color="red", ).add_to(map)报错误:RecursionError: maximum recursion depth exceeded一开始我 参考了结果发现没用,怎样都报错.以为是电脑性能不行(也确实不行),换线上kesci 帮忙运算,结果一样
2021-02-26 19:32:00
346
原创 word 把部分|区域的内容 绑|固定 在一起
找了半天都找不到答案,原来是自己的叫法错误,应问组合,在word中想把多个内容都能以固定的顺序排列并随鼠标一起拖动,就要插入一个文本框框住这一系列的内容 > shift+鼠标选中多个内容 > 鼠标右键 > 组合 > 组合...
2021-01-01 12:13:51
776
原创 python的方法不能命名为自变量,否则会导致方法没法用
>>> str[]>>> [globals().pop(var) for var in dir() if not var.startswith("__")][[]]>>> str<class 'str'>>>> str(111)'111'>>> str = []>>> str[]>>> str(111)Traceback (most recent
2020-12-10 11:48:01
185
原创 pyechart和eplot运行不显示图形 / 无法可视化
重启服务器,重新运行也如此。solution:无意间发现点一下刷新网页或键盘 ctrl+r 就行了,不需要安装什么包或下载什么文件。可能是打开该文件时,后台对eplot,pyechart运行也生成相应的js代码,但网页刚开始卡顿还是什么的,没能执行好就不显示,需要重新刷新一次网页才能全部理顺。(日后对于这类很小的问题,不是缺了什么或存在bug的原因,只是机器某次没做好,那就再运行一次,必须要认识到,机器也会有出错的时候,多做点重新运行、重启、刷新或者不确定但应该没明显坏处的尝试操作,就是简单有效的方法
2020-11-14 08:32:38
1003
原创 正则匹配给找到的单词字符加引号
limit_infor,campaign_type,campaign_level,product_level,resource_amount,email_rate,price,discount_rate,hour_resouces,campaign_fee,orders在sublime 文本上要给上诉单词加引号:find: (\w+)replace: '$1'python的方法暂时没找出来,希望能提供建议谢谢。import rest = "limit_infor,campaign_type,
2020-11-11 12:34:20
465
原创 sudo apt install nvidia 后无法进入登录界面 /Ubuntu无法进入登录界面 亲测有效!
reference: https://zhidao.baidu.com/question/311614778.htmlhttps://blog.youkuaiyun.com/chichoxian/article/details/52738857为让jupyter-notebook 服务器运行大文件不会挂掉而按网上教程安装显卡,结果发现显卡不兼容导致死机建议别随便 sudo apt-get install nvidia-390 等,否则它可能会和你的本机显卡gdm什么的冲突,你的linux就很卡顿,可能像我那样开机
2020-11-02 11:03:33
632
原创 linux-swap 设置了新uuid 导致没有uuid
UUID: (New UUID - will be randomly generated)、解决办法:因GParted 支持撤销操作,所以ctril+z即可,或者按界面上的撤销键。提醒: 以后要多留心观察和尝试,避免把简单的事情复杂化。如果是按Linux下swap分区没有UUID解决办法 这些文章来解决那就麻烦了。...
2020-10-30 09:07:58
620
原创 VmwareDnD 内容可以删除
Ubuntu (Linux)中//tmp/VmwareDnD 内容的内容其实就是从宿主机(Windows)复制粘贴文件到Ubuntu 的临时存放地点,比如拷贝中途发现磁盘存储不够,报错并中断传输,会在VmwareDnD 存留未传送完毕的文件,要删除掉,否则会白白占用系统的空间。https://www.linglom.com/virtualization/clean-vmwarednd-folder/也说明能删除,但我根据他给的路径在我的Windows 上找不到相应的文件夹。只好在Linux的终端输入p
2020-10-27 12:15:07
2873
原创 github搜找文件的技巧
1,在正确的路径下:https://github.com/wesm/pydata-book,点击Code的界面,按 t 键(不分大小写,Code以外的界面无法这样做),输入P00000001-ALL.csv 后回车就可自动进入https://github.com/wesm/pydata-book/blob/2nd-edition/datasets/fec/P00000001-ALL.csv...
2020-10-07 11:18:30
1604
原创 搜索规律 (csdn)
1.搜:2012联邦选举委员会出现第7~8位的标题链接:数据分析实战(五):2012年联邦选举委员会_南山想做Data…python数据聚合分组实战—2012联邦选举委员会数据库 目录数据来源:根据职业和雇主统计赞助信息对出资额分组根据州统计赞助信息数据来源:https://github.com/wesm/p…2.搜:2012年联邦选举委员会出现第3位的标题链接:数据分析实战(五):2012年联邦选举委员会_南山想做Data…数据分析实战(五):2012年联邦选举委员会南山以南青如山 2019
2020-09-29 13:10:59
500
原创 ExcelAPInet-Addln.xll的文件格式和扩展名不匹配 自动打开ExcelAPInet-AddIn-packed.xll
尝试过的解决办法及效果:1,参考了http://club.excelhome.net/thread-1378653-1-1.html 的建议:把后缀改成.TXT就行了,随后发现问题:1.1,把ExcelAPInet-AddIn-packed.xll改为ExcelAPInet-AddIn-packed.txt 后,再次打开excel,弹框显示:无法找到 ExcelAPInet-AddIn-packed.xll,是否可能被移动、重命名或删除?1.2,即使我私自把加载项里的ExcelAPInet-AddIn
2020-09-25 11:17:36
3379
2
我的提问怎么找到?找了好久。。。。。。。。。
2020-12-15
pycharm 如何运行剩余代码
2020-11-17
为什么搜索简介和点进去的不同?进入标题代表的文章,但简介内容是其它文章的
2020-09-29
在网上放置自己的浏览器cookies和User-Agent是否安全?
2020-09-09
请问这个数据分析报告写得怎么样?
2020-08-21
power bi 画直方图与实际数据不符合是什么原因?
2020-08-09
**请问怎么找到相关有效的链接?还请提供以及说出你是怎么找到的?** 重赏!
2020-07-23
power bi 无法加载excel原因是什么?
2020-07-17
为什么虚拟环境pip install 只能安装在真实环境中 而且没法卸载干净?
2020-04-02
virtualenv 和 mkvirtualenv 有什么区别?分布在哪些情况下用?
2019-11-10
python2有easy_install 但是却无法使用是怎么回事?
2019-11-06
Windows似乎未能正确加载 电量突然为0
2019-10-24
我做数据挖掘和爬虫,请问Windows10哪个版本会更好?
2019-10-23
程序员用Windows10哪个版本好?
2019-10-22
为什么我的vmware点击没反应,其它的桌面应用点击都可以打开。
2019-10-12
为这个列表推导式什么无法去重?
2019-09-25
请问下面的题答案是?以及为什么?
2019-09-25
为什么不能把div下的class值都捕捉到
2019-09-22
证书都没有却能抓APP的包
2019-08-28
夜神模拟器没法安装fiddler证书怎么办?
2019-08-09
linux 里的fiddler怎么设置工具栏的字体大小
2019-08-08
我选择的行业和岗位恰好是第1名,未来3年内会不会竞争压力很大?怎么办?
2019-07-28
请问AI行业有哪些就业方向以及各领域下面有哪些具体的岗位?
2019-07-28
AI专业的就业方向及具体岗位有哪些?
2019-07-25
更新⼀遍数据要多久?
2019-07-08
基于xxxx是什么意思啊?
2019-06-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人