- 博客(34)
- 资源 (1)
- 收藏
- 关注
原创 将生成的pandas DataFrame数据写入excel的指定位置
DataFrame格式数据想要写入excel的指定位置,比如第三行的第二列,网上的方法基本是使用to_excel直接写入,这样写入的位置就是固定的,不能指定位置。通过openpyxl灵活设置的方式写入数据,这种方式对传统的中国式报表设置很友好。
2023-02-20 17:03:28
7323
原创 python 一维列表转多维列表
数据需要是双层列表的结构,使用的是to_numpy().tolist()方法对数据进行转化,数据中首先使用透视表对数据进行了透视处理,然后通过该方法转换,发现转换之后没有没有表头,于是乎只有自己拼接表头,表头是一个一维的列表,数据是双层列表,类似这种。现在需要将表头转化成。
2022-12-14 00:45:00
771
原创 使用Python自动生成带有图表文字的PDF(附带万字完整代码)
目录1、前言2、数据取数与Reportlab包说明3 、导入PDF生成相关包4、初始化函数封装5、PDF页脚6、PDF页眉7、PDF封面8、PDF正文内容:表格9、PDF正文内容:图表以及展示布局10、生成PDF生成文件样本案例,本次模板生成偏向于PPT页面比例,如果要用使用A4纸张大小的页面可以自行进行设置,设置的参数会在后续代码中介绍,参考文档可以查看文件:https://download.youkuaiyun.com/download/sinat_39027078/87260262生成的文件示例如下图截图所示,生
2022-12-13 11:58:16
816
原创 统计学中基础概念之为什么需要统计学
目录1、研究背景与原始数据2、提出假设2.1 数据收集工具2.2 研究者预期3、假设检验3.1 描述统计3.1.1 集中趋势度量3.1.2 离散性的度量3.2 推断统计统计学实际上是一个工具,用于检验想法。研究的问题:害羞以及其他个性特征与暴力行为是否可能存在一定的联系;原始数据:实际分数或其他测量数据。本次案例数据来自于突然杀人犯研究的19名狱犯的数据,其中突然杀人犯组有10名狱犯,杀人惯犯组有9名狱犯。女性化——男性化 BSRI自我过度控制 MMPI一般数据分析之前会提出假设
2022-12-06 18:01:17
456
原创 【pandas】文本处理:如何将相同ID的字符串进行合并以及合并之后重命名
原始数据中ID对应多个文本数据,现在需要将ID下面的文本进行合并。在工作中曾经遇到过这样的场景,有一批客户,客户用客户ID表示,每个客户下面有很多条评论,需要将客户的评论进行合并,然后对客户的评论进行文本挖掘。思路和下面的思路一样。
2022-11-17 18:03:34
1078
原创 gensim 安装出错解决
网上找了很久这个问题的解决办法,都不没有解决,我的这个问题大概是是因为我的python 环境有多个,多个python有不同的安装路径,导致在安装的时候找不到路径。我的解决办法,下载gensim对应的版本(对应版本的查看可以在命令行中输出python 可查看python 对应的版本)把gensim 中.whl文件下载到python.exe所在的文件夹下,然后在命令行输入。出现这个问题一般是环境不匹配导致的。
2022-11-14 11:06:28
4345
2
原创 我的创作纪念日一周年
第一次使用优快云是刚毕业参见工作的那一年,注册了但是一直没有正经的使用,第一次发布文章到优快云是那会刚刚学习机器学习,就把学习笔记发布到优快云了,时间一转眼就是一年了,这一年因为慢慢学着把学习的过程以及一些技术要点整理输出成文章,而有了很大的收获。因为在平台上输出,也经常浏览大佬的文章,收获真的太大,发现优快云真的是一个很好的学习场所,用好它可以解决很多工作中的问题。未来核心技术的掌握一定是发展的关键,好好加油学习,夯实基础,做好技术在场景的应用吧,加油。1、随着不断的输出整理对知识点有了。
2022-11-09 15:06:32
158
4
原创 ValueError: Dimensions of labels and X must be compatible
ValueError: Dimensions of labels and X must be compatible
2022-10-24 17:12:34
7326
原创 /Applications/anaconda3/bin/python.app: line 3: 17787 Segmentation fault: 11 /Applications/anaconda
首先检查pycharm中系统环境配置首先将环境调整成python3的环境,或者anaconda 中的环境。这种错误是因为matplotlib 版本问题,直接把原来的卸载,然后在安装最新的版本我的问题就解决了。我的程序是因为在使用matplotlib 时候出的错误。pycharm 中系统环境配置。或者在pycharm中卸载。我的程序还会报下面的错。
2022-10-13 23:59:01
681
原创 Python map()使用详解
将传入的function作用到iterable中的每一个元素中,并将结果组成新的列表(python2)/迭代器(python3)返回。在python3中要返回列表需要在进行一步操作
2022-10-10 06:00:00
240
原创 Python Strip()使用详解
strip()函数功能:默认删除字符前后的空格,如果有指定字符删除自定字符前后指定字符。注意,该函数只能删除字符前后的字符,不能删除字符中间的字符。
2022-10-09 10:03:56
1023
原创 Python Pandas.Dataframe缺失值处理方法
pandas 缺失值判断以及常用的缺失值处理的方法。常用的处理方法有删除缺失值、将缺失值填充成0,以及使用向上填充和向下填充的方法。
2022-10-01 07:00:00
4036
原创 Python pyecharts 数据可视化
pyecharts:python 调用echarts库,echarts 是开源的可视化工具,有丰富的图表展示功能。
2022-09-22 20:00:00
5390
2
原创 python 相关分析
关联分析用于考察变量间数量关联密切程度的统计分析方法,比如身高越高,体重一般会越大。几乎所有涉及到多个变量的假设检验方法,都可以被看做是这些变量间的关联性分析。
2022-09-20 16:49:36
7952
原创 Python 操作excel之字典应用
python 字典的基本操作,包括字典的特征以及一些典型的应用;常见的结合zip函数应用;在实际工作中的应用场景
2022-09-16 16:00:00
1133
原创 Python中if与while的区别以及break与continue的应用
Python中if与while的区别以及break与continue的应用;以及python 操作excel的实际应用案例,可以更好的理解break的应用以及精进python操作exce的应用
2022-09-15 11:26:12
3362
原创 Python 自动化报表格式设置
报表自动化中excel的格式处理时其中很总要的一部分,以下内容为常见的python操作excel的格式处理。【设置单元格的背景色】
2022-07-21 17:09:53
269
原创 TypeError: detail_staff_visit() missing 1 required positional argument: ‘self‘
python 在调用类的时候报错detail_staff_visit = TeamAumWeek.detail_staff_visit() #报错TypeError: detail_staff_visit() missing 1 required positional argument: 'self'因为TeamAumWeek是类,TeamAumWeek()是类的对象调整为detail_staff_visit = TeamAumWeek().detail_staff_visit()相
2022-05-30 16:11:05
88
原创 reportlab中如何完成pdf的分页
1.背景发现在向PDF中添加内容的时候,分页只能在每页的内容填满之后才能分页,最开始是在每页的内容中填写很多的分行符<br/>2.使用可以直接在添加的内容后面,想要分页的地方添加PageBreakdoc = SimpleDocTemplate('test.pdf'), topMargin=40,bottomMargin=20)elements = [] #创建一个空列表用于存放table = [[1,2,3,4],[5,6,7,8]]elements.append(.
2022-05-27 18:22:10
1146
原创 python to_numpy()方法 AttributeError: ‘tuple‘ object has no attribute ‘to_numpy‘
最近在使用reportlib库生成PDF,表格部分使用该函数对数据进行转换,转换成指定格式以生成PDF中的表格。对数据产生以下错误:AttributeError: 'tuple' object has no attribute 'to_numpy'to_numpy()方法将数据转换为一个Numpy 数组该方法中有三个参数:1、dtype:传递的数据类型,这个类型一般使用的是 DataFrame、Series 格式2、copy:是否保存数据副本3、na_value:可选用于缺失值
2022-04-11 10:11:31
12238
原创 办公自动化——python操作excel
办公自动化工作中更多时候数据源还是excel表格,怎样快速处理这些表格,以便后续分析数据,将是一项基本的技能
2022-01-25 09:34:43
1615
原创 机器学习分类问题(信用卡案例)
sk-learn 中StratifiedShuffleSplit() 函数功能:提供分层抽样功能幕确保每一个标签对应的样本的比例参数说明n_splits:将训练数据分为train/test对的组数,默认为10 test_size/train_size:用来设置train/test对中train和test所占的比例,如设置train_size =0.8 test_size =0.2 random_state:随机种子,便于每次抽样的数据一样,便于调试 shuffle:是否随机打乱n
2021-11-09 16:56:43
1933
Python自动生成PDF工具Reportlab
2022-12-09
RGB颜色速查大全表格
2022-09-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人