
Python_数据分析
文章平均质量分 96
Python_数据分析
十六ᵛᵃᵉ
AGI爱好者!AGI革命进行时!!数仓&可视化&数据分析
展开
-
14_业务分析介绍&15_Python报表自动化&18_AB测试实战&19_用户偏好分析和TGI&20_同期群分析
掌握数据指标的概念知道常见的业务指标含义知道业务分析常用方法论知道通过数据分析能够解决哪些业务问题在之前的课程中,我们学习了FineReport, FineBI, SQL, Python, 它们都属于数据分析要用到的工具,接下来我们就要结合业务场景,综合运用这些工具,来完成一些具体任务。数据分析/大数据分析的目的是为了用数据驱动运营,用数据驱动业务增长(数据驱动设计,数据驱动决策,数据驱动XXX……),原创 2024-12-31 12:05:01 · 1444 阅读 · 0 评论 -
Python数据分析_Pandas_日期类型处理_7
概述和其它语言类似, Python内置了datetime对象,可以在datetime库中找到pandas的日期时间类型默认是 datetime64[ns]实例代码Python中的-日期时间类型# 导包from datetime import datetime # 这个是原生Python包的内容# 场景1: 演示Python中的 日期时间类型# 1. 获取当前时间# 2. 可以手动设置日期.# 3. 计算两个日期差.Pandas中的-日期时间类型# 1. 加载: 疫情期间的 埃博拉数据.原创 2024-12-30 21:13:45 · 936 阅读 · 0 评论 -
Python数据分析_RFM案例_6.2
会员价值度用来评估用户的价值情况,是区分会员价值的重要模型和参考依据,也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生,衡量的是有实体转化价值的行为。常用的价值度模型是RFMRFM模型是根据会员最近一次购买时间R(Recency)购买频率F(Frequency)购买金额M(Monetary)计算得出RFM得分通过这3个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分RFM模型基于一个固定时间点来做模型分析,不同时间计算的的RFM结果可能不一样RFM。原创 2024-12-29 20:52:30 · 957 阅读 · 0 评论 -
Python数据分析_Pandas_分组_会员数据分析_6.1
在实际生产场景中,比如销售数据分析,透视表可以帮助快速识别最畅销的产品、最佳销售时段或最有效的销售渠道,从而为决策提供直观的数据支持。总之,透视表是数据探索和报告制作中的得力助手,它能够帮助用户从复杂的数据集中提炼出关键信息,以高效、灵活的方式展现数据分析的结果,助力于洞察趋势和制定策略。简单来说,透视表是数据分析中的“变形金刚”,它能将繁琐的数据表格转换成清晰、动态的汇总视图,让数据背后的故事一目了然。df.groupby([“分组列名”])[“聚合列名”].聚合函数()计算每个月 线上线下的会员增量。原创 2024-12-29 20:46:44 · 856 阅读 · 0 评论 -
Python数据分析_Pandas_分组_5
apply自定义函数向量化函数及Lambda表达式分组操作相关分组聚合分组转换分组过滤DataFrameGroupBy对象介绍概述当Pandas自带的API不能满足需求, 例如: 我们需要遍历的对Series中的每一条数据/DataFrame中的一列或一行数据做相同的自定义处理, 就可以使用Apply自定义函数apply函数可以接收一个自定义函数, 可以将DataFrame的行/列数据传递给自定义函数处理。原创 2024-12-27 20:43:17 · 580 阅读 · 0 评论 -
Python数据分析_Pandas_数据组合和缺失值处理_4
简介好多数据集都含缺失数据。缺失数据有多重表现形式数据库中,缺失数据表示为NULL在某些编程语言中用NA表示缺失值也可能是空字符串(’’)或数值在Pandas中使用NaN表示缺失值NaN,NAN,nan,他们都一样缺失值和其它类型的数据不同,它毫无意义,NaN不等于0,也不等于空串数据中出现缺失值是很常见的计算的过程中, 两个表join 可能会有缺失原始的数据中也有可能直接带着缺失值数据处理和模型训练的时候, 有很多场景要求必须先把缺失值处理掉,想处理缺失值先要在数据中找到缺失值。原创 2024-12-26 21:01:24 · 1214 阅读 · 0 评论 -
Python数据分析_Pandas_数据分析入门_3
DataFrame读写文件DataFrame加载部分数据DataFrame分组聚合计算DataFrame常用排序方式DataFrame案例-链家数据分析。原创 2024-12-25 19:47:33 · 1029 阅读 · 0 评论 -
Python数据分析_Pandas_数据结构_day2
Pandas数据结构介绍创建Series对象# 翻译: 系列创建DataFrame对象# 翻译: 数据框架Series常见操作常用属性常用方法布尔索引运算DataFrame常见操作常用属性常用方法布尔索引运算更改操作导入和导出操作图解解释DataFrame可以把DataFrame看作由Series对象组成的字典,其中key是列名,值是SeriesSeriesSeries和Python中的列表非常相似,但是它的每个元素的数据类型必须相同。原创 2024-12-24 16:16:25 · 1049 阅读 · 0 评论 -
Python数据分析_day_1
Python作为当下最为流行的编程语言之一可以独立完成数据分析的各种任务数据分析领域里有海量开源库机器学习/深度学习领域最热门的编程语言在爬虫,Web开发等领域均有应用与Excel,PowerBI,Tableau等软件比较Excel有百万行数据限制PowerBI ,Tableau在处理大数据的时候速度相对较慢Excel,Power BI 和Tableau 需要付费购买授权Python功能远比Excel,PowerBI,Tableau等软件强大。原创 2024-12-24 11:36:28 · 727 阅读 · 0 评论 -
Python_正则表达式、pymysql模块-8
能够知道在Python中使用正则要导入的模块;【了解】re模块能够使用re模块匹配单个字符【重点】\d \w能够完成从MySQL中读取出数据【重点】查询: execute()、fetchall()能够将数据写入MySQL数据库【重点】插入数据: execute() sql = insert into xxx==目标:==了解什么是正则表达式?正则表达式,也叫做规则表达式,通常会说成【正则】。原创 2024-12-23 20:20:57 · 807 阅读 · 0 评论 -
Python_拷贝、闭包、装饰器-7
能够知道类属性,类方法,静态方法的使用掌握闭包的构成条件【重点】有嵌套有引用有返回能够知道装饰器的使用【重点】 @装饰器名==目标:==掌握函数的快速使用。在之前的学习中,已经学习过函数。一起来看看简单和综合函数语法格式。# 定义def 函数名():代码...# 调用函数名()# 定义def 函数名([参数1, 参数2, 参数3, ...]):代码...[return 值]# 调用函数名([值1, 值2, 值3, ...])(1)先定义,后调用;原创 2024-12-20 01:29:46 · 888 阅读 · 0 评论 -
Python_面向对象-6
知道类的概念类是模板知道对象的概念对象就是通过模板创建出来的实体知道使用class关键字定义一个类class 类名(object):pass能够说出调用对象中的方法的语法格式。对象名.方法名([参数列表])能够说出私有权限的作用==目标:==了解常见的编程思想有哪些?先来看看什么是思想?比如,乌鸦喝水、猴子吃椰子等。说明:我们会发现,有了思想,就能解决很多问题。类似的,编程思想就是:利用计算机来解决实际编程问题的一种思维方式。原创 2024-12-18 23:59:23 · 1245 阅读 · 0 评论 -
Python_文件操作、异常、模块-05
能够知道文件的使用步骤【了解】a.打开文件b.读/写数据c.关闭文件能够掌握如何以读的方式打开文件【重点】能够知道什么是异常【了解】程序报错能够知道try-except的作用【重点】捕获异常能够知道import的作用【重点】导入模块==目标:==了解什么是文件?如果要操作具体的文件以及文件内的数据内容,一起来看看文件类型。如果要操作具体的文件以及文件内的数据内容,一起来看看文件类型。说明:(1)目录就是可以用于存放多个文件、目录的集合;[os模块]原创 2024-12-16 16:20:07 · 955 阅读 · 0 评论 -
Python函数-4
能够操作字典的遍历知道字典遍历的相关函数能够知道函数的作用【了解】解决代码重复、提升阅读性能够知道如何定义函数【重点】def 函数名(参数列表):代码代码能够知道如何调用函数【重点】函数名(参数列表)能够知道什么是函数的说明文档【了解】给函数做多行注释能够知道如何交换两个变量的值【了解】a,b = b,a==目标:==了解函数中的几个概念。在Python函数中,有几个重要概念:(1)函数名(2)参数(3)返回值为了更好的理解函数的几个概念。原创 2024-12-15 21:05:06 · 883 阅读 · 0 评论 -
Python容器-3
能够知道如何定义一个字符串【重点】使用双引号引起来: 变量名 = “xxxx”能够知道切片的语法格式【重点】[起始: 结束]掌握如何定义一个列表【重点】使用[ ]引起来: 变量名 = [xx,xx,…]能够说出4个列表相关的方法【了解】能够知道元组的特点【了解】只能查找,不能添加、不能删除、不能修改.字典的定义和使用==目标:==了解Python容器是什么?在现实生活中,我们知道容器是用来存放东西的,比如实验室里的烧杯等。原创 2024-12-13 20:53:24 · 1110 阅读 · 0 评论 -
Python流程控制-2
能够知道加减乘除在计算机中怎么使【了解】运算符: 加减乘除能够知道if语句的作用【重点】条件判断能够知道while语句的作用;[重点]反复多次执行效果, 循环能够说出while循环的语法格式【了解】初始化变量while 条件循环体语句修改循环条件的语句能够说出for循环的作用。【了解】循环。原创 2024-12-12 19:50:31 · 964 阅读 · 0 评论 -
Python环境搭建与输出输入-1
=目标:==了解什么是Python注释?注释指的是:在程序中,对代码进行解释说明的文字。当在Python程序中,注释了某些文本内容,运行Python时,会绕开该注释信息,而不会被Python解释器识别。Python注释的作用:对程序代码进行解释说明,这样让别人可以看懂代码的作用,增强了程序的可读性。说明:程序员是个矛盾体。为了更加直观地观察到注释的效果,一起来看看是否添加注释的两个示例。原创 2024-12-11 19:53:20 · 1104 阅读 · 0 评论 -
day06-Pyecharts数据分析可视化图表
Echarts是个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可. 而Python是门富有表达力的语言,很适合用于数据处理. 当数据分析遇上数据可视化时pyecharts 诞生了.原创 2024-11-26 16:51:20 · 2318 阅读 · 0 评论 -
PyCharm常见快捷键
文章目录PyCharm常见快捷键汇总==常用快捷键==全部快捷键1、编辑(Editing)2、查找/替换(Search/Replace)3、运行(Running)4、调试(Debugging)5、导航(Navigation)6、搜索相关(Usage Search)7、重构(Refactoring)8、控制VCS/Local History9、模版(Live Templates)10、基本(General)PyCharm常见快捷键汇总常用快捷键快捷键功能Ctrl + Q快速查看文原创 2024-11-26 16:30:46 · 1159 阅读 · 0 评论 -
day05-Python中的函数
所谓的函数就是一个被命名的独立的、完成特定功能的代码段(一段连续的代码),并可能给调用它的程序一个返回值。被命名的:在Python中,函数大多数是有名函数(普通函数)。当然Python中也存在没有名字的函数叫做匿名函数。独立的、完成特定功能的代码段:在实际项目开发中,定义函数前一定要先思考一下,这个函数是为了完成某个操作或某个功能而定义的。(函数的功能一定要专一)返回值:很多函数在执行完毕后,会通过return关键字返回一个结果给调用它的位置。原创 2024-11-26 16:25:22 · 894 阅读 · 0 评论 -
day04-Python数据容器
字符串是 Python 中最常用的数据类型。我们一般使用引号来创建字符串。创建字符串很简单,只要为变量分配一个值即可。案例1:使用单引号或双引号定义字符串变量案例2:使用3个引号定义字符串变量'''"""注意:三引号形式的字符串支持换行操作案例3:思考如何使用字符串定义"I’m Tom"使用单引号情况运行结果:出现以上问题的主要原因在于,以上字符串的定义代码出现了(syntax)语法错误。原创 2024-11-26 16:11:40 · 863 阅读 · 0 评论 -
day03-Python中的循环结构
现实生活中,也有很多循环的应用场景:(1)食堂阿姨打菜:接过顾客的餐盘→询问菜品→打菜→递回餐盘,重复以上过程,直到所有顾客的菜都打完了(2)快递员送快递:查看送件地址→赶往目的地→电话告知收件人→收件人签收→交快递件,重复以上过程,直到所有需要送的快递都处理完了。(3)公交司机……(4)作业流程…………有条件地重复地做一件事,每一次做的事情不同但类似。程序是为了解决实际问题的,实际问题中存在着重复动作,那么程序中也应该有相应的描述,这就是循环。合使用,else下方缩进的代码指的是。原创 2024-11-26 14:56:16 · 1373 阅读 · 0 评论 -
Day02之Python运算符与if结构
数据类型转换方法一共学了4个方法:int() :转整型float() :转浮点类型str() :转字符串类型eval() :把字符串转换为原数据类型记住:① 如果一个字符串 * 数字,代表对这个字符串进行复制操作 ② 当float浮点类型转换为int整型时,其小数点后面的数据会丢失,一定要记住这个特性。 ③ 字符串转数值类型,字符串中的数据必须是有意义的数值就是用于简化if…else…语句。锦上添花的代码,有它可以做开发,没有它也可以做开发。原创 2024-11-26 14:39:45 · 1088 阅读 · 0 评论 -
day01-Python环境搭建与输入输出
在开发领域,计算机资源可以分为两部分:软件资源 + 硬件资源软件资源:看得见,摸不着硬件资源:看得见,摸得着硬件资源(CPU、内存、硬盘、风扇、电源、键盘、鼠标…)软件资源(Office办公软件、网易云音乐、各种各样的计算机游戏)思考:我们发现,软硬件之间其实是可以交互的,这是什么原理呢?答:使用操作系统,操作系统是计算机软硬件之间的桥梁思考问题:操作系统是软件资源还是硬件资源呢?答:操作系统也是一个特殊的软件资源!!!变量名称 = 变量的值。原创 2024-11-26 13:32:23 · 1354 阅读 · 0 评论