目录
conda,anaconda 或 miniconda有什么关系
1. 背景/安装/使用
pythony安装一般有两种方式
anaconda相对比较方便一点
anaconda说明
如何知道自己是否安装了anaconda
conda --version
conda,anaconda 或 miniconda有什么关系
miniconda有Jupyter Notebook吗
如何去查看conda的环境
CUDA 和conda有关系吗
如何查看minconda的安装地址
minconda中的每一个文件夹是干什么的
jupyter
一般jupyter会在anaconda中自带
但我没有安装anaconda,我只有minconda
我在minconda中创建了一个环境
打开
然后运行
conda create -n jupyter_env python=3.9
然后激活环境并安装jupyter
conda activate jupyter_env
conda install jupyter
下面配置环境变量
jupyter --version
上面就成功了
下面我们在想要存放文件的文件夹下输入jupyter notebook
复制这里的网页就可以了
这样就可以了
这里可以新建我们的notebook
一般不建议在搜索栏去启动
我们可以在磁盘下面新建一个目录
然后输入jupyter notebook
如果没有出现,可能是没有配置环境
这个时候
我们新建的东西,都会出现在这个目录下面
我们这里创建一个notebook
下面就生成了ipynb的文件
我们将其它的ipynb文件放到这个目录下面
jupter下面就会出现
下面我们将要处理的数据放进去运行
将数据复制粘贴进去
按住shift+回车键
执行成功后
就能在编译器内,对其执行一系列的操作
任务就是使用Python将每天的广告数据处理正确
然后再整合到Excel表格中
2.数据类型
3.变量与赋值
4.数据结构
列表[ ]
字典{ }
5.检索/访问
6.数据实操
roi就是投入产出比
7.for循环
将历史数据复制到一个txt文件中
然后再jupyter中读取它
上面是字符串格式的,我们转换一下格式
下面要将历史数据和ad数据结合到一起
8.if语句
下面筛选一下roi >=1 数据
9.自定义函数
==================================================================================================================================================
===========================
10.模块/包
11.series/dataframe
上面两个series体现在Excel表格中是
dataframe就是有多个series构成
12.读取/导出
数据导出
导出的数据,多了一行索引
索引消失
以csv的格式导出
有很多问题
如果一定到导出为csv的格式
13.访问/筛选
访问
筛选
如果要返回process >= 100000的行
去重
keep为first,就会去重后保留第一次出现的数据
last,保留最后一次
上面的相当于一个视图
如果要真实替代原来的数据,则
14.轴/合并/连接
轴axis
将上面两个data数据合并
下面我们将Excel和concat_demo根据uid做一个join操作
下面做一个类似于left join 和right join的操作
15.排序和匿名函数
如果我们要进行一个多条件的排序
Excel中是
Python中
false为降序,默认为升序
如果要先升后降
==================================================================================================================================================
匿名函数
16.分组、聚合、转换
分组
聚合
如果我们要看多个聚合结果
======================
转换
d倒序
17.字符串方法
split
contains
replace
extract提取
18.绘图
19.map/apply/applymap
map
当我们的操作对象为series的时候
使用map
apply
20.项目一:办公自动化
本地文件不是目前办公的主流
如果是企业微信、钉钉或者飞书
我们可以ctrl+A全选
复制粘贴到公司的在线文档中
21.项目二:探索分析
合并数据表
时间处理
用折线图展示每个月有多少弹幕
用折线图展示每个月有多少人发弹幕
我们继续下钻
我们继续分析一下星期的,发现工作日发弹幕反而比较活跃
下面比如我想看看
哪些发了很多弹幕的人,具体发了哪些东西(行为分析)
看看发了很多弹幕的人,b站的等级是多少(属性分析)
我们看一下用户发弹幕数量的排名
看看第一名(老大)都发了一些什么
看看第二名(老二)都发了一些什么
看看第三名(老三)都发了一些什么
上面用户的行为分析就结束
===================================================
===================================================
下面我们看看等级分布
===================================================
===================================================
我们发现在p1的第29分钟是最高的