- 博客(14)
- 收藏
- 关注
原创 python学习笔记(pandas2)
处理方式2:填充数据,t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)处理0的数据:t[t==0]=np.nan(不是每次为0都要处理,计算平均值等情况,nan是不参与计算的,但是0会。处理方式1:删除NaN所在的行列dropna(axis=0,how='any',inplace=False)判断是否为NAN:pd.isnull(df).pd.notnull(df)a、空,None等,在pandas是NaN(和np.nan)一样。
2024-08-26 22:47:46
220
原创 python学习笔记(pandas)
numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能处理其他类型的数据。DataFrame:二维,Series容器。1、pandas的dataframe的创建。一、series和读取外部数据。Series:一维,带标签组。Series的索引和值。二、dataframe。
2024-08-18 19:54:11
133
原创 python学习笔记(numpy中nan的常用方法)
什么时候numpy会出现nan:读取本地文件为float时,若有缺失,就会出现nan,或者当做了一个不合适的计算的时候(比如无穷大(inf)减去无穷大)什么时候出现inf包括(-inf,+inf):比如一个数字除以0,(python中会直接报错,numpy中是一个inf或者-inf)犹豫替换会影响均值,故一般的方式是把缺失的数值替换成均值(中值)或者是直接删除有缺失值的一行。四、numpy中的填充nan和youtube数据的练习。三、numpy中的nan和常用统计方法。1、numpy中的nan和inf。
2024-08-18 19:54:03
409
原创 python学习笔记(数据分析2)
运用场景:用户的年龄分布状态,一段时间内用户点击次数的分布状态,用户活跃时间的分布状态。应用场景:不同条件维度之间的内在关联关系、观察数据的离散聚合程度。一般来说能够使用plt.hist方法的是那些没有统计过的数据。应用场景:数量统计,频率统计(市场饱和度)
2024-08-11 20:45:35
197
原创 python学习笔记(numpy1)
计算是遵循广播原则:如果两个数组的后缘维度(trailing dimension,即从末尾开始算起的维度的轴长度相符或其中一方的长度为1,则认为它们是广播兼容的。在numpy中可以理解为方向,使用0,1,2.数字表示,对于一个一维数组,只有一个0轴,对于2维数组(shape(2,2)),有0轴和1轴,对于三维数组(shape(2,2, 3)),有0,1,2轴。In [40]:a=np.array ([1,0,1,0],dtype=np.bool) 或者使用dtype='?二、numpy读取本地数据和索引。
2024-08-11 20:45:16
1708
原创 python数据分析(学习笔记)
一、matplotlib:主要做数据可视化图标。1、matplotlib的基础绘图。能将数据进行可视化,更直观的呈现。能使数据更加客观具有说服力。基础绘图和调整x轴的刻度。设置显示中文和设置图形信息。
2024-08-04 23:09:49
177
原创 学习笔记--python(6,数据可视,数据库)
基础语法:insert into表[(列1,列2,......,列N)] values(值1,值2,…....,值N)[,(值1,值2, ……...,(值1,值2,....,值N)]若插入数据不想手动commit确认,可在构建链接对象时设置自动commit属性 ,即在password下一行加上 autocommit=True# 自动提交。单行注释:-- 注释内容(--后必须有空格)或者 # 注释内容(#后推荐加上空格)1、sql支持注释、大小写不敏感。2、基础时间线柱状图的构建。1、基础柱状图的构建。
2024-07-28 20:21:56
221
原创 学习笔记--python(5、多线程,服务器端客户端)
backlog为int整数,表示允许的连接数量,超出的会等待,可以不填,不填会自动设置一个合理值(4)接收客户端连接,获得连接对象。re.match(匹配规则,被匹配字符串):从被匹配字符串开头进行匹配,匹配成功返回匹配对象(包含匹配的信息),不成功返回空。search(匹配规则,被匹配字符串):搜索整个字符串,找出匹配的,从前向后,找到第一个后停止,整个字符串找不到返回None。findall(匹配规则,被匹配字符串):匹配整个字符串,找出全部匹配项,找不到返回空list:[]
2024-07-21 20:41:57
1460
原创 学习笔记--python(4、json、数据可视化)
4.通过label_opts=LabelOpts(position="right")设置数值标签在右侧显示。或者[{"name":"Ami","age":19},{"name":"Toi","age":19}](1)JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据。2.和折线图一样,通过add Xaxis()和add yaxis()添加x和y轴数据。3.通过柱状图对象的: reversal_axis(),反转×和y轴。(3)python数据和json数据互相转化。
2024-07-21 20:41:35
187
原创 学习笔记--python(3、--数据容器,函数返回值,类与对象)
可以容纳条个数据,可以容纳不同类型的数据,每一份数据是Keyvalue键值对,可以通过Key获取到Value,Key不可重复(重复会覆盖) 不支持下标索引,可以修改(增加或删除更新元素等) ,支持for循环,不支持while循环。表示从序列中,从指定位置开始,依次取出元素,到指定位置结束,得到一个新序列: 起始下标表示从何处开始,可以留空,留空视作从头开始·结束下标(不含)表示何处结束,可以留空,留空视作截取到结尾.步长表示,依次取元素的间隔。(1)序列是指:内容连续、有序,可使用下标索引的一类数据容器。
2024-07-21 20:40:53
497
原创 学习笔记--python(2,列表、元组)
有哪些:list(列表)、tuple(元组)、str(字符串)、set(集合)、dict(字典)列表.index(元素):查找指定元素在列表的下标,找不到报错ValueError。列表.insert(下标,元素) :在指定下标处,插入指定的元素。列表.remove(元素) :从前向后,删除此元素第一个匹配项。列表.count(元素):统计此元素在列表中出现的次数。(1)定义元组:(元素,元素,元素,......)(1)定义语法:[元素1,元素2......]列表.pop(下标) :删除列表指定下标元素。
2024-07-14 21:17:10
327
原创 学习笔记--python(1)
在嵌套循环中,只能作用所在的循环上,无法对上层循环起作用。range(num1,num2,step)(从num1开始,到num2结束,不含num2本身,步长以step值为准)type()语句得到数据类型,带有返回值,可以用print直接输出或用变量储存结果值。range(num1,num2)(从num1开始,到num2结束,不含num2本身)注意:归属于if和else语句的代码块,都需在前方填充4个空格缩进。range(num)(从0开始,到num结束,不含num本身)不用return语句即返回None;
2024-07-14 21:16:40
1405
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人