正式学习python的第0天 -优快云博客

本文为Python初学者提供了全面的学习资源，涵盖了类、实例、方法、属性的基础概念，深入讲解了Pandas库中loc、iloc和ix索引的使用技巧，str的内置方法，concat和merge数据合并方式，布尔型索引的运用，以及drop_duplicates()函数的实践。通过丰富的代码示例，帮助读者快速掌握Python编程的关键技能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习写代码的第N天（实际上第0天）

正式开启被男朋友魔鬼训练的第一天，看大神们的代码来学习python，欢迎查收20181218的学习心得~

摘要

类，实例，方法，属性的概念
loc，iloc和ix索引的使用
str的内置方法
concat和merge的使用
布尔型索引
duplicates（）的使用
方法是否有返回值

一、类，实例，方法，属性的概念
https://blog.youkuaiyun.com/weixin_31678985/article/details/79723750
目前是看别人的讲解，后续会出自己的心得版啦~（挖坑中。。。。。。）

二、loc，iloc和ix索引的使用

2.1、使用说明

 loc是索引列标签和行标签（也就是index和columns）
 iloc是索引列号和行号（行号和列号都是从0开始的序列）
 ix是既可以索引行标签，也可以索引列标签

2.2、举例说明

import pandas as pd
data = pd.DataFrame(data = {'X': [1, 2, 3, 4, 5, 6, 7, 8], 
                            'Y': [11, 12, 13, 14, 15, 16, 17, 18]},
                    index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
print(data)
#四种方式索引第一行数据
print(data.loc['a'])
print(data.iloc[0])
print(data.ix['a'])
print(data.ix[0])

#四种方式索引第一列数据
print(data.loc[:, ['X']])
print(data.iloc[:, [0]])
print(data.ix[:, ['X']])
print(data.ix[:, [0]])

#四种方式索引多行数据。注意：行号或者列号索引是左闭右开，行标签或者列标签索引是左闭右闭（详见2.3.2）
print(data.loc['a':'b'])
print(data.iloc[0:2])
print(data.ix['a':'b'])
print(data.ix[0:2])   #此时ix是切片索引

#四种方式索引多列数据。索引单列时列需要加上中括号，索引多列时列不需要加上中括号
print(data.loc[:, 'X':'Y'])
print(data.iloc[:, 0:2])
print(data.ix[:, 'X':'Y'])
print(data.ix[:, 0:2])   #此时ix是切片索引

2.3、两个小问题

2.3.1、索引index重复的情况
当DataFrame的index重复的时候用loc和ix同时索引行和列可能会出错（出错原因有待探讨）。建议使用iloc来索引。（注意：DataFrame的index可以重复，但是columns不能重复，如果有重复列名则该列值会被最后一次出现此列的值替代）

import pandas as pd
data = pd.DataFrame(data = {'X': [1, 2, 3, 4, 5, 6, 7, 8],
                            'Y': [11, 12, 13, 14, 15, 16, 17, 18]},
                    index = [0, 1, 0, 1, 0, 1, 1, 0])
print(data)
#同时索引行和列的时候
print(data.loc[0:1, 'X':'Y'])    #出错无法运行
print(data.ix[0:1, 'X':'Y'])     #出错无法运行

print(data.iloc[0:2, 0:2])     #索引前2行前2列

import pandas as pd
data = pd.DataFrame(data = {'X': [1, 2, 3, 4, 5, 6, 7, 8],
                            'Y': [11, 12, 13, 14, 15, 16, 17, 18]},
                    index = [0, 1, 1, 1, 1, 1, 1, 1])
print(data)
#同时索引行和列的时候
print(data.loc[0:1, 'X':'Y'])    #可以运行
print(data.ix[0:1, 'X':'Y'])     #可以运行

print(data.iloc[0:2, 0:2])     #索引前2行前2列

2.3.2、iloc和loc, ix索引不都是切片索引

import pandas as pd
data = pd.DataFrame(data = {0: [1, 2, 3, 4, 5, 6, 7, 8],
                            1: [11, 12, 13, 14, 15, 16, 17, 18],
                            2: [21, 22, 23, 24, 25, 26, 27, 28]},
                    index = [0, 1, 2, 3, 4, 5, 6, 7])
print(data)

print(data.iloc[0:2, 0:2])    #索引前2行前2列
print(data.loc[0:2, 0:2])     #索引前3行前3列
print(data.ix[0:2, 0:2])      #索引前3行前3列

通过上述例子可以发现iloc索引是切片索引，即左闭右开，loc索引是左闭右闭，但是ix有时候是左闭右开，有时候是左闭右闭，可能这就是现在都不推荐使用ix的原因吧~

三、str的内置方法

https://www.jianshu.com/p/e2d48c64b404
这个博客写出了Python中str的所有内置方法，有需求可以去上面查看~

四、concat和merge的使用

4.1、concat常用参数说明

参数	说明
objs	参与连接的列表或字典，且列表或字典里的对象是pandas数据类型，唯一必须给定的参数
axis	默认是0，0代表index，1代表columns
join	默认是outer（并集），inner是交集
ignore_index	忽略连接轴上的索引，产生一组新索引range（length）

4.2、merge常用参数说明

参数	说明
right	参与连接的DataFarme
how	默认inner，可选：{‘left’, ‘right’, ‘outer’}，
on	用于连接的列名，必须同时存在于两个DataFrame中，如果未指定，则以left和right列名的交集作为连接键
left_on	左侧DataFarme中用作连接键的列
right_on	右侧DataFarme中用作连接键的列
left_index	将左侧DataFarme的行索引用作其连接键
right_index	将右侧DataFarme的行索引用作其连接键

4.3、举例说明

import pandas as pd
data_1 = pd.DataFrame(data = {'X': [1, 2, 3],
                            'Y': [11, 12, 13]})
data_2 = pd.DataFrame(data = {'Z': [ 4, 5, 6],
                            'Y': [11, 12, 19]})
print(data_1)
print(data_2)
print(data_1.merge(data_2, on='Y', how='inner'))   #内连接，取交集
print(data_1.merge(data_2, on='Y', how='outer'))   #外连接，取并集，没有值部分补充NaN
print(data_1.merge(data_2, on='Y', how='left'))    #左连接，以左边作为连接基础，右边可丢弃或补充NaN
print(data_1.merge(data_2, on='Y', how='right'))   #右连接，以右边作为连接基础，左边可丢弃或补充NaN

结果如下：

import pandas as pd
s1 = pd.Series([0, 1, 2], index = ['a', 'b', 'c'])
s2 = pd.Series([2, 3, 4], index = ['c', 'f', 'e'])
s3 = pd.Series([4, 5, 6], index = ['c', 'f', 'g'])
print(pd.concat([s1, s2, s3]))  #直接连接所有表
print(pd.concat([s1,s2,s3],ignore_index = True))  #生成新的索引

结果如下：

五、布尔型索引
布尔型索引可以索引Series，list或者数组，不能索引DataFrame。布尔型索引结果是一个布尔型数组。

六、drop_duplicates（）的使用

import pandas as pd
data = pd.DataFrame({'A':[1, 1, 2, 2], 'B':['a', 'a', 'b', 'b']})
print(data)
data.drop_duplicates(inplace = True)
print(data)

结果如下：

七、方法是否有返回值

#无返回值的方法
data = [1, 2, 5, 7, 3, 4]
a = data.sort()
print('data的结果是:',data)
print('a的结果是:',a)

#有返回值的方法
Str = 'ABCdefgh'
a = Str.replace('ABC', 'abc')
print('Str的结果是:',Str)
print('a的结果是:',a)

结果如下：