1、换行符使用\,在使用换行符也可以实现换行,用三引号、小括号,中括号,大括号
2、多元赋值(x,y,z)=(1, 2,3)
3、判断两个对象是否是同一个,用is或者is not
4、序列类型(字符串、列表、元组)反转可以用a[::-1]。列表连接可以用+,但是用extend来连接效率会快些。用a[begin_index:end_index]形式时,end_index]是不包含在内的
5、涉及到日期时间时,需要导入from datetime import datetime
6、python中while(for) /else语句,有点例外,当循环正常结束时,会执行else,如果中间break,就不会
7、list列表用 *n时,表示重复原来list的n个
8、用循环时,可以用for item in list 或者for index, item in enumerate(list)
9、3.x版本中输出不换行不空格,用print(a, sep='', end='')
10、map(f,list) 类型于[f(x) for x in list]
11、对于list,可以使用递推式来创建列表,即list comprehension
12、python中的*和**有特殊含义,在函数调用时和声明有着不两只的行为。*表示的是元组或列表,**表示字典
13、python2.*输入可以用raw_input和input, 而python3.x输入只能使用 input
14、在[]中使用推导式生成的是list对象, 用()中使用推导式生成的是generator对象
15、()用来表示元组tuple,[]表示列表数据类型list,{}表示字典数据类型dict。使用dict时,如果字典中没有指定key时,设置默认值,可以使用dict.get(key, default)
16、pandas中的DataFrame.value_counts对于矩阵型表示时,其返回的对应的是矩阵的计数,即最后一列表示的是计数值,参考[DataFrame.value_counts](pandas.DataFrame.value_counts — pandas 2.2.3 documentation)
17、pandas中的DataFrame由index和columns表示,即是以列向量为基础,比如
df = pd.DataFrame(dict(age=[5, 6, np.nan],
born=[pd.NaT, pd.Timestamp('1939-05-27'),
pd.Timestamp('1940-04-25')],
name=['Alfred', 'Batman', ''],
toy=[None, 'Batmobile', 'Joker']))
df.columns输出为Index(['age', 'born', 'name', 'toy'], dtype='object')
18、缺失值使用
missing = train.isnull().sum() //返回的类型为Series
missing = missing[missing > 0]
19、pandas中的concat,默认是延x轴拼接,无论对象是以tuple还是list形式提供
20、zip将两个可迭代对象组织成元组构造的列表,当两个可迭代对象长度不一致时,以长度小的为准
21、string使用format时,如果希望输出大括号,使用{{和}}