Pandas
https://www.jianshu.com/p/7ac36fafebea
series: 一维
dataframe: 二维
Excel
https://jingyan.baidu.com/article/b7001fe19422f50e7282dd0c.html
DataFrame.set_index()
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.set_index.html
pandas DataFrame 根据多列的值做判断,生成新的列值
https://blog.youkuaiyun.com/qq_30565883/article/details/79464266
从excel或者csv文件中读取文件,不需要加index_col=0才可以按列读取
DataFrame.drop
.drop() 返回的是一个新对象,元对象不会被改变
删除行 df.drop([0,1,2…]) or df.drop(index=[0,1,2…]) drop后会生成一个新的dataframe
删除列 df.drop(columns=[a,b,…]) or df.drop([a,b…],axis=1)因为默认是0,所以删除列时一定要加上axis=1
Numpy
https://time.geekbang.org/column/article/73756
避免隐式拷贝,避免采用隐式拷贝,而是采用就地操作的方式。
set() list[] 字典和集合的性能高
正则表达式学习
https://regexone.com/lesson/character_ranges
tool: https://regex101.com/
如何用Python和正则表达式抽取文本结构化信息?
抽取几个房间
href="https:..www.panpacificseattle.com.accommodations\/([a-z]*-)*([a-z]*)\/
time
命名文件名包含当前时间
https://blog.youkuaiyun.com/hdandan2015/article/details/78719915
DataFrame to list
https://datatofish.com/convert-pandas-dataframe-to-list/
Convert list to DataFrame
https://datatofish.com/list-to-dataframe/