测试了使用pd.DataFrame、np.ndarray、pd.Series、python的dict
对索引速度进行测试
df[i][o],
Series[i],
df.loc[o,i],
df.at[o,i],
np.ndarray[i,o]索引
dict[i]字典索引。
发现速度从上到下依次递增,字典比loc快了100倍,但内存占用是硬伤(约28倍)。
ndarray具有极高的性价比,速度比loc快了几十倍(字典的1/6),且内存占用小。
但是ndarray似乎只能进行数字位置的索引,而不能进行键值对索引。
具体耗时
直接索引: 2.000201463699341
at索引: 0.5521032810211182
loc索引: 0.9783310890197754
字典索引: 0.013957738876342773
Series索引: 1.5390639305114746
np.ndarrary索引: 0.06183576583862305
2020-12-01
最新推荐文章于 2024-09-05 09:30:03 发布
对pd.DataFrame、np.ndarray、pd.Series、python的dict进行索引速度测试,涉及df[i][o]、Series[i]等多种索引方式。发现索引速度依次递增,字典索引最快但内存占用大,ndarray性价比高,速度快且内存占用小,不过只能数字位置索引。还给出了具体耗时数据。
1128

被折叠的 条评论
为什么被折叠?



