1.
df1 = pd.read_csv('aa.txt')
df1.columns = ['id', 't1', 't2']
df2 = pd.read_csv('bb.txt')
df = df1[df1['id'].isin(df2['id'])]
print('join_set_rate = %.6f' % (len(df) / len(df1)))
本文介绍了一种使用Python pandas库进行两个CSV文件之间的ID关联的方法,并计算了关联比率。通过简单的代码示例,展示了如何读取文件、筛选共同ID并评估关联程度。
1.
df1 = pd.read_csv('aa.txt')
df1.columns = ['id', 't1', 't2']
df2 = pd.read_csv('bb.txt')
df = df1[df1['id'].isin(df2['id'])]
print('join_set_rate = %.6f' % (len(df) / len(df1)))
5255

被折叠的 条评论
为什么被折叠?