使用pandas中的nunique函数计算dataframe每一行数据的独特值个数是一项重要的任务。下面我来为大家详细介绍这一操作步骤及对应的源代码。
首先,我们需要导入pandas库,并使用read_csv函数读取我们需要处理的csv文件。如下所示:
import pandas as pd
df = pd.read_csv('data.csv')
接下来,我们可以使用nunique函数计算行中的独特值个数。例如,我们有一个包含三列数据的dataframe,我们可以使用以下代码计算每一行的独特值个数:
unique_count = df.nunique(axis=1)
print(unique_count)
在上述代码中,axis=1表示我们对每一行进行操作,而不是对每一列进行操作。
最后,我们可以将结果保存到一个新的列中,如下所示:
df['unique_count'] = unique_count
print(df)
完整的代码如下所示:
import pandas as pd
df = pd.read_csv('data.csv')
unique_count = df.nunique(axis=1)
df['unique_count'] = unique_count
print(df)
以上是使用pandas中的nunique函数计算dataframe每一行数据的独特值个数的详细介绍及相应的源代码。