如何获得特定列的所有唯一值组合

我想提取列Col1Col2Col3的所有唯一值组合。假设有以下数据帧df

df=
Col1 Col2 Col3
12 AB 13
11 AB 13
12 AB 13
12 AC 14

答案是:

唯一=
Col1 Col2 Col3
12 AB 13
11 AB 13
12 AC 14

我知道如何获取特定列的唯一值,即df.Col1.unique(),但不确定是否存在唯一组合

有一种方法可用于此-pandas.DataFrame.drop\u duplicates

&gt&燃气轮机&燃气轮机;df.drop_duplicates()
Col1 Col2 Col3
0 12 AB 13
11 AB 13
3 12 AC 14

您也可以在原地执行

&gt&燃气轮机&燃气轮机;df.删除重复项(就地=真)
&燃气轮机&燃气轮机&燃气轮机;df
Col1 Col2 Col3
0 12 AB 13
11 AB 13
3 12 AC 14

如果需要获取某些列的唯一值:

&gt&燃气轮机&燃气轮机;df[['Col2','Col3']].删除重复项()
COL2COL3
AB:13第0页
3 AC 14

> @ JZRAEL建议,您也可以考虑使用子集参数>代码> DROPUPDATICATE()<:

&gt&燃气轮机&燃气轮机;drop_duplicates(子集=['Col2','Col3'])
Col1 Col2 Col3
0 12 AB 13
3 12 AC 14

发表评论