我想提取列Col1、Col2和Col3的所有唯一值组合。假设有以下数据帧df:
df=
Col1 Col2 Col3
12 AB 13
11 AB 13
12 AB 13
12 AC 14
答案是:
唯一=
Col1 Col2 Col3
12 AB 13
11 AB 13
12 AC 14
我知道如何获取特定列的唯一值,即df.Col1.unique(),但不确定是否存在唯一组合
有一种方法可用于此-pandas.DataFrame.drop\u duplicates:
>&燃气轮机&燃气轮机;df.drop_duplicates()
Col1 Col2 Col3
0 12 AB 13
11 AB 13
3 12 AC 14
您也可以在原地执行
>&燃气轮机&燃气轮机;df.删除重复项(就地=真)
&燃气轮机&燃气轮机&燃气轮机;df
Col1 Col2 Col3
0 12 AB 13
11 AB 13
3 12 AC 14
如果需要获取某些列的唯一值:
>&燃气轮机&燃气轮机;df[['Col2','Col3']].删除重复项()
COL2COL3
AB:13第0页
3 AC 14
> @ JZRAEL建议,您也可以考虑使用子集参数>代码> DROPUPDATICATE()<:
>&燃气轮机&燃气轮机;drop_duplicates(子集=['Col2','Col3'])
Col1 Col2 Col3
0 12 AB 13
3 12 AC 14