获取多个列的唯一值,将其作为新的数据帧显示在pandas中

拥有至少包含C1、C2、C3列的熊猫数据帧df,如何将所有唯一的C1、C2、C3值作为一个新的数据帧

换句话说,类似于:

选择C1、C2、C3
从T
按C1、C2、C3分组

试过了

打印df.groupby(by=['C1','C2','C3'])

但是我越来越

<位于0x000000000769A9E8的pandas.core.groupby.DataFrameGroupBy对象>

我相信您需要删除重复项如果您想要所有唯一的三元组:

df=df.drop_重复项(子集=['C1'、'C2'、'C3'])

如果需要,请使用groupbyaddfirst

df=df.groupby(by=['C1','C2','C3',as_index=False)

发表评论