以前有人问过这个问题,但我仍然无法理解如何根据我想要设置的条件实际分割python系列/熊猫数据帧
在R中,我想做的是:
df[which(df[,colnumber]>;somenumberrichoose),]
函数的作用是:查找数据帧中大于SomeNumberChoose的列中的行条目的索引,并将其作为向量返回。然后,我使用这些行索引对数据帧进行切片,以指示我希望在新表单中查看数据帧的哪些行
在python中是否有一种等效的方法来实现这一点?我看到了对enumerate的引用,在阅读文档后我还没有完全理解。现在获取行索引的示例如下所示:
indexfuture=[x.index(),枚举中的x(df['colname']),如果x>;昨天]
然而,我不断得到一个无效的语法错误。我可以通过对值进行循环和手动搜索来解决问题,但这似乎极不符合pythonic,效率也很低
enumerate()到底做什么?在向量中找到满足所需参数的值的索引的python方法是什么
注意:我使用熊猫作为数据帧
我可能不太明白这个问题,但看起来回答比你想象的要容易:
使用数据帧:
df['colname']>;一些鱼类
返回包含真/假值和数据帧原始索引的系列
然后,您可以在原始数据帧上使用该布尔序列,并获得要查找的子集:
df[df['colname']>;somenumberrichoose]
应该足够了
看http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-索引