我在pandas中有一个数据框,其中每个列都有不同的值范围。例如:
df:
A B C
1000 10 0.5
765 5 0.35
800 7 0.09
知道我如何规范化这个数据帧中每个值都在0和1之间的列吗
我期望的输出是:
A B C
1 1 1
0.765 0.5 0.7
0.80.70.18(即0.09/0.5)
使用熊猫的一个简单方法是:(这里我想使用平均标准化)
标准化的_df=(df.mean())/df.std()
要使用最小-最大规格化,请执行以下操作:
标准化的_df=(df.min())/(df.max()-df.min())
编辑:为了解决一些问题,需要说明Pandas在上面的代码中自动应用了按列函数