我正在研究一个不平衡类的分类问题(5%1)。我想预测课程,而不是概率
在二进制分类问题中,scikit的分类器.predict()默认使用0.5?
如果没有,默认的方法是什么?如果是,我该如何更改它
在scikit中,一些分类器具有class\u weight='auto'选项,但并非所有分类器都具有该选项。使用class\u weight='auto',是否将.predict()使用实际人口比例作为阈值
在像多项式nb这样的不支持类权重的分类器中,该怎么做?除了使用predict_proba()然后自己计算类之外
可以使用clf.predict\u proba()设置阈值
例如:
来自sklearn.tree导入决策树分类程序的
clf=DecisionTreeClassifier(随机状态=2)
clf.fit(X_系列、y_系列)
#y_pred=clf.predict(X_测试)#默认阈值为0.5
y_pred=(clf.predict_proba(X_test)[:,1]>;=0.3)。aType(bool)#将阈值设置为0.3