我在.csv文件中有一个数据集(dataTrain.csv和dataTest.csv),格式如下:
温度(K)、压力(ATM)、压缩系数(Z)
273.1,24.675,0.806677258
313.1,24.675,0.888394713
...,...,...
并能够使用以下代码建立回归模型和预测:
将熊猫作为pd导入
从sklearn导入线性_模型
dataTrain=pd.read_csv(“dataTrain.csv”)
dataTest=pd.read_csv(“dataTest.csv”)
#打印df.head()
x_列=数据列['温度(K)]。重塑(-1,1)
y_列=数据列[‘压缩系数(Z)’]
x_测试=数据测试['温度(K)]。重塑(-1,1)
y_测试=数据测试[‘压缩系数(Z)’]
ols=线性模型。线性回归()
模型=ols.fit(x\U系列、y\U系列)
打印模型预测(x_检验)[0:5]
然而,我想做的是多元回归。因此,模型将是压缩因子(Z)=截距+coef*温度(K)+coef*压力(ATM)
如何在scikit学习中做到这一点
如果上面的代码适用于单变量,请尝试以下操作
将熊猫作为pd导入
从sklearn导入线性_模型
dataTrain=pd.read\u csv(“dataTrain.csv”)
dataTest=pd.read\u csv(“dataTest.csv”)
#打印df.head()
x_列=数据列[['温度(K)''压力(ATM)]]。到_numpy()。重塑(-1,2)
y_列=数据列[‘压缩系数(Z)’]
x_test=dataTest['温度(K)''压力(ATM)]]。到numpy()。重塑(-1,2)
y_测试=数据测试[‘压缩系数(Z)’]
ols=线性模型。线性回归()
模型=ols.fit(x\U系列、y\U系列)
打印模型预测(x_检验)[0:5]