step1:数据预处理

1)导入库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

dataset =pd.read_csv('studentscores.csv')
X = dataset.iloc[:,:1].values
Y = dataset.iloc[:,1].values

from sklearn.model_selection import train_test_split
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size =1/4 , random_state = 0)

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train,Y_train)

Y_pred = regressor.predict(X_test)
print(Y_pred)

[16.84472176 33.74557494 75.50062397 26.7864001  60.58810646 39.71058194
 20.8213931 ]

plt.scatter(X_train,Y_train,color='red')
plt.plot(X_train,regressor.predict(X_train),color = 'blue')

100-Days-Of-ML-Code 第二天简单线性回归

plt.scatter(X_test,Y_test,color = 'red')
plt.plot(X_test,regressor.predict(X_test),'blue')

100-Days-Of-ML-Code 第二天简单线性回归
注意：scatter 画散点图
加载线性模型 from sklearn.linear_model import LinearRegression