TensorFlow入门教程:18:Iris数据集的线性回归训练
这篇文章使用实际的统计数据来确认对线性回归的曲线拟合的效果,Iris数据集中花瓣的长度和宽度之间的关系满足明显的线性关系,这里我们将使用前文多次使用的方式来对Iris数据进行分析。
Iris数据集
四个特征
每条数据都从鸢尾花的如下四个特征进行描述
特征 | 说明 |
---|---|
Sepal.Length | 花萼长度 |
Sepal.Width | 花萼宽度 |
Petal.Length | 花瓣长度 |
Petal.Width | 花瓣宽度 |
花瓣长度 x 花瓣宽度
数据load
使用如下方式加载训练数据
from sklearn import datasets
irisdata = datasets.load_iris()
xdata = irisdata.data[:,2]
ydata = irisdata.data[:,3]
示例代码
liumiaocn:tensorflow liumiao$ cat basic-operation-14.py
import tensorflow as tf
import numpy as np
import os
import matplotlib.pyplot as plt
from sklearn import datasets
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
irisdata = datasets.load_iris()
xdata = irisdata.data[:,2]
ydata = irisdata.data[:,3]
print("init modole ...")
X = tf.placeholder("float",name="X")
Y = tf.placeholder("float",name="Y")
W = tf.Variable(-3., name="W")
B = tf.Variable(3., name="B")
linearmodel = tf.add(tf.multiply(X,W),B)
lossfunc = (tf.pow(Y - linearmodel, 2))
learningrate = 0.01
print("set Optimizer")
trainoperation = tf.train.GradientDescentOptimizer(learningrate).minimize(lossfunc)
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)
index = 1
print("caculation begins ...")
for j in range(100):
for i in range(100):
sess.run(trainoperation, feed_dict={X: xdata[i], Y:ydata[i]})
if j % 10 == 0:
print("j = %s index = %s" %(j,index))
plt.subplot(2,5,index)
plt.scatter(xdata,ydata)
labelinfo="iteration: " + str(j)
plt.plot(xdata,B.eval(session=sess)+W.eval(session=sess)*xdata,'b',label=labelinfo)
plt.legend()
index = index + 1
print("caculation ends ...")
print("##After Caculation: ")
print(" B: " + str(B.eval(session=sess)) + ", W : " + str(W.eval(session=sess)))
plt.show()
liumiaocn:tensorflow liumiao$
执行&确认
线性拟合曲线的计算过程:
线性回归计算结果
##After Caculation:
B: -0.29767135, W : 0.39057708
总结
根据实际的期待输入和输出,这篇文章利用了实际的数据对于线性模型的确认进行了验证。