在花了数天未能使用神经网络进行Q学习之后,我决定回到基础知识,并进行简单的函数逼近,以查看一切是否正常工作,以及某些参数如何影响学习过程。
这是我想到的代码

from keras.models import Sequential
from keras.layers import Dense
import matplotlib.pyplot as plt
import random
import numpy
from sklearn.preprocessing import MinMaxScaler

regressor = Sequential()
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform', input_dim=1))
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))
regressor.add(Dense(units=1))
regressor.compile(loss='mean_squared_error', optimizer='sgd')
#regressor = ExtraTreesRegressor()

N = 5000
X = numpy.empty((N,))
Y = numpy.empty((N,))

for i in range(N):
    X[i] = random.uniform(-10, 10)
X = numpy.sort(X).reshape(-1, 1)

for i in range(N):
    Y[i] = numpy.sin(X[i])
Y = Y.reshape(-1, 1)

X_scaler = MinMaxScaler()
Y_scaler = MinMaxScaler()
X = X_scaler.fit_transform(X)
Y = Y_scaler.fit_transform(Y)

regressor.fit(X, Y, epochs=2, verbose=1, batch_size=32)
#regressor.fit(X, Y.reshape(5000,))

x = numpy.mgrid[-10:10:100*1j]
x = x.reshape(-1, 1)
y = numpy.mgrid[-10:10:100*1j]
y = y.reshape(-1, 1)
x = X_scaler.fit_transform(x)

for i in range(len(x)):
    y[i] = regressor.predict(numpy.array([x[i]]))

plt.figure()
plt.plot(X_scaler.inverse_transform(x), Y_scaler.inverse_transform(y))
plt.plot(X_scaler.inverse_transform(X), Y_scaler.inverse_transform(Y))


问题是我所有的预测值都在0左右。如您所见,我使用了来自sklearn的ExtraTreesRegressor(带注释的行)来检查协议是否正确。那么我的神经网络怎么了?为什么不起作用?

(我要解决的实际问题是使用神经网络计算山地车问题的Q函数。它与该函数逼近器有何不同?)

最佳答案

通过这些更改:


激活到relu
删除kernel_initializer(即保留default 'glorot_uniform'
亚当优化器
100个纪元




regressor = Sequential()
regressor.add(Dense(units=20, activation='relu', input_dim=1))
regressor.add(Dense(units=20, activation='relu'))
regressor.add(Dense(units=20, activation='relu'))
regressor.add(Dense(units=1))
regressor.compile(loss='mean_squared_error', optimizer='adam')

regressor.fit(X, Y, epochs=100, verbose=1, batch_size=32)


其余代码保持不变,结果如下:

python - 神经网络正弦逼近-LMLPHP

修补匠,一次又一次...

关于python - 神经网络正弦逼近,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49583466/

10-12 22:21