我计划使用神经网络来近似强化学习算法中的值函数。我想这样做是为了对我如何表示状态和 Action 引入一些概括和灵活性。

现在,在我看来,神经网络是执行此操作的正确工具,但是由于我不是AI专家,因此在这里的可视性有限。特别是,如今看来神经网络已被其他技术所取代。支持向量机,但我不确定这是否是时尚问题,还是神经网络中是否存在某些真正的局限性可能会毁了我的方法。你有什么建议吗?

谢谢,
通努兹

最佳答案

确实,神经网络已不再像以前那样流行,但是它们几乎没有死。它们不受欢迎的主要原因是Support Vector Machine的出现,因为它们在全局范围内融合并且需要较少的参数规范。

但是,SVM的实现非常繁重,并且不能像ANN一样自然地推广到强化学习(SVM主要用于离线决策问题)。

如果您的任务看起来很适合我,我建议您坚持使用ANN,因为在强化学习领域中,ANN仍然处于性能的最前沿。

Here's a great place to start;只需查看标题为“时间差异学习”的部分,因为这是ANN解决强化学习问题的标准方法。

需要注意的是:机器学习的最新趋势是通过bagging or boosting一起使用许多不同的学习代理。尽管我在强化学习中还没有看到太多,但是我敢肯定,采用这种策略仍然比单独的ANN强大得多。但是除非您真的需要世界一流的性能(这是赢得netflix竞赛的胜利),否则我将避免使用这种极其复杂的技术。

关于neural-network - 神经网络真的放弃了软件吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6910859/

10-13 00:04