我有一个关于数据集标准化的问题。我们正在完成一项学校作业,我们必须在其中理解数据集并对新示例进行分类。我们有一些可用的数据集,它们是原始数据的压缩形式。我们尝试使用最小的数据集,只是为了掌握 ANN。

数据集由 8 列数据和 1 列理想值组成。数据列都是浮点值,理想值是整数。如果该行属于该类,则理想字段为 1,否则为 0。但是在 AnalystNormalizeCSV 上应用 normalize() 时,理想字段被转换为两个字段。

现在,假设一个简单的前馈神经网络。我需要一两个输出神经元吗?

当我使用 1 个神经元和 1 个神经元作为理想场的数量时,它似乎可以工作,但仍保持在 60% 左右。当我使用 2 个输出神经元和 1 个作为理想场数时,我在 Propagation.iteration() 中得到一个 ArrayOutOfBoundsException。当我们使用 2 表示输出神经元和理想场的数量时,它可以工作,但再次卡在 60% 左右。中间选项似乎很合理,因为实际上有 1 个理想场,归一化后有 2 个理想场,因此有 2 个输出神经元。

默认的

提前致谢,
克里斯

最佳答案

如果您使用“其中之一”规范化,那么您确实需要两个。你有两个类(class)。您可以仅使用一个输出神经元对其进行建模,但它更像是一种回归(预测一个数字)而不是分类(哪个类别)。

关于neural-network - 使用其中之一进行编码归一化,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/15499113/

10-12 23:56