linux - 运行此命令时出现错误mahout trainnb -i path_to/train-vectors -el -li path_to/labelindex -o path_to/model -ow -c-LMLPHP

请参阅附件。我在本地使用mahout。我已经将序列文件转换为稀疏 vector ,并且还将集合分为两组:训练集和测试集:

mahout split -i tweets-vectors/tfidf-vectors --trainingOutput train-vectors --testOutput test-vectors --randomSelectionPct 40 --overwrite --sequenceFiles -xm sequential.

运行此命令时出错mahout trainnb -i train-vectors -el -li labelindex -o model -ow -c

最佳答案

java.lang.ArrayIndexOutOfBoundsException通常是由于您在记录或 vector 中的字段数错误。这可能是由于解析不正确(分隔符错误,逗号分隔文件中的逗号不正确等)或您期望字段位于错误位置的另一个问题引起的。

10-08 02:46