这两个注意事项在seq2seq模块中使用。两种不同的注意事项在this张量流文档中作为乘法和加法注意事项引入。有什么区别?

最佳答案

它们在a pytorch seq2seq tutorial中有很好的解释

主要区别在于如何对当前解码器输入和编码器输出之间的相似性进行评分。

08-25 00:32