文章目录 一. 引言二. 直接多步(DMS)和迭代多步(IMS)的对比三. 基于变压器的Transformer解决方案3.1. 预处理(preprocessing)3.2. 词向量(embedding)3.3. 编码(encoder)3.4. 解码(encoder) 四. 一个简单得令人尴尬的Baseline五. 代码解读5.1. 数据集划分模块(custom)5.2. 模型结构 六. 参考文献 一. 引言 二. 直接多步(DMS)和迭代多步(IMS)的对比 三. 基于变压器的Transformer解决方案 3.1. 预处理(preprocessing) 3.2. 词向量(embedding) 3.3. 编码(encoder) 3.4. 解码(encoder) 四. 一个简单得令人尴尬的Baseline 五. 代码解读 5.1. 数据集划分模块(custom) 5.2. 模型结构 六. 参考文献