文章目录 摘要 论文翻译 摘要 1、简介 2、相关工作 2.1、卷积神经网络 2.2、Vision Transformers 2.3、其他方法 3、模型设计 3.1、架构 3.2、卷积调制块 3.3、Micro设计 4、实验 4.1 实验设置 4.2、与其他方法的比较 4.3、方法分析 4.4、ViTs各向同性模型的结果 4.5、下游任务的结果 5、结论与讨论 Block 改进策略 改进一