5555556 发布了问题
5555556 对问题发布了答案
transformer提出时首先被用于机器翻译任务,接着逐渐代替LSTM,在NLP任务中成为主流架构。这两年CV任务也出现了transformer的身影,detr、vit等结构也达到了cnn相近甚至超
发布 问题
回到 顶部
5555556 发布了问题
深度学习中有什么非常惊艳或者轻量级的Attention操作?