ICCV‘25、CVPR‘25、ICLR‘25论文 | Transformer+CNN、多模态(即插即用模块)
1)自然语言处理、计算机视觉、大语言模型、多模态算法,尤其以Attention为主的模型核心发展脉络,拥有浓厚兴趣的同学;2)有意深造、跳槽、转行的在职同学;等2025年顶会的Transformer架构论文、代码、数据集、即插即用模块,不得不说Transformer真的太能打了,堪称AI顶会常青树!如果你刚开始准备顶会论文,一定要主动和导师沟通:把你的困惑、初步想法多分享,导师的一句话,可能就是解
本周我我整理了19篇来自ICCV、CVPR、ICLR等2025年顶会的Transformer架构论文、代码、数据集、即插即用模块,不得不说Transformer真的太能打了,堪称AI顶会常青树!
Transformer架构已经从一个单一的模型演变成一个强大的、可塑的、跨领域的“百搭工具”。很多顶会论文工作早就在其核心机制上不断创新(更高效、更简单),或者在不同领域模态上持续拓展(尤其是在计算机视觉),更多的是在模型设计走融合路子(结合CNN等),并将其核心思想模块化,以解决日益复杂和专门化的科学与工程问题。
我将这19篇来自耶普斯麻、清北复交中科院等单位的Transformer架构论文、代码、数据集、即插即用模块打包好了,大家扫码直接领取即可下载使用!
求职充电&小白入门-Transformer必读论文解析9节课(打基础)
本课程含代码复现~适合:1)自然语言处理、计算机视觉、大语言模型、多模态算法,尤其以Attention为主的模型核心发展脉络,拥有浓厚兴趣的同学;2)有意深造、跳槽、转行的在职同学;3)计算机科学或交叉领域的本硕博在读同学。
-
第一节:Attention Is All You Need(开山之作)
-
第二节:Transformer之VIT(实现了Transformer在计算机视觉中的首次应用)
-
第三节:SegFormer+Swin Transformer(Transformer在高分辨率影像领域的应用)
-
第四节:Transformer之vilt(ViLT直接使用序列输入进行多模态融合和理解)
-
第五节:(GPT-4)Toolformer(Transformer在GPT-4的应用,大语言模型必学)
-
第六节:Scalable Diffusion Models with Transformers(Transformer+扩散模型)
-
第七节:Mamba与Transformer
-
第八节:LLMLingua(大语言模型的高效Prompt压缩技术)
-
第九节:LongLoRA(长文本序列的高效微调)
扫码免费领取↓ 9节论文课(课件及代码)+19篇前沿论文即插即用模块~
实战项目-Transformer项目班(提高实践能力)
本课程将带你掌握Tramsformer前沿技术,将其应用到实际工作/项目中,不论是从业者还是本硕博同学,都能在本课程获得系统的知识体系构建与实践能力提升。
-
【01课】Transformer入门与子词分词器实现
-
【02课】多头注意力与位置编码
-
【03】构建Transformer模型
-
【04课】Transformer模型的训练
-
【05课】分布式数据并行训练实战
-
【06课】KV Cache 原理与实现
-
【07课】常见生成策略
-
【08课】transformer变种与改进
-
【09课】transformer变种实现与总结
扫码免费领取↓ 9节实战课+9节论文课(课件及代码)+19篇前沿论文即插即用模块~
想发顶会/顶刊的同学,我想给你说! 做科研这条路能走顺,导师靠谱真的是 “刚需”!研梦的导师帮你筛选题、开思路、磨写作,还能及时拽住你别跑偏。
有了导师的经验加持,能少走80%的弯路! 如果你刚开始准备顶会论文,一定要主动和导师沟通:把你的困惑、初步想法多分享,导师的一句话,可能就是解开难题的钥匙。





<<< 左右滑动见更多 >>>
科研从来不是单打独斗,善用导师资源,才能让每一步都走得更稳、更准~Accept才能是你的!扫码获取更多学员学习中稿案例。




<<< 左右滑动见更多 >>>
我们不是小作坊哦~我们背靠研途考研(可以扫码找我们规划学长获取公司证件),做教育十余年,重交付,重口碑,是我们一贯的公司理念!
更多推荐




所有评论(0)