阅读CoCoOp之前,对CLIP的源码没有过多熟悉,所以本篇也是边读边学,尽可能的让本篇代码解读层次递进的包含Transformer,CLIP,以及CoCoOp的主要代码实现,说明关联的原理。若有不清晰之处,随时修订。尔后基于这一Dassl训练框架的CLIP相关实现的解读,就不会再次包含CLIP和Transformer了,避免内容过于繁杂。本篇的目的是清晰理解每一行代码,避免后续工作遇到问题。 Config 本次解读使用的trainer是CoCoOp的vit_b16_c4_ep10_batch1_ctxv1…
前言 最近投入进了FAS的怀抱,但是对这个新领域知之甚少,所以本文将作为该任务类型的梳理,对其任务常用的动机和提出方法进行汇总梳理,确保能够熟悉该任务,在面对该领域新的模型时不至于一头雾水。 本文将基于数篇2024年的论文进行粗略阅读,考虑到2024年的论文大抵不会开放代码,另外本篇为粗读,故本文大概率将不会涉及代码内容,有需会针对部分论文写精读。…
前言 本文将整理SA-FAS[1]官方代码实现中的数据预处理部分,以便用于在其他项目当中(如GAC-FAS),按照相同的数据格式进行测试。 预先准备…
BN 整体结构 前向传播…
前言 有一天晚上突发奇想,想到能不能自己做出来一个超便宜超简单的自动驾驶方案? 然后这篇文章就出来了....…