1. Pre-trained Models

DROP_PROB = 0.1
N_LAYERS = 6
HIDDEN_SIZE = 384
MLP_SIZE = 384
N_HEADS = 12
PATCH_SIZE = 4
BASE_LR = 1e-3
BETA1 = 0.9
BETA2 = 0.999
WEIGHT_DECAY = 5e-5
WARMUP_EPOCHS = 5
SMOOTHING = 0.1
CUTMIX = False
CUTOUT = False
HIDE_AND_SEEK = False
BATCH_SIZE = 2048
N_EPOCHS = 300

1) Trained on CIFAR-10 Dataset for 300 Epochs

vit_cifar10.pth
Top-1 accuracy 0.864 on validation set

2) Trained on CIFAR-100 Dataset for 256 Epochs

vit_cifar100.pth
Top-1 accuracy 0.447 on validation set

2. Implementation Details

F.gelu() → nn.Dropout()의 순서가 되도록 Architecture를 변경했습니다. 순서를 반대로 할 경우 미분 값이 0이 되어 학습이 이루어지지 않는 현상이 발생함을 확인했습니다.
CIFAR-100에 대해서 N_LAYERS = 6, HIDDEN_SIZE = 384, N_HEADS = 6일 때, PATCH_SIZE = 16일 때보다 PATCH_SIZE = 8일 때, 그리고 PATCH_SIZE = 4일 때 성능이 향상됐습니다.
CIFAR-10과 CIFAR-100에 대해서 공통적으로 ViT-Base보다 작은 크기의 모델을 사용할 때 성능이 더 높았습니다.

3. Studies

1) Attention Map

Original image
head_fusion: "max", discard_ratio: 0.85

Name		Name	Last commit message	Last commit date
Latest commit History 139 Commits
cutmix		cutmix
cutout		cutout
hide_and_seek		hide_and_seek
papers		papers
studies		studies
.gitignore		.gitignore
README.md		README.md
cifar10.py		cifar10.py
cifar100.py		cifar100.py
config.py		config.py
eval.py		eval.py
loss.py		loss.py
model.py		model.py
set_env.sh		set_env.sh
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

1. Pre-trained Models

1) Trained on CIFAR-10 Dataset for 300 Epochs

2) Trained on CIFAR-100 Dataset for 256 Epochs

2. Implementation Details

3. Studies

1) Attention Map

2) Position Embedding Similarity

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

1. Pre-trained Models

1) Trained on CIFAR-10 Dataset for 300 Epochs

2) Trained on CIFAR-100 Dataset for 256 Epochs

2. Implementation Details

3. Studies

1) Attention Map

2) Position Embedding Similarity

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages