Fine-tuning of 'DistillBert' NLP transformer model for text classification, with 'AdaFamily' optimizer and 'mini-batch trimming'

Demonstrates finetuning of a NLP model with novel 'AdaFamily' optimizer and 'mini-batch trimming'. Code is taken and adapted from https://github.com/hfwittmann/transformer_finetuning_lightning Uses pytorch lightning. Demonstrates also how to modify (via 'monkey-patching') a huggingface transformer model so that it employs a custom loss function.

Regarding 'mini-batch trimming' (curriculum learning method), see my arxiv preprint at https://arxiv.org/abs/2110.13058 (accepted for ASPAI 2021 conference)

Regarding 'AdaFamily' (a family of novel adaptive gradient methods), see my arxiv preprint at https://arxiv.org/abs/2203.01603 (accepted for ISPR 2022 conference). We use the AdaFamily variant with myu = 0.25

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
JrsDistilBertForSequenceClassification.py		JrsDistilBertForSequenceClassification.py
LICENSE		LICENSE
README.md		README.md
jrs_run_training.bat		jrs_run_training.bat
mbtrim.py		mbtrim.py
my_adafamily.py		my_adafamily.py
nlp_finetuning_lightning_google.py		nlp_finetuning_lightning_google.py
requirements.in		requirements.in
requirements.txt		requirements.txt
run.txt		run.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fine-tuning of 'DistillBert' NLP transformer model for text classification, with 'AdaFamily' optimizer and 'mini-batch trimming'

About

Releases

Packages

Languages

License

hfassold/nlp_finetuning_adafamily

Folders and files

Latest commit

History

Repository files navigation

Fine-tuning of 'DistillBert' NLP transformer model for text classification, with 'AdaFamily' optimizer and 'mini-batch trimming'

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages