LLM Fine-Tune AI

This repository contains scripts and resources for fine-tuning the Codestral-22B-v0.1 model on custom datasets for multiple-label classification tasks.

Model

Codestral-22B-v0.1 is trained on a diverse dataset of 80+ programming languages, including the most popular ones, such as Python, Java, C, C++, JavaScript, and Bash. The model can be queried:

To answer any questions about a code snippet (write documentation, explain, factorize)
To generate code following specific instructions

Datasets

The training and test datasets used in this project are:

Dahoas_base_code_review
codeparrot_apps

Requirements

To run the scripts in this repository, you need the following libraries:

plaintext
torch>=1.9.0
transformers>=4.10.0
datasets>=1.11.0
sentencepiece
huggingface-cli

pip install -r requirements.txt

Download Model

huggingface-cli snapshot-download Codestral-22B-v0.1-exl2-6_5 -d ./Codestral-22B-v0.1-exl2-6_5

Download Datasets

For Dahoas_base_code_review:

huggingface-cli dataset download --name Dahoas_base_code_review -d ./datasets/Dahoas_base_code_review

For codeparrot_apps: huggingface-cli dataset download --name codeparrot_apps -d ./datasets/codeparrot_apps

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.scripts		.scripts
distilbert-base-uncased		distilbert-base-uncased
gpt-4o		gpt-4o
.gitignore		.gitignore
README.md		README.md
dowload_resources.py		dowload_resources.py
ds		ds
inspect_dataset_columns.py		inspect_dataset_columns.py
mychatgpt		mychatgpt
py_install.sh		py_install.sh
requirements.txt		requirements.txt
sentencepiece		sentencepiece
torch		torch
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Fine-Tune AI

Model

Datasets

Requirements

About

Releases

Packages

Languages

CPUtester5465/LLM-fine-tune-AI

Folders and files

Latest commit

History

Repository files navigation

LLM Fine-Tune AI

Model

Datasets

Requirements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages