MineFIA - Progetto per il corso di Fondamenti di Intelligenza Artificiale

Introduzione

MineFIA è un progetto sviluppato nell'ambito del corso di Fondamenti di Intelligenza Artificiale, che utilizza la libreria MineRL per addestrare agenti intelligenti tramite apprendimento per imitazione, con lo scopo di renderli in grado di compiere task complessi in ambienti Minecraft.
Il nostro contributo all'interno di questo progetto è stato ampliare la libreria originale tramite lo sviluppo di script per aumentare i dati di addestramento, implementare un apprendimento per rinforzo che utilizza una funzione di reward creata da noi e con feedback umani, oltre che al definire completamente un nuovo task con insieme un nuovo ambiente (FIA-Treechop-v0) adatto al suo svolgimento.

Funzionalità Principali

Definizione di un nuovo task che include:
- Raccogliere tronchi di legno
- Costruire assi di legno
- Costruire un banco da lavoro

Usa la nostra macchina docker

Abbiamo predisposto per te una fantastica macchina docker
che ti eviterà di passare quello che abbiamo passato noi per utilizzare il framework MineRL!
Puoi trovarla qui.

Installazione Manuale

Ad ogni modo, se preferisci creare un tuo ambiente manualmente non ho niente in contrario!
Anzi, ecco dei semplici passi che dovrebbero guidarti nella creazione di un ambiente adatto a questo progetto.

Clona la Repository:

  git clone https://github.com/MarcoMeg03/MineFIA.git
  cd MineFIA

Crea un ambiente virtuale:
Puoi usare le versioni di python che vanno dalla 3.8 alla 3.10, personalmente abbiamo scelto 3.10
(assicurati di usare questa versione quando creerai il tuo ambiente):
```
  sudo apt install python3.10
```
Suggeriamo di utilizzare un ambiente virtuale per isolare le dipendenze del progetto
```
  python3 -m venv myenv
  source myenv/bin/activate
```
Installa le dipendenze richieste eseguendo:
```
  pip install -r requirements.txt
```
Installa MineRL:
Tieni conto che MineRL ha bisogno di Java 8:
```
  sudo apt install openjdk-8-jdk
```
Ora puoi installare MineRL, il modo più semplice per farlo è tramite il repository ufficiale (v1.0.2)
```
 pip install git+https://github.com/minerllabs/minerl
```
Adesso dovresti avere tutto ciò che ti serve per eseguire il progetto!

Struttura del Progetto

Il progetto include i seguenti file principali:

Training

train.py: Script per addestrare gli agenti su vari task utilizzando Behavioural Cloning.
behavioural_cloning.py: Implementazione dettagliata del processo di addestramento con gestione dello stato e ottimizzazioni.
rf_learning.py: Implementazione dettagliata del processo di addestramento con reward automatiche.
rl_human_feedback.py: Implementazione dettagliata del processo di addestramento con reward manuali.
FIAenv.py: Implementazione dell'ambiente.

Testing

Non abbiamo previsto un vero e proprio testing, ma prima di eseguire l'agente è possibile impostare a True il booleano TEST_x10_1500_STEP e modificare a piacimento

if TEST_x10_1500_STEP:
    n_episodes = 10
    max_steps = 1500

In modo da eseguire una serie di episodi, sul terminale stamperà gli ogetti in possesso dell'agente al termine di ogni episodio (speriamo di stamparli in un file excel per poter generare delle statistiche in merito il prima possibile 🥲)

 python run_agent.py --weights ./train/MineRLBasaltFindWood.weights --model ./data/VPT-models/foundation-model-1x.model --env FIA-Treechop-v0 --show

Altri File (COTS)

data_loader.py: Caricamento dei dataset per il training e il testing.
agent.py: Definizione della classe MineRLAgent per gestire osservazioni e azioni nell'ambiente.
policy.py: Implementa la policy dell'agente basata su architettura Transformer.

Esecuzione del Progetto

Esecuzione di un modello pre addestrato

Una volta addestrato il tuo modello non ti basterà altro che eseguire run_agent.py nel seguente modo, specificando il modello da usare, pesi generati dall'addestramento e ambiente in cui svolgere il task:

 python run_agent.py --weights ./train/MineRLBasaltFindWood.weights --model ./data/VPT-models/foundation-model-1x.model --env FIA-Treechop-v0 --show

Training per imitazione

Per addestrare un agente per imitazione del comportamento su un task specifico, esegui:
(assicurati di aver impostato il modello e i pesi desiderati prima di avviare un addestramento, puoi
farlo editando il file train.py)

python train.py

Training per rinforzo

Come detto inizialmente abbiamo creato una funzione di reward ad hoc per il nostro task che attribuisce punteggi all'agente ogni volta che raccoglie uno di questi items:

MATERIAL_REWARDS = {
    "birch_log": 1.2,
    "dark_oak_log": 1.2,
    "jungle_log": 1.2,
    "oak_log": 1.2,
    "spruce_log": 1.2,
    "dark_oak_planks": 1.5,
    "jungle_planks": 1.5,
    "oak_planks": 1.5,
    "spruce_planks": 1.5,
    "crafting_table": 2.0, 
    "dirt": -0.2,
    "gravel": -0.5,
    "sand": -0.3
}

In modo che una volta appresi i comportamenti desiderati l'agente possa specializzarsi sempre di più in merito alla risoluzione del suo task e correggere alcuni comportamenti indesiderati:

 python rf_learning.py --weights ./train/MineRLBasaltFindWood.weights --model ./data/VPT-models/foundation-model-1x.model --env FIA-Treechop-v0 --show --max-steps 2000 --episodes 10

Training per rinforzo con feedback umani

Dove non è stato possibile automatizzare l'apprendimento per rinforzo tramite una reward automatica, abbiamo deciso di attribuire una reward manuale con feedback umani all'agente.
Questa costituisce l'ultima fase del training ed è stata utile ad eliminare uteriormente comportamenti indesiderati dell'agente e migliorare l'apprendimento.
Si può attribuire una reward positiva con + e negativa con -.

python rl_human_feedback.py --weights ./train/MineRLBasaltFindWood.weights --model ./data/VPT-models/foundation-model-1x.model --env FIA-Treechop-v0 --show --max-steps 5000 --episodes 7

Dataset

Il progetto utilizza parzialmente il dataset BASALT di MineRL, sono stati estratti segmenti di alcuni video dal dataset originale in modo che fossero utili al raggiungimento del nostro task.
Per un 40% i dati sono stati generati e specchiati da noi mediante gli appositi script.

Estrazione dati da dataset esistente

Utile ad estrarre i fotogrammi utili al nostro obiettivo dal dataset fornito da OpenAI.
Sfrutta un semplice filtro che analizza il dataset iniziale e ne genera uno nuovo quando il soggetto
del video conserva nell'inventario uno dei seguenti oggetti:

    useful_items = {
        "crafting_table","oak_planks", "birch_planks", "spruce_planks", 
        "jungle_planks", "acacia_planks", "dark_oak_planks",
        "oak_log", "birch_log", "spruce_log", "jungle_log", 
        "acacia_log", "dark_oak_log"
    }

Volendo è possibile cambiare il criterio con cui vengono tagliati i video cambiando questi items, per eseguire lo script invece:

python CutData.py

Generazione osservazioni (.mp4 e JSONL)

Permette all'utente di sviluppare un breve gameplay nel mondo mi Minecraft tramite una finestra MineRL con lo scopo di generare una nuova osservazione e creare nuovi dati di addestramento, ciò è utile nella definizione di un nuovo task per cui non sono presenti dati.

python manual_recorder.py

Mirroring dei dati

Per aumentare la quantità di dati abbiamo deciso di implementare uno script capace di specchiare i video e le azioni correlate ad ogni fotogramma, non vengono specchiati fotogrammi che potrebbero causare problemi (es. non viene specchiato quando la GUI è aperta)

python MirrorData.py --input_folder ./path --output_folder ./path

Licenza

Questo progetto è rilasciato sotto la licenza MIT. Consulta il file LICENSE per maggiori dettagli.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
Bot_server		Bot_server
Video_generati		Video_generati
basalt-2022-behavioural-cloning-baseline		basalt-2022-behavioural-cloning-baseline
.gitattributes		.gitattributes
README.md		README.md
manual_recorder.py		manual_recorder.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MineFIA - Progetto per il corso di Fondamenti di Intelligenza Artificiale

Introduzione

Funzionalità Principali

Usa la nostra macchina docker

Installazione Manuale

Struttura del Progetto

Training

Testing

Altri File (COTS)

Esecuzione del Progetto

Esecuzione di un modello pre addestrato

Training per imitazione

Training per rinforzo

Training per rinforzo con feedback umani

Dataset

Estrazione dati da dataset esistente

Generazione osservazioni (.mp4 e JSONL)

Mirroring dei dati

Licenza

About

Releases

Packages

Languages

giusopo/MineFIA

Folders and files

Latest commit

History

Repository files navigation

MineFIA - Progetto per il corso di Fondamenti di Intelligenza Artificiale

Introduzione

Funzionalità Principali

Usa la nostra macchina docker

Installazione Manuale

Struttura del Progetto

Training

Testing

Altri File (COTS)

Esecuzione del Progetto

Esecuzione di un modello pre addestrato

Training per imitazione

Training per rinforzo

Training per rinforzo con feedback umani

Dataset

Estrazione dati da dataset esistente

Generazione osservazioni (.mp4 e JSONL)

Mirroring dei dati

Licenza

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages