tpia-ep2-mdp

Planning Topics of Artificial Intelligence - EP2 - Markovian Decision Process

Execução do Projeto

Compilação do projeto

Usuários de Windows, execute o código:

  javac src/PD.java; javac src/ValueFunction.java; javac src/MDPAction.java; javac src/MDPState.java; javac src/Problem.java; javac src/Main.java

Usuários do Linux ou MacOS, execute o código:

  javac src/PD.java && javac src/ValueFunction.java && javac src/MDPAction.java && javac src/MDPState.java && javac src/Problem.java && javac src/Main.java

Executar o projeto

AVISO: Para os usuários de Windows, recomenda-se não utilizar o parâmetro de imprimir o grid, pois o Windows não interpreta Unicode diretamente, e são necessárias configurações extras para que ele possa funcionar, e mesmo assim não é garantido por não ser padrão do console do mesmo.

Para arquivos do FixedGoalInitialState ou RandomGoalInitialState:

java src/Main [-f | -r] [-vi | -pi] [1-10] [-p]

Para arquivos do RunningExample:

java src/Main -ex [-vi | -pi] [-p]

Parâmetros:

`[-f | -r]`

-f para os arquivos do FixedGoalInitialState
-r para os arquivos do RandomGoalInitialState

`[-vi | -pi]`

-vi para o algoritmo Value Iteration
-pi para o algoritmo Policy Iteration

`[1-10]`

O número do arquivo, de 1 a 10

`[p]`

Parâmetro OPCIONAL, caso queira imprimir o grid

Executar todos e salvar em arquivos

Value Iteration:

VI Fixed from 1 to 10 with output: java src/Main -f -vi 1 -p > output-vi-fixed-1.txt && java src/Main -f -vi 2 -p > output-vi-fixed-2.txt && java src/Main -f -vi 3 -p > output-vi-fixed-3.txt && java src/Main -f -vi 4 -p > output-vi-fixed-4.txt && java src/Main -f -vi 5 -p > output-vi-fixed-5.txt && java src/Main -f -vi 6 -p > output-vi-fixed-6.txt && java src/Main -f -vi 7 -p > output-vi-fixed-7.txt && java src/Main -f -vi 8 -p > output-vi-fixed-8.txt && java src/Main -f -vi 9 -p > output-vi-fixed-9.txt && java src/Main -f -vi 10 -p > output-vi-fixed-10.txt
VI Random from 1 to 10 with output: java src/Main -r -vi 1 -p > output-vi-random-1.txt && java src/Main -r -vi 2 -p > output-vi-random-2.txt && java src/Main -r -vi 3 -p > output-vi-random-3.txt && java src/Main -r -vi 4 -p > output-vi-random-4.txt && java src/Main -r -vi 5 -p > output-vi-random-5.txt && java src/Main -r -vi 6 -p > output-vi-random-6.txt && java src/Main -r -vi 7 -p > output-vi-random-7.txt && java src/Main -r -vi 8 -p > output-vi-random-8.txt && java src/Main -r -vi 9 -p > output-vi-random-9.txt && java src/Main -r -vi 10 -p > output-vi-random-10.txt

Policy Iteration:

PI Fixed from 1 to 10 with output: java src/Main -f -pi 1 -p > output-pi-fixed-1.txt && java src/Main -f -pi 2 -p > output-pi-fixed-2.txt && java src/Main -f -pi 3 -p > output-pi-fixed-3.txt && java src/Main -f -pi 4 -p > output-pi-fixed-4.txt && java src/Main -f -pi 5 -p > output-pi-fixed-5.txt && java src/Main -f -pi 6 -p > output-pi-fixed-6.txt && java src/Main -f -pi 7 -p > output-pi-fixed-7.txt && java src/Main -f -pi 8 -p > output-pi-fixed-8.txt && java src/Main -f -pi 9 -p > output-pi-fixed-9.txt && java src/Main -f -pi 10 -p > output-pi-fixed-10.txt
PI Random from 1 to 10 with output: java src/Main -r -pi 1 -p > output-pi-random-1.txt && java src/Main -r -pi 2 -p > output-pi-random-2.txt && java src/Main -r -pi 3 -p > output-pi-random-3.txt && java src/Main -r -pi 4 -p > output-pi-random-4.txt && java src/Main -r -pi 5 -p > output-pi-random-5.txt && java src/Main -r -pi 6 -p > output-pi-random-6.txt && java src/Main -r -pi 7 -p > output-pi-random-7.txt && java src/Main -r -pi 8 -p > output-pi-random-8.txt && java src/Main -r -pi 9 -p > output-pi-random-9.txt && java src/Main -r -pi 10 -p > output-pi-random-10.txt

Português - Brasileiro

Padrão do arquivo '.net'

O arquivo tem:

Os estados separados por vírgulas.

As transições para cada ação definidas da seguinte forma:

 action nome_da_ação
     estado_corrente estado_sucessor probabilidade_da_ação descartar
 end_action

O custo de cada par estado ação.
O estado inicial.
O estado meta.
Um grid que é apenas para visualização. No grid:
1. Parede
2. Estado Inicial
3. Estado Final
4. Marcação que indica que há uma parede do lado

English

'.net' file pattern

The file has:

States separeted by comma.

The transitions for each action defined as follows:

 action action_name
     current_state successor_state probability_of_action discard
 end_action

The cost of each pair composed by state and action.
Initial state.
Goal state.
A grid just for visualization. In the grid:
1. Wall
2. Initial state
3. Final state
4. Markup that indicates if there is a wall at the side

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
files		files
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tpia-ep2-mdp

Execução do Projeto

Compilação do projeto

Executar o projeto

Parâmetros:

`[-f | -r]`

`[-vi | -pi]`

`[1-10]`

`[p]`

Executar todos e salvar em arquivos

Português - Brasileiro

Padrão do arquivo '.net'

English

'.net' file pattern

About

Releases

Packages

Contributors 3

Languages

License

FernandoKGA/tpia-ep2-mdp

Folders and files

Latest commit

History

Repository files navigation

tpia-ep2-mdp

Execução do Projeto

Compilação do projeto

Executar o projeto

Parâmetros:

[-f | -r]

[-vi | -pi]

[1-10]

[p]

Executar todos e salvar em arquivos

Português - Brasileiro

Padrão do arquivo '.net'

English

'.net' file pattern

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

`[-f | -r]`

`[-vi | -pi]`

`[1-10]`

`[p]`

Packages