AudioGANomaly

This repository is used for anomalous sound detection task and provides training, prediction, prediction GUI, prediction Web GUI, hyperparameters tuning, and automatic calculate threshold.

Installation

pip install -r requirements.txt

Prepare dataset

Please prepare the dataset according to the following examples.

dataset/
├── train
│   └── normal
│       ├── wav1.wav
│       ├── wav2.wav
│       └── wav3.wav
├── val
│   └── normal
│       ├── wav1.wav
│       ├── wav2.wav
│       └── wav3.wav
└── test
    ├── abnormal
    │   ├── wav1.wav
    │   ├── wav2.wav
    │   └── wav3.wav
    └── normal
        ├── wav1.wav
        ├── wav2.wav
        └── wav3.wav

Configuration

This repository provides the default configuration, which is SPEECHCOMMANDS.

All parameters are in the YAML file.

Argparse

You can override parameters by argparse while running.

python main.py --config config.yaml --str_kwargs mode=train #override mode as 100
python main.py --config config.yaml --num_kwargs max_epochs=100 #override training iteration as 100
python main.py --config config.yaml --bool_kwargs early_stopping=False #override early_stopping as False
python main.py --config config.yaml --str_list_kwargs classes=1,2,3 #override classes as 1,2,3
python main.py --config config.yaml --dont_check #don't check configuration

Training

python main.py --config config.yml --str_kwargs mode=train # or you can set train as the value of mode in configuration

Predict

python main.py --config config.yml --str_kwargs mode=predict,root=FILE # predict a file
python main.py --config config.yml --str_kwargs mode=predict,root=DIRECTORY # predict files in the folder

Predict GUI

python main.py --config config.yml --str_kwargs mode=predict_gui    # will create a tkinter window
python main.py --config config.yml --str_kwargs mode=predict_gui --bool_kwargs web_interface=True   #will create a web interface by Gradio

Tuning

python main.py --config config.yaml --str_kwargs mode=tuning    #the hyperparameter space is in the configuration

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
DeepLearningTemplate @ 258af88		DeepLearningTemplate @ 258af88
config		config
examples		examples
src		src
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AudioGANomaly

Installation

Prepare dataset

Configuration

Argparse

Training

Predict

Predict GUI

Tuning

About

Releases

Packages

Languages

License

fastyangmh/AudioGANomaly

Folders and files

Latest commit

History

Repository files navigation

AudioGANomaly

Installation

Prepare dataset

Configuration

Argparse

Training

Predict

Predict GUI

Tuning

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages