NirNet: End2End Sentence-level Lipreading

A novel method that apply deep learning into lip reading

Results

Scenario	Epoch	CER	WER	BLEU
Unseen speakers [C]	N/A	N/A	N/A	N/A
Unseen speakers	N/A	N/A	0.226	N/A
Overlapped speakers [C]	N/A	N/A	N/A	N/A
Overlapped speakers	N/A	N/A	N/A	N/A

Modify options.toml and

python main.py options.toml

This model uses GRID corpus (http://spandh.dcs.shef.ac.uk/gridcorpus/) Please extract mouth region using dlib or other tools.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
LipNet.py		LipNet.py
README.md		README.md
align.py		align.py
common.py		common.py
dataloader.py		dataloader.py
options.toml		options.toml
requirements.txt		requirements.txt
statefultransforms.py		statefultransforms.py
train.py		train.py
val.py		val.py
video.py		video.py