Задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат состоит из ряда подзадач:
2. Процесс бинаризации изображения. Преобразования цветного изображения в черно-белое;
3. Очистка текста от зашумленности с помощью сверточной нейронной сети;
4. Очистка текста от зашумленности с помощью многослойного перцептрона;
5. Распознавание текста при помощи OCR Tesseract;
6. Конвертация текста в текстовой формат для дальнейшей обработки.
Решив последовательно задачи, приведенные выше, из входных данных в виде зашумленного изображения с текстом, получаем выходные данные в виде текста в формате пригодном для его обработки.
- conda install keras;
- conda install -c conda-forge opencv;
- pip install pytesseract;
- conda install pyQt5;
- Установить tesseract-ocr-setup-3.05.01;
- Сделать привязку в файле pytesseract.py (находится в ...\Anaconda3\Lib\site-packages) на установленный tesseract.exe
в файле pytesseract.py меняем старый tesseract_cmd на это tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\';
- Программа запускается с помощью файла main.py (остальные файлы должны быть в этой же папке).