OpenSiv3Dで文字認識を行います。
- OpenSiv3D (0.6)
- Tesseract OCR (4.1.1)
- この記事に従ってOpenSiv3Dをビルドします。
- Visual StudioインストーラーからVisual Studioに英語の言語パックを追加します。(追加していない場合)
- Tesseractはvcpkgからインストールすることができます。まずvcpkgをGitHubからダウンロードし、中にある「bootstrap-vcpkg.bat」を実行します。
- vcpkgのある場所で管理者権限でコマンドプロンプトを開き
vcpkg install tesseract:x64-windows-static
というコマンドを実行します。 - しばらく待つとインストールが完了します。
- OpenSiv3D.slnのあるフォルダの中にtesseractlibというフォルダを作ります。
- tesseractlibの中にdebug, releaseフォルダを作ります。
- debugの中にC:\ ...\vcpkg\installed\x64-windows-static\debug\libの中身をコピーします。
- releaseの中にC:\ ...\vcpkg\installed\x64-windows-static\libの中身をコピーします。
- Visual Studioのインクルードディレクトリに$(SolutionDir)、C:\ ... \vcpkg\installed\x64-windows-static\include、およびC:\ ... \OpenSiv3D_0_6_master\Siv3D\src\ThirdParty-prebuilt\ を加えます。
- Visual StudioのライブラリディレクトリにC:\ ... \vcpkg\installed\x64-windows-static\debug\libを加えます。
- https://github.com/tesseract-ocr/tessdata_fast からjpn.traineddata(縦書きの文章を認識したい場合はjpn_vert.traineddata)をダウンロードします。ダウンロードしたファイルは、
App
フォルダに新しくフォルダを作り、その中に置いてください。(ここではdata
というフォルダを作ったものとします。)