Skip to content

Latest commit

 

History

History
83 lines (64 loc) · 5.77 KB

README_ja.md

File metadata and controls

83 lines (64 loc) · 5.77 KB

NeuralStyle Plugin (English)

本プラグインは、ニューラルネットワークを利用して、スタイル画像の画風をコンテンツ画像に転写するエフェクトです。

ニューラルネットワークのモデルファイルは同梱していないので、動作させるためには、 nin_imagenet.caffemodel および VGG_ILSVRC_16_layers.caffemodel を入手してください。

インストール

OS X

TBD

Windows

本プラグインを Windows 上で動作させるためには、下記の環境設定が必要になります。

GPU を使う場合

  1. Visual Studio Community 2013 をインストールする
  • link1 から Web インストーラをダウンロードして実行します
  1. CUDA Toolkit 7.5 をインストールする
  • link2Windows x86_64 を選択して、インストーラをダウンロード、実行します
  1. cuDNN をインストールする
  • link3 から、ライセンスに同意後、cuDNN v4 Library for Windows をダウンロードします
  • 解凍してできる bin, include, lib ディレクトリを C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5 以下に、上書きコピーします
  1. Python をインストールする
  • link4 から PYTHON 2.7 の Windows 64-bit 版をダウンロードして、インストールします
  1. openopt をインストールする
  • コマンドプロンプトから pip install openopt を実行します
  1. cvxopt をインストールする
  • link5 から cvxopt-1.1.7+openblas-cp27-none-win_amd64.whl をダウンロードします
  • コマンドプロンプトから pip install cvxopt-1.1.7+openblas-cp27-none-win_amd64.whl を実行します
  1. chainer をインストールする
  • コマンドプロンプトから set VS100COMNTOOLS=%VS120COMNTOOLS%` ; set PATH=%VS120COMNTOOLS%\..\..\VC\bin;%PATH% ; pip install chainer を実行します。
  1. neural_style_synthesizer ディレクトリと DWANGO_NeuralStyle.plugin${path-to-stuff}/plugins にコピーする
  2. ${path-to-stuff}/plugins/neural_style_synthesizernin_imagenet.caffemodelVGG_ILSVRC_16_layers.caffemodel をコピーする

お疲れ様でした。

GPU を使わない場合

  1. Python をインストールする
  • link4 から PYTHON 2.7 の Windows 64-bit 版をダウンロードして、インストールします
  1. openopt をインストールする
  • コマンドプロンプトから pip install openopt を実行します
  1. cvxopt をインストールする
  • link5 から cvxopt-1.1.7+openblas-cp27-none-win_amd64.whl をダウンロードします
  • コマンドプロンプトから pip install cvxopt-1.1.7+openblas-cp27-none-win_amd64.whl を実行します
  1. chainer をインストールする
  • コマンドプロンプトから pip install chainer を実行します
  • CUDA Toolkit がインストールされていると、実行に失敗する場合があります。その際は、上記の GPU を使う場合の手順を試すか、CUDA Toolkit をアンインストールしてください。
  1. neural_style_synthesizer ディレクトリと DWANGO_NeuralStyle.plugin${path-to-stuff}/plugins にコピーする
  2. ${path-to-stuff}/plugins/neural_style_synthesizernin_imagenet.caffemodelVGG_ILSVRC_16_layers.caffemodel をコピーする

マニュアル

入力ポート

ポート名 説明
Content コンテンツ画像
Style スタイル画像

パラメータ

パラメータ名 デフォルト値 最小値 最大値 説明
xsplit 1.000 1 16.0 スタイル画像の横方向の分割数
ysplit 1.000 1 16.0 スタイル画像の縦方向の分割数
resize 1.000 0 1.0 画面のリサイズ: そのまま 1, 半分 0.5, 十分の一 0.1 など
iteration 10.000 0 1000.0 最適化の反復回数
method 1.000 0 1.0 {0: max_pooling, 1: average_pooling}。通常、デフォルト値から変更する必要はありません
model 0.000 0 1.0 {0: nin, 1: vgg}nin が軽量なモデルで、vgg が大きいモデルです (※)
smooth 0.000 0 1.0 {0: off, 1: on}。連番処理をするかのフラグ (※)
optimize 1.000 0 1.0 {0: off, 1: on}、分割したスタイルを最適化するかのフラグ。通常、デフォルト値から変更する必要はありません
gpu -1.000 -1 3.0 利用する GPU 番号 (-1 は CPU を意味します)
content_weight 0.005 0 0.1 コンテンツ画像らしさを残す重み
pause 0.000 0 1.0 デバッグ用に実行時に表示されるコンソールを開いたままにする (Windows 専用)

vgg のような大きいモデルを使う場合や、smooth フラグで連番処理する場合は、必ず プレビュー設定出力設定使用 CPU 数1 つ に設定してください。

モデルファイルのキャッシュを生成するために、初期起動時は時間がかかります。