学習中のパラメータ推移のログ監視に使うツール
公式HP
https://www.tensorflow.org/tensorboard/get_started?hl=ja#:~:text=TensorBoard%20は機械学習ワークフロー,なことを行えます。
sd-scriptsでの使い方
sd-scriptsにおけるログ機能では、Learning rateやlossの推移を監視できる。
TensorBoardをインストール
TensorBoardのライブラリをインストールします。
- sd-scriptsフォルダ内でvenv環境を有効化 ※リンク先を参照
- TensorBoardをインストール。
pip install tensorboard==2.10.1
上記はPytorch 2.0.1+cu118系を入れた場合のVer.指定例です。
Pytorch等のVer.次第では衝突が発生するので、適切なVer.は各自調査して下さい。
ログを保存する
公式解説:https://github.com/kohya-ss/sd-scripts/blob/main/docs/train_README-ja.md#学習に関する設定
学習前の準備
最低限、下記のコマンドを足せば良い。
--logging_dir="C:\(中略)\logs"
学習実行
この状態で学習を実行すると、logsフォルダ内に下記のフォルダが作成される。
(1回の学習につき1個のフォルダ)
ログを見る
TensorBoardを開く
- 下記のbatファイルを作成して実行。
rem tensorboardのライブラリを参照するため、sd-scriptsフォルダ内に移動して、venv環境を有効化 cd sd-scripts call .\venv\Scripts\activate rem tensorboardを実行。 tensorboard --logdir=C:\(指定したパス)\logs
- エラーが出るかもしれないが気にしない。
- http://localhost:6006/ (Press CTRL+C to quit)
のアドレス部分をCTRL+左クリックで
TensorBoardが開きます。
ログを確認する
- ブラウザ画面をもとにログを閲覧しましょう。
- TensorBoardのVer.によって操作が変わるかもしれないので、説明は割愛。
フィーリングでわかるはず。
- TensorBoardのVer.によって操作が変わるかもしれないので、説明は割愛。