TensorBoard

Last-modified: 2023-10-04 (水) 00:49:40

学習中のパラメータ推移のログ監視に使うツール

公式HP

https://www.tensorflow.org/tensorboard/get_started?hl=ja#:~:text=TensorBoard%20は機械学習ワークフロー,なことを行えます

sd-scriptsでの使い方

sd-scriptsにおけるログ機能では、Learning ratelossの推移を監視できる。

TensorBoardをインストール

TensorBoardのライブラリをインストールします。

  1. sd-scriptsフォルダ内でvenv環境を有効化 ※リンク先を参照
  2. TensorBoardをインストール。
    pip install tensorboard==2.10.1
    上記はPytorch 2.0.1+cu118系を入れた場合のVer.指定例です。
    Pytorch等のVer.次第では衝突が発生するので、適切なVer.は各自調査して下さい。

ログを保存する

公式解説:https://github.com/kohya-ss/sd-scripts/blob/main/docs/train_README-ja.md#学習に関する設定

学習前の準備

最低限、下記のコマンドを足せば良い。

--logging_dir="C:\(中略)\logs"

学習実行

この状態で学習を実行すると、logsフォルダ内に下記のフォルダが作成される。
(1回の学習につき1個のフォルダ)
sd-scriptsのログ出力結果_TensorBoard_20231004.png

ログを見る

TensorBoardを開く

  1. 下記のbatファイルを作成して実行。
     rem tensorboardのライブラリを参照するため、sd-scriptsフォルダ内に移動して、venv環境を有効化
     cd sd-scripts
     call .\venv\Scripts\activate
    
     rem tensorboardを実行。
     tensorboard --logdir=C:\(指定したパス)\logs
  2. エラーが出るかもしれないが気にしない。
    TensorBoardの起動準備_20231004.png
  3. http://localhost:6006/ (Press CTRL+C to quit)
    のアドレス部分をCTRL+左クリックで
    TensorBoardが開きます。

ログを確認する

  • ブラウザ画面をもとにログを閲覧しましょう。
    • TensorBoardのVer.によって操作が変わるかもしれないので、説明は割愛。
      フィーリングでわかるはず。
      TensorBoardの画面_20231004.png