ConvRot

Last-modified: 2026-07-04 (土) 18:59:13

概要

  • 大容量モデルを用いたときに、計算の高速化を図る技術の1つ。
    条件次第で2~4倍の大きな速度上昇効果を得られる。
  • 拡散トランスフォーマーにおいて、行列の回転により外れ値を均一化し、4ビット量子化による推論の高速化を図る。
    論文
    https://arxiv.org/abs/2512.03673
  • ConvRotは「Convolutional Rotation」の略
  • ConvRot機能を使うには、DiTやText Encoderモデルを探す際に、ConvRot対応を入手する。
  • 2026年6月以前のUIには対応していないことが多いので、適宜更新する。
  • ConvRotモデルの価値はKrea2登場に合わせて強く認知され、ComfyUI v0.27においてINT8量子化モデルと合わせてネイティブサポートに至った。
    モデルそのものは、以前から存在していた。

ハードウェア要件

以下はINT8量子化セットのモデルとしての要件です。ConvRot単独としての要件に関する情報はありません。

  • 実際に高速化を体感するためのハードウェア要件として、RTX20xx以降のNVIDIA製GPUが必要。
    • ハードウェアによって効果が異なり、FLUX.1による研究やKrea2による検証の結果、RTX30xxシリーズで約2倍、RTX40xx,50xxシリーズで約4倍高速化するようだ。
    • INT8対応はRTX20xxシリーズ(Turing)からCUDAに搭載されたハードウェア機能であり、RTX20からレイトレーシング(RTX)機能のみを削除したGTX16シリーズでも同様に動作する。(余談だがノート用のRTX2050のみRTX30と同じAmpere世代になっている)
    • VRAM32GBで中古市場で有名になったV100(2017年)はRTX20よりINT8を搭載していないため注意(無条件だとfp16変換して処理=fp16より重い、cudaで専用コードを組めばもっと速く処理できなくはないそうだがそこまで過去のチップに拘る人はいない)

対応UI

関連情報