概要
- 大容量モデルを用いたときに、計算の高速化を図る技術の1つ。
条件次第で2~4倍の大きな速度上昇効果を得られる。 - 拡散トランスフォーマーにおいて、行列の回転により外れ値を均一化し、4ビット量子化による推論の高速化を図る。
論文
https://arxiv.org/abs/2512.03673
- ConvRotは「Convolutional Rotation」の略
- ConvRot機能を使うには、DiTやText Encoderモデルを探す際に、ConvRot対応を入手する。
- 2026年6月以前のUIには対応していないことが多いので、適宜更新する。
- ConvRotモデルの価値はKrea2登場に合わせて強く認知され、ComfyUI v0.27においてINT8量子化モデルと合わせてネイティブサポートに至った。
モデルそのものは、以前から存在していた。
ハードウェア要件
- 実際に高速化を体感するためのハードウェア要件として、RTX20xx以降のNVIDIA製GPUが必要。
- ハードウェアによって効果が異なり、FLUX.1による研究やKrea2による検証の結果、RTX30xxシリーズで約2倍、RTX40xx,50xxシリーズで約4倍高速化するようだ。
- INT8対応はRTX20xxシリーズ(Turing)からCUDAに搭載されたハードウェア機能であり、RTX20からレイトレーシング(RTX)機能のみを削除したGTX16シリーズでも同様に動作する。(余談だがノート用のRTX2050のみRTX30と同じAmpere世代になっている)
- VRAM32GBで中古市場で有名になったV100(2017年)はRTX20よりINT8を搭載していないため注意(無条件だとfp16変換して処理=fp16より重い、cudaで専用コードを組めばもっと速く処理できなくはないそうだがそこまで過去のチップに拘る人はいない)
対応UI
- ComfyUI v0.27以降
- ComfyUI v0.27よりも前は、カスタムノードBobJohnson24氏によるComfyUI-INT8-Fastが必要だった。そのカスタムノードの関係者がComfyUIの標準loaderへConvRotモデル対応を実装したとのこと。
関連情報
- MXFP8時代のINT8。さまざまな量子化方式の品質と処理速度に関する調査:reddit
https://www.reddit.com/r/StableDiffusion/comments/1tazxqz/int8_in_the_age_of_mxfp8_an_investigation_into/ - ComfyUIでINT8ネイティブサポートされた:reddit
https://www.reddit.com/r/StableDiffusion/comments/1uhcg69/comfyui_now_natively_supports_int8_tested_and/ - INT8-ConvRotは今、注目の的になっているのでしょうか?:reddit
https://www.reddit.com/r/StableDiffusion/comments/1uimp1j/so_is_int8convrot_the_new_hot_thing/ - ComfyUI v0.27.0では、convrot int8モデルが正式にサポートされるようになりました。ほとんどのGPU (Nvidia 20、30、40、50 シリーズ) において、fp16やggufよりも2倍以上高速です:reddit
https://www.reddit.com/r/comfyui/comments/1uk6q5m/comfyui_v0270_now_officially_supports_convrot/