> GeForce

GeForce

Last-modified: 2025-12-14 (日) 22:22:53

GeForceとは？

「ジーフォース」と読む。
NVIDIA製のグラフィックボードのブランド名。画像AIをするならここ一択。いろいろなベンダー(GIGABYTE、ASUS、MSI、玄人志向など)から発売されている。
選び方についてはPCスペックのページに詳しい。

CUDAコア、Tensorコア、RTコアがあり、それぞれ役割が異なる。
CUDAコアはこの3者の中では最も歴史の古いユニットで、CPU程の汎用性はないが、GPU内では比較的汎用的な処理を行う。
TensorコアはAI処理を効率的に行うためのユニットで、NPUに近い役割を担っている。機能が限定されている代わりに爆速。
- TensorコアとNPUはほぼ同じ時期に実用化されたが、Tensorコアはパフォーマンスの最大化、NPUはモバイル機器やIoTデバイスでの省電力性が重視されている。
- 純粋なグラフィック処理ではあまり使われず、ゲーム等ではAIフレーム補完（DLSS）やUpscaler処理で利用されている。
- こいつのおかげで、RTX 5090が4枚もあればFP4演算能力だけならかつて「世界2位じゃダメなんですか？」と揶揄された2012年稼働の日の丸スパコン「京」に迫る性能になる。もちろん当時のスパコンはFP64でもそれ以下の精度でも同じぐらいの処理時間だったので実際の差はもっとあるし、メモリやストレージの転送能力では当時のスパコンにもまったく及ばないが。
RTコアはレイトレーシングのためのユニットで、今のところ外部からAI処理のために使うことはできない。

CUDAのAI業界内でのポジション

AIの機械学習に関しては、GeForceでしか使えないCUDAが事実上の業界標準となっている。
- CUDAは単なるランタイムではなく、行列演算や畳み込み演算など高度なライブラリを備えている。それをNVIDIA自らがGeForceに最適化して提供している。
- FP64演算ユニットは本来ゲーム向けGPUには不要なのだが、CUDAの互換性のためにコンシューマ向けのGeForceでも低速ながら動くようになっている。
- このためRadeonのROCmやIntel GPUのoneAPIも不完全ながらCUDAからの移植支援ツールを備えている。
結果、GeForceにしか対応していないソフトウェアも多い。AMD RadeonやIntel Arcにも対応しているソフトウェアでも、最適化の違いでGeForceのほうがカタログスペック上の違い以上に動きが良かったりする。

NVIDIAは創業当初にNV1という、当時バズワードだった「マルチメディア」機能全部乗せチップを売り出したが失敗。
以降はCPUでは代替が難しい、大量の並列演算を要求される3D GPUに集中的に投資した。
NVIDIAは2000年代半ばから、ただのゲーマーのおもちゃだと思われていたGPUを科学計算に使うGPGPU（Gneral-purpose -）への取り組みを進めていた。
- RadeonサイドもOpenCLでGPGPUを目指していたが、オープン規格ゆえにRadeonの力を引き出すことが難しかった。
  一方CUDAはGeForce専用に設計されているのでその性能をフルに発揮できる。
  一般用途であれば互換性が優先されるが、限界まで性能を引き出したい、あるいは互換性を取ると満足な性能が出ないとなると話は別である。
- いっぽう研究機関や産業向けではベクトル計算機という並列演算特化のスパコンが存在した。
  こちらは逆に1から10までベクトル計算機脳で開発しないといけなかったためエンジニアの負担が大きく、ARMやx86系CPUが高性能化した2000年代には死に体だった。
  あまり売れないので量産効果も出ず、非常に高価だった。
  CUDAはあくまでGPU上で動くので、クリティカルパス以外では既存のx86系やARM向けのプログラム資産に「タダ乗り」できた。
  またGeForceはゲーミング市場での売れ行きも好調だったので価格を下げやすかった。
2012年、後にAI元年と呼ばれることになった年以降、GPUの並列計算能力と相性のいいディープラーニングに目をつけてCUDAを売り込んでいった。
- 当時もAIは注目されていたもの、今ほど爆発的に普及するとは考えられておらず、Radeonは2020年代までゲーマーを優先し出遅れた。
- IntelもかつてItaniumで「コンピュータ向けに最適化された演算を高速に並列処理する」というコンセプトを売り出していたもの、
  CPUでは「適当にプログラム書いてもうまく動くようにやってくれ」「こっちで最適化するから限界まで速く動くようにしてくれ」という相反する注文を両立することができず失敗。
  CUDAはもともと後者の需要しか取ってない（というか、取れない）。
- Intelはスマホ市場やAMD CPUとの戦いに足を取られ、AI市場で有効打を打てなかった。
- AMDもBulldozerのときにCPUで並列演算性能を偏重して失敗している。それで瀕死に追い込まれたため、立て直しに精いっぱいでAI市場への投資が遅れた。