Veo
概要
Veo は Google DeepMind が開発する動画生成モデル群である。テキストや画像から高品質な動画を生成するためのモデルとして位置づけられ、Google の生成AI製品や Vertex AI の動画生成機能と結びついている。Veo 3 では、映像に加えてネイティブ音声、効果音、環境音、会話音声などを扱う方向が公式に示されている。
背景
Google は 2024年に Veo を発表し、その後 Veo 2、Veo 3 へと展開した。Google DeepMind のモデルページでは、Veo 3 が「native audio」や拡張されたクリエイティブ制御を含む動画生成モデルとして説明されている。Vertex AI では、Veo が動画生成を支えるモデル名として扱われ、開発者は Google Cloud 経由で動画生成機能を利用できる。
シンギュラリティ文脈
Veo は、検索、クラウド、スマートフォン、YouTube など大規模な消費者・開発者基盤を持つ企業が、生成動画を一般的な制作・広告・教育・アプリ開発の部品にしていく流れを象徴する。音声を含む動画生成が安定すると、映像制作は「撮影された記録」だけでなく「プロンプトから合成された体験」へ拡張される。
使い方の注意
- Veo の機能、対応地域、料金、生成長、解像度、音声対応は提供面によって変わるため、利用時点の Google 公式ドキュメントを確認する。
- 実在人物、ニュース風映像、ブランドロゴ、著作物に似た素材の生成は、権利・名誉・誤情報リスクがある。
- Google は安全性や透かし技術への取り組みを示しているが、生成物の真偽判定を利用者側で省略してよいわけではない。
関連項目
- 動画生成AI
- Seedance
- モデル評価
- AI企業提携