ブログ

Veo 3.1 in Kollab:Google の No.1 動画モデルを内蔵、すぐに使える

2026年5月20日jaYANAI Insights11分
cover.png

Veo 3.1 は Video Arena で 1 位。Kollab にはデフォルト動画モデルとして内蔵されており、8 秒超えのチェーン生成、image-to-video、ネイティブ音声に対応。Vertex AI 設定は不要です。

Veo 3.1Google Veo 3.1Veo 3.1 KollabVeo 3.1 レビューVeo 3.1 8秒Veo 3.1 ExtendVeo 3.1 chainVeo 3.1 vs Sora 2Veo 3.1 image to videoVeo 3.1 API

数週間前、Google DeepMind が Veo 3.1 をリリースしました。リーダーボードの反応は早く、Arena.ai は Veo 3.1 を Video Arena で史上初めて 1400 を超えたモデル と紹介しました。Veo 3.0 から一度のリリースで 30 ポイント上昇し、text-to-video と image-to-video の両方でトップに立っています。

Google DeepMind による Veo 3.1 発表、2025年10月15日 — @GoogleDeepMind on X

この領域を追ってきた人なら、これが何を意味するかはすぐに分かるはずです。上限が一段上がりました。

Kollab にはすでに Veo 3.1 がデフォルトの動画モデルとして組み込まれています。GCP プロジェクトを作る必要も、Vertex AI のサービスアカウントを扱う必要も、間にサードパーティのクレジット販売業者を挟む必要もありません。任意のタスクでプロンプトを入力するだけで、リーダーボードで話題になっている同じ veo-3.1-generate-001 モデルが実行されます。

この記事では、Veo 3.1 で何が変わったのか、X や Reddit のクリエイターが実際に何を作っているのか、そして Kollab がその上に追加している 2 つの機能――8 秒制限を超えてチェーン生成すること、ワークスペース内の任意の画像を開始フレームにできること――を説明します。

Veo 3.1 の新機能

Google DeepMind の発表ポストは簡潔です。「映画制作者、ストーリーテラー、開発者向けのクリエイティブコントロールを改善。その多くは音声付き」。重要なのは次の 3 点です。

その結果、Veo 3.1 は Video Arena で 1400 を突破しました。前モデルの Veo 3.0 はおよそ 1370。6 か月でこの差が生まれました。

Arena.ai:Veo 3.1 が text-to-video と image-to-video の両方で 1 位、Veo 3.0 から +30
Arena.ai:Veo 3.1 が text-to-video と image-to-video の両方で 1 位、Veo 3.0 から +30

クリエイターは何を作っているのか

最も強いシグナルはベンチマークではありません。最初の 3 週間で人々が作ったものです。

  • el.cine は 10月23日 にこう投稿しました。"Google Veo 3.1 は広告代理店を終わらせた。数秒でスタジオ品質の広告を作れ、俳優、衣装、商品、環境の一貫性を保てる。" 1,288 いいね、10 万ビュー。コメント欄ではクライアント商談を入れる人が出ています。
el.cine による Veo 3.1 広告デモ — X で 1,288 いいね、10 万ビュー
HeyGen の Veo 3.1 マルチシーン一貫性デモ
  • a16z の Justine Moore は、Nano Banana → Veo 3.1 → ElevenLabs Studio をつなげて、画像から動画、さらに音声までのエンドツーエンドパイプラインを作りました。作業の単位は「1 本のクリップをレンダリングする」から「シーケンスを構成する」へ変わっています。

  • バイラル面では、Reddit の r/singularity で Veo 3.1 による Will Smith Spaghetti のリメイクが 3,521 upvotes を獲得しました。補足すると、このプロンプトは 2023 年から非公式の AI 動画ベンチマークになっています。Veo 3.1 は、それを初めて不自然に見えない形にしたモデルです。

Sora 2、Kling、Runway、Higgsfield で動画制作をしてきた人にとって、これはクリエイターが実際の商用案件で使い始めているモデルです。

多くの人が不満に感じている 2 つの点

Veo 3.1 は万能ではありません。r/VEO3 を 10 分読むだけで、同じパターンが見えてきます。

  1. 8 秒のハード上限。 Veo 3.1 の各クリップは 8 秒で止まります。例外はありません。Google の Gemini チーム自身も、"Veo 3.1 の 8 秒クリップは出発点であり、拡張に継続的に取り組んでいる" と公に認めています。物語、広告、予告編を作る人にとって、8 秒は完成物ではありません。

  2. アクセスコスト。 Higgsfield、Arcads、HeyGen、Flow――どのラッパーも Veo 3.1 をクレジット単位で販売し、「無制限」キャンペーンを 3 日間に制限し、Extend のチェーンを手作業で見守らせます。Reddit の "Bye Veo 3.1" スレッドは、使えるカットを得る前に課金された人たちの声でほぼ埋まっています。

この 2 つはモデルの問題ではなく、ワークフローの問題です。そして、Kollab が解決したのはこの部分です。

Kollab が Veo 3.1 の上に追加していること

Kollab の /veo-3 スキルは、初回生成と Extend の両方で veo-3.1-generate-001 をデフォルトとして Vertex AI を直接呼び出します。以下はすべて、追加設定なしで任意の Kollab タスク内から使えます。

  • 8 秒制限を超えて自動チェーン生成。 1 つのコマンド――veo3 chain "your prompt" --target-duration 30――で最初の 8 秒セグメントを生成し、その後の Extend ジョブに各クリップを次のソースとして渡します。1 チェーンあたり最大約 30 秒。タスク履歴にはすべての中間セグメントと最終マージジョブが残るため、途中のセグメントから選び直すこともできます。

  • ワークスペース内の任意のアーティファクトから image-to-video。 Nano Banana のフレーム、GPT Image 2 のレンダー、アップロードした写真など、画像をタスクに入れて --first-frame-ref artifact:<id> と参照するだけです。署名付き URL のやり取りは不要です。サーバーがアーティファクトを解決し、クリーンなバイト列を Vertex に渡します。

  • 環境音・会話・効果音がデフォルトで有効。 Veo 3.1 の音声は、呼び出しごとの切り替えではなく、skills-server のランタイム設定で有効化されています。

  • GCP もサービスアカウントもポーリングコードも不要。 Kollab の skills-server が Vertex 認証情報、オペレーションのポーリング、GCS から S3 へのアーティファクト移動、課金処理を持ちます。ユーザーのタスクには最終 MP4 がアーティファクトとして届きます。

  • すべてのセグメントがアーティファクトとして残る。 長時間タスクの履歴には、各セグメントと最終動画が保存されます。チェーンが 3 本目でズレた場合でも、2 本目から再プロンプトでき、ゼロから作り直す必要はありません。

モデルを選ぶ必要はありません。プロバイダーを選ぶ必要もありません。動画ランタイムを選ぶ必要もありません。作りたいものを書けば、Veo 3.1 が生成します。

今すぐ試せる 3 つのプロンプト

任意の Kollab タスクで実行できます。

make a Veo 3 video of a slow dawn flyover over a glass greenhouse,
warm natural audio, slight camera push-in

これにより、ネイティブ音声付きの 8 秒、16:9、1080p クリップが 1 ジョブで生成されます。

Kollab でこのプロンプトを実行
Kollab を開いて Veo 3.1 でこのプロンプトを実行しましょう。設定不要で、ネイティブ音声はデフォルトで有効です。
タスクを開く →
make a 30-second Google Veo cinematic sequence:
dawn flyover, into the greenhouse, condensation on the glass,
sunrise hitting the orchids

これは veo3 chain を起動します。最初のセグメントに加えて 3 回の Extend が実行され、ステッチされた最終動画が約 6〜8 分でアーティファクトに保存されます。

Kollab でこのプロンプトを実行
Kollab を開いて Veo 3.1 でこのプロンプトを実行しましょう。設定不要で、ネイティブ音声はデフォルトで有効です。
タスクを開く →
animate this hero frame into a 4-second premium product reveal
(referencing the gpt-image-2 artifact in this task)

これはワークスペース内のアーティファクトを開始フレームとして使う image-to-video です。URL も再アップロードも不要です。

Kollab でこのプロンプトを実行
Kollab を開いて Veo 3.1 でこのプロンプトを実行しましょう。設定不要で、ネイティブ音声はデフォルトで有効です。
タスクを開く →

作業単位が変わる理由

この 2 年間、「AI 動画」とは多くの場合、「Web サイトに行き、モデルを選び、クレジットを買い、プロンプトを書き、待ち、ダウンロードし、音声追加のために別ツールへ移動し、延長のためにまた別ツールへ移動し、納品する」 ことでした。5 つのタブ、4 つのログイン、3 つのサブスクリプションです。

本当に面白い変化は、世界最高レベルの動画モデルが、すでに使っているワークスペース内で自然言語 1 行から呼び出せるようになることです。画像、脚本、過去のテイク、チームの作業のすぐ隣で使える。これは「ツールとしての AI 動画」ではありません。タスクが呼び出せるプリミティブとしての AI 動画です。

Veo 3.1 はモデルです。Kollab は、それを実際の仕事に変えるランタイムです。

Kollab で Veo 3.1 を実行
GCP 設定不要。8 秒制限を回避。リーダーボード首位の動画モデルが、任意の Kollab タスクでデフォルトとして使えます。
タスクを開く →

FAQ

Veo 3.1 とは何ですか? Veo 3.1 は、Google DeepMind が 2025 年 10 月 15 日にリリースした動画生成モデルです。text-to-video と image-to-video の両方で Video Arena 1 位となり、Veo 3.0 から 30 ポイント上昇し、Video Arena 史上初の 1400 超えを記録しました。最大 1080p、ネイティブ音声付きの 8 秒クリップを生成します。

Kollab の Veo 3.1 は Google 公式と同じモデルですか? はい。Kollab は Google API 上の同じ GA モデルである veo-3.1-generate-001 を Vertex AI 経由で呼び出します。生成、Extend、音声、比率、解像度は公式モデルと同じ挙動です。

Veo 3.1 で 8 秒を超える動画を作れますか? 公式の Veo 3.1 API や Google Vids ではできません。各クリップは 8 秒に制限されます。Kollab には veo3 chain コマンドがあり、Extend ジョブを自動発行し、各セグメントを次のソースとして渡すことで、1 チェーンあたりおよそ 30 秒まで構築できます。

Google Cloud プロジェクトや Vertex AI アクセスは必要ですか? いいえ。Kollab の skills-server が Vertex AI 認証情報、ポーリング、アーティファクトアップロードを管理します。必要なのはプロンプトを書くことだけです。

Kollab の Veo 3.1 は image-to-video と Extend に対応していますか? はい。image-to-video では任意のタスクアーティファクトを --first-frame-ref artifact:<id> として渡せます。既存クリップを続ける場合は veo3 extend "..." --source-video-job-id <previous-job-id> を使えます。Chain はこの 2 つを組み合わせます。

Higgsfield、HeyGen、Arcads と何が違いますか? それらの製品は Veo 3.1 をクレジットパック、クリップ単価、独立したインターフェースの裏側にラップしています。Kollab は、脚本、画像、過去のテイク、ワークスペースの他の作業と並んだ任意のタスクから同じモデルを直接呼び出せます。さらに chain と Extend が 1 つのコマンドに組み込まれています。

価格はどうなりますか? Kollab の Veo 3.1 生成は、ワークスペース内の他の長時間タスクと同じようにタスククレジットを消費します。別のクレジットパック購入やサードパーティ側の制限はありません。


Sources: [@GoogleDeepMind](https://x.com/GoogleDeepMind/status/1978491999029219364) (launch), [Arena.ai](https://x.com/arena/status/1980319296120320243) (leaderboard), [@bilawalsidhu](https://x.com/bilawalsidhu/status/1978497357760311500), [@EHuanglu](https://x.com/EHuanglu/status/1981351877116879196), [@HeyGen](https://x.com/HeyGen/status/1979220312438055018), [@venturetwins](https://x.com/venturetwins/status/1988291582337098219), [@GeminiApp](https://x.com/GeminiApp/status/1998528052901388324), [r/singularity](https://www.reddit.com/r/singularity/comments/1o7psz2/will_smith_eating_spaghetti_in_veo_31/). 引用テキストは元の著者に帰属します。参照は解説目的です。

このテーマをさらに読む

記事から製品詳細、比較、ワークフロー例へ進み、Kollab がどんなチーム場面に合うかを確認できます。

関連記事