任意输入进,视频出
在一份简报里合并图像、音频、视频和文字,或者直接提交一张草图。输入端完全开放,让视频可以跟随已有的产品、声音、角色或构图,而不是从单一提示框从零开始。
Gemini Omni 是 Google 的新模型,可将几乎任何输入——图像、音频、视频、文本,甚至一张草图——转化为高质量视频,并通过对话反复编辑,场景始终保持记忆。Kollab 在此之上提供共享空间:简报、参考素材、修改版本、生成产物和团队评审。
Kollab 将 Gemini Omni 从单次演示变成完整的创作平台——投入任意输入,通过对话持续编辑,所有简报、参考素材和版本都与团队共享。
在一份简报里合并图像、音频、视频和文字,或者直接提交一张草图。输入端完全开放,让视频可以跟随已有的产品、声音、角色或构图,而不是从单一提示框从零开始。
Gemini Omni 将直觉式物理理解与 Gemini 的现实世界知识结合,让倒入的液体自然沉淀、重量落点真实,画面表现如同现实,而不只是渲染出漂亮的像素。
在多轮对话中重构动作、切换视角或推进灯光电影感。每条指令在上一轮的基础上叠加,角色保持一致,场景记住之前发生的一切。
生成片段、提示词备注、源输入和已批准的最终剪辑都保存为 Kollab 产物,方便整个团队比较轮次、下载结果、复用有效内容。
创建视频,通过对话打磨成型,并将所有输入、提示词、评论和最终资产保存在同一个 Kollab 任务里,而不是分散在各个标签页中。
放入图像、音频、参考视频、文字简报或草图,然后描述主体、运动、风格、时长和画幅比例。
Gemini Omni 将输入转化为带有真实运动感的高质量视频,直接从 Kollab 启动。
在多轮对话中重构镜头、切换视角、调整打光或节奏——场景始终保持角色和状态一致。
在同一任务里生成落地页、广告、社媒帖子、内部评审和营销交付所需的跟进版本。
用同一个 Kollab 共享空间完成 Gemini Omni 的输入、生成、对话式编辑、评审和可复用的营销产出。
将产品照片、语音备注和简短文案转化为电影感亮相视频、功能预热短片和落地页首屏视频。
生成针对不同渠道的剪辑版本,然后逐轮重新协商镜头,适配付费社媒、短视频和受众测试。
在投入制作预算之前,将粗略分镜和情绪帧转化为动态概念短片。
Gemini Omni 是 Google 的新 AI 模型,可从任意输入——图像、音频、视频、文本或草图——生成高质量视频,并通过对话编辑已有视频。Kollab 为团队提供共享空间,内置简报、文件、评审和生成产物。
图像、音频、视频和文字可以组合使用,也可以单独提交一张草图。「Omni」的意义正在于此:输入端完全开放,而不是局限于单一的提示框。
你可以在多轮对话中直接对画面说话来编辑素材——重构动作、切换视角、推进灯光电影感。每条指令在上一轮的基础上叠加,角色和场景状态始终保持一致。
它将直觉式物理理解与 Gemini 的现实世界推理能力结合,让运动表现如同真实世界,并在多轮编辑中保持一致性,而不是每次只产出一次性的短片。
Google 正在分阶段推出 Gemini Omni Flash 层级,开发者和企业 API 将在消费端发布后跟进。你不需要等待——Kollab 今天就已经运行相同的多轮、保持上下文的视频工作流。
演示聚焦于单支短片。Kollab 将输入、提示词、生成视频、评论、评审决策和可复用产物集中在一起,服务整个团队。
Kollab 面向专业营销工作。发布前请查阅 Google 当前使用条款,并确认你对所有参考素材、品牌、肖像或源资产拥有相应权利。

使用 Kollab,将图像、音频、文本和草图转化为 Gemini Omni 视频,再通过对话与团队共同编辑——无需等待 API。