谷歌 Gemini 推出基于 Veo 3 模型的图像转视频功
2025 年 7 月 10 日,谷歌在 Gemini 应用中正式上线了基于 Veo 3 模型的图像转视频功能,为用户带来了全新的创作体验。借助该功能,用户能够将静态照片轻松转化为时长 8 秒的短视频,且视频中包含背景音效、环境声以及语音解说。
谷歌 Gemini 作为一款多功能应用,一直致力于借助人工智能技术为用户提供丰富的创作工具。此次图像转视频功能的推出,无疑是 Gemini 在 AI 领域的重大升级,极大地拓展了用户在内容创作方面的可能性。
Veo 3 AI 模型具备强大的图像处理能力,可识别照片中的各类元素,并依据用户提供的提示词将这些元素动态化。用户操作十分便捷,只需在 Gemini 中点击 “工具” 选项,选择 “视频”,接着上传照片并添加描述,就能生成生动的视频作品。
在具体使用时,用户先上传想要转化的照片,随后添加提示词,详细描述期望照片 “动起来” 的方式。同时,用户还能加入对白、音效或环境声等音频描述,以让最终生成的视频更加生动。谷歌表示,视频的音频和画面将实现 “完美同步”,充分展现用户的创意。生成的视频将以 720p、16:9 横屏的 MP4 格式保存,方便用户在各种平台分享创作成果。无论是为日常物品赋予动画效果,还是让绘画作品 “活” 起来,又或是为自然景象增添动态,该功能都为用户提供了源源不断的创作灵感。
为保护创作者权益,谷歌在所有生成的视频中添加了明显的 AI 水印和隐形的 SynthID 数字水印,便于追踪作品来源,防止作品被滥用。目前,这项视频功能已在部分地区向 AI Ultra 和 AI Pro 用户开放。这种渐进式推出的方式,有助于谷歌收集用户反馈,进一步优化功能。
随着技术的持续进步,谷歌 Gemini 的图像转视频功能势必推动内容创作进入新时代。无论是个人用户还是专业创作者,都能借助这一工具释放创意潜力,创作出更具吸引力的内容。总之,谷歌 Gemini 基于 Veo 3 模型的图像转视频功能,不仅为用户搭建了全新的创作平台,也为 AI 技术在内容创作中的应用开拓了新方向。随着该功能的普及,越来越多的人能够通过简单操作创作出令人惊叹的视频作品,展现独特视角与创意。
财经号声明: 本文由入驻中金在线财经号平台的作者撰写,观点仅代表作者本人,不代表中金在线立场。仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。同时提醒网友提高风险意识,请勿私下汇款给自媒体作者,避免造成金钱损失,风险自负。如有文章和图片作品版权及其他问题,请联系本站。
