
如何用一张产品图做 AI 产品视频
这是一套适合电商详情页、落地页、TikTok 和 Reels 的实战流程,教你用 GPT Image 2 把一张产品图变成能投放、能展示的短视频。
如果你手上已经有一张干净的产品图,其实不需要传统视频拍摄,也能先把产品视频跑起来。
在 GPT Image 2 里,一张质量足够好的产品图,可以扩成商品详情页视频、品牌落地页 hero、TikTok 广告素材,或者短小的产品展示 clip。关键往往不在“加多少特效”,而在于你有没有把镜头目标和 prompt 写清楚。
下面这套流程,就是我们更推荐的产品视频生成方式。
第一步:先选对源图
AI 视频不是凭空帮你“救图”,它会把源图里的优点和问题一起放大。
更适合做产品视频的图片,通常具备这些特点:
- 产品轮廓清楚
- 分辨率足够,材质和包装信息可读
- 光线干净,不会把边缘打糊
- 画面周围留有一点空间,方便做镜头运动
如果源图本身就拥挤、发灰、裁切太死,后面的生成成本通常会更高。
第二步:写 prompt 之前,先定镜头任务
很多产品视频看起来“不像广告片”,不是模型不行,而是还没想清楚这条视频到底要干什么。
正式生成前,先回答四个问题:
-
投放位置是什么? 商品详情页、品牌官网、广告投放,还是 TikTok / Reels?
-
用户第一眼应该看到什么? 是 logo、包装、材质、颜色,还是使用场景?
-
镜头运动是什么? 环绕、推进、揭示、漂浮式 hero shot,还是更像手机拍摄的社媒镜头?
-
氛围是什么? 高级、干净、轻快、戏剧化,还是年轻有冲击力?
这四件事先定下来,prompt 会立刻清晰很多。
第三步:不要写“酷一点”,要写成结构化 prompt
与其写“做一个高级产品视频”,不如直接写成这种结构:
Create an 8-second product video from the uploaded image.
Show a slow camera orbit with a gentle push-in.
Keep the product centered and label readable.
Use soft studio lighting, clean reflections, and a premium ecommerce look.
Motion should feel polished and controlled, not chaotic.
Output should work for a landing page hero and paid social cutdown.这样你后面只需要替换其中一个模块:
- 镜头:orbit、push-in、tilt、reveal
- 光线:studio、daylight、rim light
- 氛围:premium、playful、minimal、energetic
- 用途:landing page、TikTok、Reels、storefront ad
第四步:模型按任务选,不要一把梭
不同阶段没必要用同一个模型。
- Google Veo 3.1:适合先验证产品镜头方向,稳。
- Google Veo 3.1 Quality:适合做最终成片,尤其是官网和高要求广告素材。
- Kling 2.6 / 3.0:适合更有动感的社媒变体。
- Seedance 2 Fast:适合快速测试多个开场、多种比例。
- Wan 2.7:适合镜头逻辑更明确、提示词结构更强的场景。
如果你还没决定模型,建议先看这篇 模型对比文章。
第五步:比例和时长,要跟渠道绑定
不要脱离投放位置去决定输出参数。
| 使用场景 | 推荐比例 | 推荐起始时长 |
|---|---|---|
| 商品详情页 hero | 16:9 | 6 到 8 秒 |
| 横版广告素材 | 16:9 | 6 到 10 秒 |
| TikTok / Reels / Shorts | 9:16 | 5 到 8 秒 |
| 电商 listing video | 1:1 或 16:9 | 5 到 8 秒 |
如果第一秒已经能抓住人,其实不一定需要很长的 clip。
第六步:先跑低风险版本,再升级成片
很多人最浪费的地方,是还没证明创意有效,就直接用最贵、最慢的设置去跑。
更好的顺序是:
- 先生成一个较短的第一版
- 看这个运动方向到底有没有帮产品加分
- 只改最弱的一环
- 最后再把赢的版本升到更高质量
这样通常更省时间,也更容易收敛出稳定结果。
哪些错误最容易让产品视频看起来很假?
-
一个镜头里塞太多动作 环绕、爆炸、发光、液体飞溅、镜头推进同时出现,通常只会让焦点变乱。
-
prompt 全是形容词,没有视觉指令 “高级一点”远不如“soft studio lighting, slow orbit, clean reflections”有效。
-
源图本身就弱 低质量输入,只会生成更贵的低质量输出。
-
比例不匹配 同一个 16:9 镜头逻辑,放进 9:16 不一定还能成立。
-
产品不可读 如果运动过程中 logo、包装、产品形状变得不清楚,这条视频就不再能卖货。
一套大多数团队都能复用的产品视频流程
如果你想要一个稳定、可重复的工作流,可以直接按这个来:
- 选一张干净的产品图
- 先定渠道和镜头目标
- 写一条结构化 prompt
- 生成短版第一轮
- 只优化最弱的部分
- 把赢的版本升级成最终成片
如果你想直接进入公开产品页,可以看 AI Product Video Generator。如果你需要更通用的图生视频入口,用 Image to Video Generator。如果你想给产品加更强的风格化动态,可以继续看 Video Effects。

