照片变视频:AI 图生视频完整教程
用 AI 图生视频把任意照片变成动态视频:怎么选模型、怎么描述运动和运镜、哪些错误会毁掉结果,一文讲清。
2026年7月2日
SeeAny

图生视频是拿到好 AI 视频最稳的路:不让模型凭文字凭空造场景,而是给它一张成品画面——照片、渲染图、插画——它只需要造运动。构图、主体、风格都已经锁死了。
图生视频的原理
上传一张静图作为首帧,再加一句描述"什么该动"的提示词,模型就从你这张图开始生成 5–12 秒的视频。Seedance 2.0、Kling、Wan 都是这个玩法;在 SeeAny 里,只要你附上参考图,系统会自动切换到对应模型的图生视频变体。
选对底图
底图决定了大半效果。这些最能打:
- 单一清晰主体、周围留白——大杂烩式拼贴会让运动混乱。
- 自带动势:甩到一半的头发、风中的布料、抬起的手臂、烟雾。
- 光线方向明确——模型能令人信服地延续它。
- 人像、产品图、游戏/角色立绘、风景,都很好动起来。
避开大面积文字、人群里的小脸、极端鱼眼畸变。
只描述运动
提示词只写运动——画面本身该有的,图里已经有了:
- "缓慢的电影感推镜,斗篷和头发随风飘动,火星向上飘。"
- "镜头绕产品向右环绕,影棚反光柔和移动。"
- "轻微的呼吸起伏,眨眼,头微微转向镜头。"
一个运镜 + 一两个主体动作就够。一条片里塞五个动作,是画面扭曲最常见的原因。
常见错误
- 完全不写运动——得到一条几乎静止、只有随机漂移的片。
- 和画面矛盾(坐着的人写"她在奔跑")——等着看肢体崩坏吧。
- 一上来就生成长片——先用 5 秒迭代,选出胜者再跑长时长。
- 忽略画幅——输出比例要和底图比例一致。
在 SeeAny 里做
打开视频工作台,附上照片,写一行运动描述,生成——图生视频变体会自动选中。要批量试稿?先用便宜档模型,见 Seedance 2.0 Mini 指南。手头没有合适的底图?先去图片工作台生成一张。