提示词方法论
2026-06-23 12:00真正的方案应该这么设计:先别急着让 AI 生成“一个完整...
提示词写作方法论,可作为生成/优化 Prompt 的结构化起点。
提示词方法论
提示词
分镜
空间
AI视频
剧本
1,969 字4 min
真正的方案应该这么设计:先别急着让 AI 生成“一个完整短剧”,那基本必崩。你要把它拆成“舞台母场景 + 人物表演段落 + 灯光转场 + 后期配音剪辑”。也就是说,AI 只负责生成一段一段稳定的舞台画面,剧情完整性靠你在剪辑里完成。舞台剧短剧的优势不是画面多,而是“一个空间里发生了强冲突”。比如两个人坐在桌前,一句“你知道我为什么今天叫你来吗?”就能立住戏;如果你一上来让 AI 做追车、吵架、摔门、换景、近景哭戏、多人围观,它就会把人物脸、手、空间关系全搞乱。 第一步,先定“舞台剧短剧”的形式。它不是传统短剧,也不是PPT讲课,更不是普通MV。它应该像“黑盒剧场里的短视频戏剧片段”:观众一眼知道这是舞台,画面可以有点夸张,但人物关系要清楚。最稳的类型有三种:第一种是知识剧情化,比如“一个普通人和未来的自己在舞台上对话,讲AI技能/理财/职场选择”;第二种是情绪短剧,比如“父亲、女儿、老板、员工之间的一场摊牌”;第三种是政策/财经/社会议题戏剧化,比如“一个人收到裁员通知,另一个人告诉他真正的变化是什么”。这类形式不靠大动作,而靠对话、停顿、转身、灯光变化、音乐推进,非常适合 AI。 第二步,要先做一个“舞台世界观母版”。这个母版就是所有段落共用的舞台设定,不能每一段都临时写,不然每条视频看起来都像不同剧院拍的。你可以给他固定成这种结构:黑色剧场大舞台,观众视角正前方远景,中央一张木桌,两把椅子,后方是半虚化的房间布景或者巨大LED屏幕,左右有高墙和门框,地面是冷蓝色舞台光,顶部有暖色追光,背景暗,人物被舞台灯打亮。这个母版要反复出现在每个提示词里,等于给 AI 一个“舞台锚点”。AI 视频里最重要的不是一句“高级舞台感”,而是这些具体锚点:桌子在哪里,人物在哪里,光从哪里来,背景是什么,镜头从哪里看,动作幅度有多大。 第三步,剧本要按“舞台节拍”写,不要按影视分镜写。普通短剧可能是“开门、进屋、摔文件、切老板脸、切员工脸、闪回、街景、电话响”,这个对 AI 很不友好。舞台剧版本应该改成:“灯亮,两个人已经坐在桌前;沉默三秒;左侧人物把一份文件推到桌中央;右侧人物没有立刻接,只是看着对方;灯光慢慢压暗背景,追光集中到文件;一句关键台词出现。”你看,这里面动作非常少,但戏剧张力很强。AI做这个比做真实办公室吵架稳多了。 第四步,镜头策略必须保守。舞台剧短剧最好 70% 用大远景或中远景,20% 用中景,10% 才用近景。大远景负责保持舞台完整性,中景负责看清人物关系,近景只在一句最关键台词时使用。千万不要让 AI 一直做电影式近景,因为近景一多,脸很容易漂,嘴型也容易怪。你可以把镜头固定成四种:正面大远景、轻微推近中景、侧前方中景、最后定格式舞台全景。这样做出来不土,反而像正式剧场录像加影像化包装。 第五步,人物设计要少而准。最稳是两个人,一男一女、老板员工、父女、老师学生、未来自己和现在自己都行。三个人已经明显增加难度,五个人以上基本进入灾难区。每个人要有固定位置,比如 A 永远在桌左侧,B 永远在桌右侧;A 穿深色西装,B 穿浅色衬衫;A 负责压迫感,B 负责情绪反应。不要让他们频繁交换位置。AI视频里“左右关系”一乱,观众会立刻出戏。舞台剧的好处就是允许人物站位像棋子一样稳定,观众不会觉得假,反而觉得这是舞台语言。 第六步,动作要写成“可控微动作”,不要写大动作。适合写:缓慢抬头、手指轻敲桌面、把文件推过去、站起半步又坐下、转身看向黑暗处、低头沉默、椅子轻轻后移、追光打到脸上。不适合写:激烈争吵、奔跑、推搡、打斗、多人拉扯、摔杯子、哭到变形、扑过去拥抱。AI视频不是不能做动作,而是动作越大,人物结构越容易崩。舞台短剧要靠“克制动作 + 强台词 + 灯光变化”制造高级感。 第七步,灯光是这类视频的灵魂。普通 AI 短剧常常假,是因为它在装真实生活;舞台剧不用装真实,它可以直接用灯光表达心理。比如“他说出真相时,背景房间灯光熄灭,只剩桌面一束冷白追光”;“女主沉默时,地面蓝光变深,后方墙面出现巨大影子”;“结尾时,舞台后方亮起暖黄色门缝光,像一个出口”。这些都是 AI 很擅长的画面语言。你甚至可以用灯光转场代替复杂剪辑:黑场一秒,灯再亮,人已经换了姿势,观众会自然接受。 第八步,声音不要交给视频模型硬生成,最好后期做。舞台剧短剧真正抓人的是台词、停顿、呼吸、脚步声、椅子声和空间混响。AI视频负责画面,台词用配音软件或者真人配音,后期加一点剧场混响,立刻高级很多。嘴型可以不强求完全对齐,因为舞台远景里观众看不清嘴型,反而更安全。你可以让画面里人物“正在低声说话、轻微张口”,然后后期配音盖上去。要是做近景台词,最好一句话别超过 5 秒,且镜头动作不要复杂。