返回模板库
详情页
角色卡/真实摄影
2026-07-02 17:17

多参考图融合生成协议

用于角色设定、角色卡或参考图生成,强调真实摄影质感、身份一致性和去 AI 油画感。

角色卡/真实摄影
真实摄影
空间
参考图
1,9994 min
你现在执行一套【多参考图融合生成协议】。目标不是简单拼图,也不是平均融合所有参考图,而是先判断每张参考图的职责,再按优先级重建一张逻辑清晰、主体稳定、画面高级、细节不脏不碎的新图。

请严格按以下流程工作:

第一步:参考图分工

请先分析所有参考图,并给每张参考图分配明确职责。不要让所有参考图同时控制所有内容。

参考图1负责:主体身份 / 人物长相 / 产品外形 / 核心识别点。
参考图2负责:姿势动作 / 身体状态 / 手势 / 运动趋势。
参考图3负责:构图比例 / 画面布局 / 镜头距离 / 主体在画面中的位置。
参考图4负责:光影氛围 / 色彩倾向 / 材质质感 / 摄影风格。
如果某张图没有对应功能,只提取它最有价值的一项,不要强行继承无关内容。

第二步:冲突排序

当参考图之间发生冲突时,必须按以下优先级处理:

身份识别优先于动作姿势。
动作姿势优先于服装小细节。
构图布局优先于背景装饰。
真实摄影逻辑优先于夸张美化。
主体一致性优先于局部好看。
清晰可控优先于复杂堆料。

如果两张参考图都影响人物脸部、身体比例、服装结构或产品形态,必须选择一张作为主权图,另一张只能作为辅助,不允许平均融合导致身份漂移、五官变形、结构混乱。

第三步:证据分析

请从参考图中提取可被画面证明的视觉证据,而不是主观脑补。

需要提取:
主体的核心识别点:脸型、五官比例、发型、体型、服装结构、产品轮廓、关键标志。
状态证据:站姿、坐姿、转身角度、手的位置、身体重心、动作方向。
摄影证据:镜头高度、景别、焦段感、景深、光源方向、阴影落点、画面比例。
材质证据:皮肤质感、布料纹理、金属反光、玻璃透明度、塑料质感、纸张颗粒、环境表面细节。
风格证据:色温、对比度、饱和度、颗粒感、锐度、真实感或插画感。

禁止把参考图中不存在的东西当成必须继承内容。禁止因为某张参考图好看,就擅自继承它的人物身份、服装、背景或风格污染主图。

第四步:身份锁定

请锁定最终图的唯一主体身份。无论后续动作、构图、光影、风格如何变化,主体身份不能漂移。

人物类任务需要锁定:
同一张脸、同一年龄感、同一性别气质、同一发型逻辑、同一体型比例、同一服装主结构、同一核心饰品或识别物。

产品类任务需要锁定:
同一外形比例、同一结构关系、同一材质、同一品牌标识位置、同一功能部件、同一边角形态、同一颜色系统。

角色类任务需要锁定:
角色身份、服装层级、发色发型、标志性道具、世界观气质、角色辨识度。不能因为换风格或换镜头而变成另一个人。

第五步:状态及动作转译

请把参考图中的动作和状态转译到最终主体身上,而不是直接复制参考图的人物或物体。

动作转译必须遵守:
只继承动作逻辑,不继承错误身份。
只继承姿态关系,不继承无关服装。
只继承身体重心,不继承参考图的脸。
只继承手势方向,不生成畸形手指。
只继承运动趋势,不制造不合理肢体扭曲。

如果动作复杂,请明确身体结构:
头部朝向、视线方向、肩膀角度、胸腔朝向、腰胯扭转、双手位置、双腿支撑点、身体重心、动作开始和结束趋势。

动作必须自然、可拍摄、符合人体结构或产品物理逻辑。禁止出现多余手臂、断裂肢体、漂浮物体、方向错乱、动作前后矛盾。

第六步:摄影系统重建

请根据参考图建立一个完整摄影系统,而不是只堆风格词。

最终画面需要明确:
镜头类型:近景 / 中景 / 全身 / 特写 / 俯拍 / 仰拍 / 平视。
焦段感:手机随手拍 / 35mm纪实 / 50mm人像 / 85mm浅景深 / 广角空间感。
机位高度:眼平、胸口高度、腰部高度、低机位、高机位。
光源系统:主光方向、辅光强度、背景光、阴影、反光。
画面质感:真实摄影、自然颗粒、适度锐度、不过度磨皮、不过度AI精修。
构图逻辑:主体位置、留白区域、视觉重心、前景中景背景层次。

如果是写实图,必须优先真实摄影逻辑。画面应该像真实相机拍出来,而不是塑料感、CG感、过度锐化、过度磨皮、脏碎细节或AI味海报。

第七步:最终验收

生成前必须自检以下项目:

1. 主体身份是否稳定,没有被其他参考图污染。
2. 动作是否自然,身体结构是否合理。
3. 参考图分工是否清晰,没有平均融合。
4. 冲突是否按优先级处理,没有谁都想保留。
5. 构图是否清楚,视觉重心是否明确。
6. 光影是否统一,没有多个不合理光源互相打架。
7. 材质是否真实,细节是否干净,没有脏、碎、糊、乱。
8. 最终画面是否符合用户指定目标,而不是只生成一张看起来好看的无关图。

最终输出要求:

请生成一张高质量、主体稳定、构图清晰、细节干净、身份不漂移、动作自然、摄影逻辑完整的图像。所有参考图只按各自职责参与生成,不允许互相污染,不允许平均融合,不允许为了好看牺牲主体一致性。