AI人像写真总出图不像本人？12个提示词模块实战拆解，系统解决可复用

Banner

看看这几天我一直在反复做 AI 人像写真。
从鬼马少女写真，到韩系情侣棚拍；从旅行九宫格，到真实素颜特写；从单人照，到牵手、贴脸、环抱、手部特写。

一开始我以为，AI 人像出片靠的是几个审美词：
高级感、韩系、胶片感、杂志感、自然光、真实摄影。

后来发现，这些词只能决定大方向。
真正决定一张图能不能从“还行”变成“像一组认真拍出来的写真”，靠的是一整套摄影企划式提示词结构。

这篇文章想总结我这几天踩出来的经验。
读完至少可以拿到三件事：

为什么同样上传真人照片，有的人出图像本人，有的人出图像陌生网红
为什么一组 AI 写真容易出现同角度、同表情、同姿势
一套真正能复用的人像写真提示词，应该控制哪些模块

真正能开源的 AI 人像精品提示词，不只是“会不会写 prompt”，它更像是在替 AI 做一次完整的摄影策划。

01｜第一句先写清楚：上传照片只作为身份参考

这是我这几天最重要的发现之一。

很多人上传个人照片后，生成结果会变成“原图美化版”。

如果原图是在咖啡店，AI 就继续保留咖啡店。
如果原图穿黑衣服，AI 就继续生成黑衣服。
如果原图里有杯子、桌子、坐姿，AI 也会下意识沿用。

所以真人写真提示词里，第一句非常关键：

请只把上传照片作为人物身份参考，用于保留本人真实长相。不要保留原照片里的背景、衣服、道具、坐姿、拍摄环境和原始构图。请重新生成一张全新的写真。

这句话会直接改变任务方向。

它告诉 AI：
保留人，不保留原图。

很多时候，成败就在这一句。

02｜身份保留不能只写“像本人”，要拆成具体锚点

“请保留本人长相”太泛了。

AI 经常会自动把人变得更精致、更网红、更标准化。
单张看可能漂亮，但已经不像本人。

所以我现在会把身份锚点拆开写：

请严格保留人物真实身份特征，包括脸型、五官比例、眉眼结构、眼睛、鼻子、嘴唇、肤色、年龄感、发际线、发型基础和整体气质。

然后再加一组负面约束：

不要把人物变成陌生人，不要欧美化，不要网红化，不要过度美颜，不要生成 AI 假脸。

这类话看起来很直白，但确实有效。

03｜发型不能硬套模板，要按 3 个变量控制

我一开始做鬼马少女写真时，会把发型写成统一版本：
深棕黑长发、轻薄空气刘海、自然披散。

后来发现，这样对某些用户来说出来的效果很奇怪。
因为每个人上传照片里的发型基础不同。
硬套统一发型，反而会降低相似度。

现在我会把发型拆成 3 个变量。

变量一：头发长度决定发型方向

短发用户保持短发体系。
中长发用户保持中长发体系。
长发用户保持长发体系。
可以优化蓬松度、发尾弧度、层次感，但不要大幅改变长短。

变量二：是否有刘海要跟随原图

有刘海，就保留刘海属性。
可以优化成轻薄刘海、碎刘海、空气刘海。
没有刘海，就保持无刘海或少量脸侧碎发。
不要强行加厚刘海。

刘海对“像不像本人”的影响非常大。

变量三：发色参考原图，但做写真化处理

如果原图是黑发，我现在不会直接写“黑发”。
纯黑、死黑，在写真里很容易吃掉头发层次。

更稳定的写法是：

如果原图发色偏黑，请不要生成纯黑或死黑头发，请处理为更自然的深棕黑、黑茶色或柔和深咖色，让头发更有层次和通透感

发型应该是在本人基础上的写真化优化。

04｜妆容是风格锚点，尤其是少女写真

鬼马少女写真这组让我很明显感受到：
妆容不对，风格就不对。

同样是托腮、wink、发夹、棉花糖。
妆容不到位，整张图可能变成普通自拍、网红写真、证件照美化。

鬼马少女写真最适合的妆容，我总结成这套：

韩系鬼马少女感妆容：
清透奶油肌底妆，保留自然真实质感；
自然柔和平眉；
浅粉棕或蜜桃粉眼妆；
卧蚕自然明显；
睫毛纤长清晰；
眼线细而自然；
大面积粉色或蜜桃粉腮红，从脸颊延伸到眼下，并带一点鼻尖红晕；
嘴唇为水润草莓粉、蜜桃粉或柔和玫瑰粉。

其中最关键的是两点：

第一，眼下到脸颊的粉感。
第二，水润但不厚重的唇妆。

这两个点会直接决定画面有没有灵气。

做一整组写真时，妆容方向最好统一。
每张可以轻微变化，但不要九张图九种妆。

一组图要像同一次拍摄，而不是九次随机换妆。

鬼马少女写：
x.com/zhongying14/status/2051661501824442656?s=20

05｜单张生成通常比直接九宫格更稳定

如果只是想快速看氛围，可以一次生成 3×3 九宫格。

但如果目标是高质量成片，我现在更推荐：
单张生成 6 到 9 次，再选图拼成九宫格。

因为九宫格一次生成时，AI 要同时处理 9 张小图，很容易出现：
脸不像同一个人、表情重复、动作重复、手部崩坏、道具细节乱、每一格质量不平均等等问题

单张生成时，模型注意力集中在一张图上，脸、手、表情、构图、道具和光线都更容易控制。

真正像摄影企划的九宫格，也更接近：
先拍很多张，再选出最好的一组。

手机随拍iPhone相册：
x.com/zhongying14/status/2050458315268759898?s=20
x.com/zhongying14/status/2051579281965248987?s=20

06｜服装、头饰、道具负责“记忆点”

一套好的人像写真，不能只说风格。

比如鬼马少女写真，如果只写：
韩系、俏皮、可爱、少女感。
出来的图很容易泛。

要让画面具体起来，就需要设计视觉记忆点。
比如：

透明果冻发夹、星星发夹、亚克力小花发夹、彩色串珠戒指、棉花糖、泡泡机、玩具相机、毛绒玩偶、彩色冰棒、奶昔杯

这些道具和配饰会让画面更有辨识度。

但同时一定要写：
不要照搬参考图里的服装和道具，请进行二创设计。

参考图提供的是感觉。
真正开源或复用时，重点是提炼风格结构，而不是复制某张图。

07｜情侣写真最难的是“关系感”

情侣写真比单人写真难多了。
因为它不仅要像两个人，还要像一对情侣。

很多 AI 情侣照的问题是：
两个人只是靠在一起、眼神没有交流、动作像样片、身体比例奇怪、表情都是同一种微笑、关系看起来很空

所以情侣写真里，我会单独写“眼神与关系控制”。

核心是写清楚：
谁更主动、谁在回应、谁看镜头、谁看对方、谁闭眼笑、谁被逗笑、谁在承接对方靠近

比如：

女生从背后抱住男生，男生闭眼大笑，像被她逗到忍不住笑出来。女生也低头笑，把脸靠近男生肩后，动作像刚刚发生，而不是摆好再拍。

这比“亲密情侣合照”有效很多。

关系感不能只写“亲密”。
要写出动作里的主次、回应和情绪流向。

韩系杂志情侣写真：
x.com/zhongying14/status/2052267221649441221?s=20

08｜眼神不能空，要安排“眼神流向”

很多 AI 人像看起来没有灵魂，问题通常在眼神。

眼神空、眼神直、眼神像模特完成任务。
画面再干净，也会像样片。

我现在会在提示词里单独安排眼神流向：

有的镜头看向镜头，眼神平静柔和，带一点温度；
有的镜头看向对方，目光自然、轻柔、专注；
有的镜头看向镜头外侧，像情绪刚刚流动到某个瞬间；
有的镜头闭眼轻笑，像真实互动中被逗笑的一瞬间。

尤其是情侣写真，不能每张都双双看镜头。

一组里要有：
看镜头、看对方、看镜头外、闭眼笑、低头笑、抬眼看、从对方肩后探出脸
眼神一变，关系就活了。

09｜表情和角度要有“瞬间捕捉感”

AI 图一旦太工整，就很容易像样片。
真正有灵魂的写真，通常都有一点“刚好被拍到”的感觉。

所以提示词里要写：

动作像正在发生，而不是已经完成后静止摆拍；
表情像情绪刚刚流动出来；
允许不完全看镜头；
允许轻微不对称；
允许刚靠近、刚转头、刚低头笑、刚抱住、刚贴脸的一瞬间；
允许笑容正在展开或刚刚收住。
表情也不能只有“微笑”。

一组图最好有节奏：

平静带淡淡笑意
闭眼轻笑
忍不住笑出来
被逗笑后的自然大笑
轻微害羞
安静放松
若有所思但温柔

脸部角度也要变：

正面
半侧脸
侧脸
微微低头
抬眼
从肩后探出脸
只露半张脸
贴脸局部特写

这一组变化，会让图片更像真实摄影师连续拍摄出来的选片。

10｜AI 会偷懒，必须主动管住角度、姿势和位置

这是我这几天另一个很强的体感：
AI 会偷懒。

如果提示词不够明确，它很容易回到最省力的默认解法：

每张都差不多 45° 脸
每张都类似半身站姿
每张人都在画面中间
每张都是轻微笑
每张手都放在差不多的位置
情侣照里总是同一种靠近方式

所以一组写真里，要明确禁止重复：

请避免整组图片出现相同角度、相同站位、相同构图和相同姿势的重复。每一张都要有明确区别，像同一次拍摄中不同镜头语言的选片，而不是同一张图的重复变体。

不要只写“丰富一点”。
要把变化写成结构要求。

比如一组情侣写真，可以先写镜头表：

01 正面贴近双人半身
02 从背后环抱，大笑抓拍
03 环抱但情绪收一点
04 男生单人页 + 女生手托脸
05 女生单人页 + 男生手托下巴
06 贴脸特写
07 牵手 / 手部细节特写
08 肩靠肩收束页

这样 AI 不容易复读。成片感是人先把镜头设计好。

11｜双人互动要写清楚左右、前后和身体归属

人像越靠近，越容易翻车。

尤其是这些场景：
托脸、牵手、贴脸、环抱、手部特写
一个人从背后靠近另一个人
一个人的手从画面边缘伸入

所以复杂互动里，左右关系和身体归属要写细。

比如：

男生坐在前景偏左位置，女生坐在他后方偏右位置。女生从男生肩后探出脸看向镜头，右手轻轻搭在男生右肩上。男生低头轻笑，看向画面左下方。

这比“女生从后面靠近男生”稳定很多。

再比如托脸：

女生在画面右侧，男生在画面左侧。男生用右手轻轻托住女生下巴，女生的左手自然搭在男生手腕上。

当画面涉及身体接触时，要写清楚：

谁在左边、谁在右边、谁在前景、谁在后景、谁更靠近镜头、谁用左手、谁用右手、手碰到哪里、脸贴在哪里

AI 人像的高级提示词，本质上是在做镜头管理。

12｜身体比例和肢体结构要单独约束

情侣写真、贴脸照、环抱照、牵手照，非常容易出现人体结构问题。

在总控里要加一段比例约束：

请特别注意两个人的脸部比例、头身比例、肩宽、脖颈长度、手臂长度、手掌大小和整体体态都要自然协调。两个人贴脸、靠肩、环抱、托脸、牵手时，身体接触必须符合真实人体结构，不要出现手臂穿插、身体重叠错误、脸部融合或 AI 拼接感。

这类提示词看起来不浪漫，但非常实用。

越是亲密动作，越要写清楚人体结构和空间关系。

13｜一套精品人像提示词，其实是一份摄影策划案

这几天做下来，我对 AI 人像提示词的理解变了，它已经不只是几句审美描述。一套真正能复用的人像写真 prompt，至少要包含这些模块：

身份保留
场景重建
发型变量
妆容体系
服装配色
配饰道具
镜头构图
表情节奏
眼神关系
左右位置
身体归属
人物比例
负面约束
成片结构

这些模块加起来，才会让 AI 从“随机生成好看的图”，变成“按摄影企划执行一组写真”。

能把摄影里的隐性经验写成模型能执行的结构，做出一整套像杂志选片的写真。
差距就在这些细节里。

最后：我的 AI 人像提示词框架

如果只保留一个最小框架，我会这样写：

1. 只把上传照片作为身份参考，不保留原图背景、衣服、场景和构图。
2. 明确身份锚点：脸型、五官比例、眉眼结构、肤色、年龄感、发际线、发型基础、整体气质。
3. 发型按三个变量控制：长度、有无刘海、发色，不硬套模板。
4. 妆容作为风格锚点，整组保持统一。
5. 服装、配饰、道具负责画面记忆点，但要二创，不照搬参考图。
6. 一组图先写镜头表，避免 AI 重复角度、姿势和构图。
7. 情侣写真要写眼神、关系、主动方、回应方和情绪流向。
8. 特写和身体互动要写左右、前后、手部归属和接触点。
9. 亲密动作必须增加人物比例、肢体结构和空间关系约束。
10. 最终目标是让每张图都像真实摄影师捕捉到的一个瞬间。

这就是我这几天做 AI 人像最大的收获：

好的人像 prompt 不是把画面夸得多美。
它是在替 AI 建一个完整的拍摄现场。

这些细节写清楚后，AI 人像才真正开始有“照片感”和“灵魂感”。

也更接近一套可以开源、复用、迭代的精品提示词系统。

AI人像写真总出图不像本人？12个提示词模块实战拆解，系统解决可复用

AI人像写真总出图不像本人？12个提示词模块实战拆解，系统解决可复用

01｜第一句先写清楚：上传照片只作为身份参考

02｜身份保留不能只写“像本人”，要拆成具体锚点

03｜发型不能硬套模板，要按 3 个变量控制

04｜妆容是风格锚点，尤其是少女写真

05｜单张生成通常比直接九宫格更稳定

06｜服装、头饰、道具负责“记忆点”

07｜情侣写真最难的是“关系感”

08｜眼神不能空，要安排“眼神流向”

09｜表情和角度要有“瞬间捕捉感”

10｜AI 会偷懒，必须主动管住角度、姿势和位置

11｜双人互动要写清楚左右、前后和身体归属

12｜身体比例和肢体结构要单独约束

13｜一套精品人像提示词，其实是一份摄影策划案

最后：我的 AI 人像提示词框架

You May Also Like

CATALOG

AI人像写真总出图不像本人？12个提示词模块实战拆解，系统解决可复用

01｜第一句先写清楚：上传照片只作为身份参考

02｜身份保留不能只写“像本人”，要拆成具体锚点

03｜发型不能硬套模板，要按 3 个变量控制

04｜妆容是风格锚点，尤其是少女写真

05｜单张生成通常比直接九宫格更稳定

06｜服装、头饰、道具负责“记忆点”

07｜情侣写真最难的是“关系感”

08｜眼神不能空，要安排“眼神流向”

09｜表情和角度要有“瞬间捕捉感”

10｜AI 会偷懒，必须主动管住角度、姿势和位置

11｜双人互动要写清楚左右、前后和身体归属

12｜身体比例和肢体结构要单独约束

13｜一套精品人像提示词，其实是一份摄影策划案

最后：我的 AI 人像提示词框架

You May Also Like

CATALOG

Related Posts