loading image

AI人像写真总出图不像本人?12个提示词模块实战拆解,系统解决可复用

Posted by Enovace on May 3, 2026

AI人像写真总出图不像本人?12个提示词模块实战拆解,系统解决可复用

Banner

看看这几天我一直在反复做 AI 人像写真。
从鬼马少女写真,到韩系情侣棚拍;从旅行九宫格,到真实素颜特写;从单人照,到牵手、贴脸、环抱、手部特写。

一开始我以为,AI 人像出片靠的是几个审美词:
高级感、韩系、胶片感、杂志感、自然光、真实摄影。

后来发现,这些词只能决定大方向。
真正决定一张图能不能从“还行”变成“像一组认真拍出来的写真”,靠的是一整套摄影企划式提示词结构。

这篇文章想总结我这几天踩出来的经验。
读完至少可以拿到三件事:

  1. 为什么同样上传真人照片,有的人出图像本人,有的人出图像陌生网红
  2. 为什么一组 AI 写真容易出现同角度、同表情、同姿势
  3. 一套真正能复用的人像写真提示词,应该控制哪些模块

真正能开源的 AI 人像精品提示词,不只是“会不会写 prompt”,它更像是在替 AI 做一次完整的摄影策划。


01|第一句先写清楚:上传照片只作为身份参考

这是我这几天最重要的发现之一。

很多人上传个人照片后,生成结果会变成“原图美化版”。

如果原图是在咖啡店,AI 就继续保留咖啡店。
如果原图穿黑衣服,AI 就继续生成黑衣服。
如果原图里有杯子、桌子、坐姿,AI 也会下意识沿用。

所以真人写真提示词里,第一句非常关键:

请只把上传照片作为人物身份参考,用于保留本人真实长相。不要保留原照片里的背景、衣服、道具、坐姿、拍摄环境和原始构图。请重新生成一张全新的写真。

这句话会直接改变任务方向。

它告诉 AI:
保留人,不保留原图。

很多时候,成败就在这一句。


02|身份保留不能只写“像本人”,要拆成具体锚点

“请保留本人长相”太泛了。

AI 经常会自动把人变得更精致、更网红、更标准化。
单张看可能漂亮,但已经不像本人。

所以我现在会把身份锚点拆开写:

请严格保留人物真实身份特征,包括脸型、五官比例、眉眼结构、眼睛、鼻子、嘴唇、肤色、年龄感、发际线、发型基础和整体气质。

然后再加一组负面约束:

不要把人物变成陌生人,不要欧美化,不要网红化,不要过度美颜,不要生成 AI 假脸。

这类话看起来很直白,但确实有效。


03|发型不能硬套模板,要按 3 个变量控制

我一开始做鬼马少女写真时,会把发型写成统一版本:
深棕黑长发、轻薄空气刘海、自然披散。

后来发现,这样对某些用户来说出来的效果很奇怪。
因为每个人上传照片里的发型基础不同。
硬套统一发型,反而会降低相似度。

现在我会把发型拆成 3 个变量。

变量一:头发长度决定发型方向

短发用户保持短发体系。
中长发用户保持中长发体系。
长发用户保持长发体系。
可以优化蓬松度、发尾弧度、层次感,但不要大幅改变长短。

变量二:是否有刘海要跟随原图

有刘海,就保留刘海属性。
可以优化成轻薄刘海、碎刘海、空气刘海。
没有刘海,就保持无刘海或少量脸侧碎发。
不要强行加厚刘海。

刘海对“像不像本人”的影响非常大。

变量三:发色参考原图,但做写真化处理

如果原图是黑发,我现在不会直接写“黑发”。
纯黑、死黑,在写真里很容易吃掉头发层次。

更稳定的写法是:

如果原图发色偏黑,请不要生成纯黑或死黑头发,请处理为更自然的深棕黑、黑茶色或柔和深咖色,让头发更有层次和通透感

发型应该是在本人基础上的写真化优化。


04|妆容是风格锚点,尤其是少女写真

鬼马少女写真这组让我很明显感受到:
妆容不对,风格就不对。

同样是托腮、wink、发夹、棉花糖。
妆容不到位,整张图可能变成普通自拍、网红写真、证件照美化。

鬼马少女写真最适合的妆容,我总结成这套:

韩系鬼马少女感妆容:
清透奶油肌底妆,保留自然真实质感;
自然柔和平眉;
浅粉棕或蜜桃粉眼妆;
卧蚕自然明显;
睫毛纤长清晰;
眼线细而自然;
大面积粉色或蜜桃粉腮红,从脸颊延伸到眼下,并带一点鼻尖红晕;
嘴唇为水润草莓粉、蜜桃粉或柔和玫瑰粉。

其中最关键的是两点:

第一,眼下到脸颊的粉感。
第二,水润但不厚重的唇妆。

这两个点会直接决定画面有没有灵气。

做一整组写真时,妆容方向最好统一。
每张可以轻微变化,但不要九张图九种妆。

一组图要像同一次拍摄,而不是九次随机换妆。

鬼马少女写:
x.com/zhongying14/status/2051661501824442656?s=20


05|单张生成通常比直接九宫格更稳定

如果只是想快速看氛围,可以一次生成 3×3 九宫格。

但如果目标是高质量成片,我现在更推荐:
单张生成 6 到 9 次,再选图拼成九宫格。

因为九宫格一次生成时,AI 要同时处理 9 张小图,很容易出现:
脸不像同一个人、表情重复、动作重复、手部崩坏、道具细节乱、每一格质量不平均等等问题

单张生成时,模型注意力集中在一张图上,脸、手、表情、构图、道具和光线都更容易控制。

真正像摄影企划的九宫格,也更接近:
先拍很多张,再选出最好的一组。

手机随拍iPhone相册:
x.com/zhongying14/status/2050458315268759898?s=20
x.com/zhongying14/status/2051579281965248987?s=20


06|服装、头饰、道具负责“记忆点”

一套好的人像写真,不能只说风格。

比如鬼马少女写真,如果只写:
韩系、俏皮、可爱、少女感。
出来的图很容易泛。

要让画面具体起来,就需要设计视觉记忆点。
比如:

透明果冻发夹、星星发夹、亚克力小花发夹、彩色串珠戒指、棉花糖、泡泡机、玩具相机、毛绒玩偶、彩色冰棒、奶昔杯

这些道具和配饰会让画面更有辨识度。

但同时一定要写:
不要照搬参考图里的服装和道具,请进行二创设计。

参考图提供的是感觉。
真正开源或复用时,重点是提炼风格结构,而不是复制某张图。


07|情侣写真最难的是“关系感”

情侣写真比单人写真难多了。
因为它不仅要像两个人,还要像一对情侣。

很多 AI 情侣照的问题是:
两个人只是靠在一起、眼神没有交流、动作像样片、身体比例奇怪、表情都是同一种微笑、关系看起来很空

所以情侣写真里,我会单独写“眼神与关系控制”。

核心是写清楚:
谁更主动、谁在回应、谁看镜头、谁看对方、谁闭眼笑、谁被逗笑、谁在承接对方靠近

比如:

女生从背后抱住男生,男生闭眼大笑,像被她逗到忍不住笑出来。女生也低头笑,把脸靠近男生肩后,动作像刚刚发生,而不是摆好再拍。

这比“亲密情侣合照”有效很多。

关系感不能只写“亲密”。
要写出动作里的主次、回应和情绪流向。

韩系杂志情侣写真:
x.com/zhongying14/status/2052267221649441221?s=20


08|眼神不能空,要安排“眼神流向”

很多 AI 人像看起来没有灵魂,问题通常在眼神。

眼神空、眼神直、眼神像模特完成任务。
画面再干净,也会像样片。

我现在会在提示词里单独安排眼神流向:

有的镜头看向镜头,眼神平静柔和,带一点温度;
有的镜头看向对方,目光自然、轻柔、专注;
有的镜头看向镜头外侧,像情绪刚刚流动到某个瞬间;
有的镜头闭眼轻笑,像真实互动中被逗笑的一瞬间。

尤其是情侣写真,不能每张都双双看镜头。

一组里要有:
看镜头、看对方、看镜头外、闭眼笑、低头笑、抬眼看、从对方肩后探出脸
眼神一变,关系就活了。


09|表情和角度要有“瞬间捕捉感”

AI 图一旦太工整,就很容易像样片。
真正有灵魂的写真,通常都有一点“刚好被拍到”的感觉。

所以提示词里要写:

动作像正在发生,而不是已经完成后静止摆拍;
表情像情绪刚刚流动出来;
允许不完全看镜头;
允许轻微不对称;
允许刚靠近、刚转头、刚低头笑、刚抱住、刚贴脸的一瞬间;
允许笑容正在展开或刚刚收住。
表情也不能只有“微笑”。

一组图最好有节奏:

平静带淡淡笑意
闭眼轻笑
忍不住笑出来
被逗笑后的自然大笑
轻微害羞
安静放松
若有所思但温柔

脸部角度也要变:

正面
半侧脸
侧脸
微微低头
抬眼
从肩后探出脸
只露半张脸
贴脸局部特写

这一组变化,会让图片更像真实摄影师连续拍摄出来的选片。


10|AI 会偷懒,必须主动管住角度、姿势和位置

这是我这几天另一个很强的体感:
AI 会偷懒。

如果提示词不够明确,它很容易回到最省力的默认解法:

  • 每张都差不多 45° 脸
  • 每张都类似半身站姿
  • 每张人都在画面中间
  • 每张都是轻微笑
  • 每张手都放在差不多的位置
  • 情侣照里总是同一种靠近方式

所以一组写真里,要明确禁止重复:

请避免整组图片出现相同角度、相同站位、相同构图和相同姿势的重复。每一张都要有明确区别,像同一次拍摄中不同镜头语言的选片,而不是同一张图的重复变体。

不要只写“丰富一点”。
要把变化写成结构要求。

比如一组情侣写真,可以先写镜头表:

01 正面贴近双人半身
02 从背后环抱,大笑抓拍
03 环抱但情绪收一点
04 男生单人页 + 女生手托脸
05 女生单人页 + 男生手托下巴
06 贴脸特写
07 牵手 / 手部细节特写
08 肩靠肩收束页

这样 AI 不容易复读。成片感是人先把镜头设计好。


11|双人互动要写清楚左右、前后和身体归属

人像越靠近,越容易翻车。

尤其是这些场景:
托脸、牵手、贴脸、环抱、手部特写
一个人从背后靠近另一个人
一个人的手从画面边缘伸入

所以复杂互动里,左右关系和身体归属要写细。

比如:

男生坐在前景偏左位置,女生坐在他后方偏右位置。女生从男生肩后探出脸看向镜头,右手轻轻搭在男生右肩上。男生低头轻笑,看向画面左下方。

这比“女生从后面靠近男生”稳定很多。

再比如托脸:

女生在画面右侧,男生在画面左侧。男生用右手轻轻托住女生下巴,女生的左手自然搭在男生手腕上。

当画面涉及身体接触时,要写清楚:

谁在左边、谁在右边、谁在前景、谁在后景、谁更靠近镜头、谁用左手、谁用右手、手碰到哪里、脸贴在哪里

AI 人像的高级提示词,本质上是在做镜头管理。


12|身体比例和肢体结构要单独约束

情侣写真、贴脸照、环抱照、牵手照,非常容易出现人体结构问题。

在总控里要加一段比例约束:

请特别注意两个人的脸部比例、头身比例、肩宽、脖颈长度、手臂长度、手掌大小和整体体态都要自然协调。两个人贴脸、靠肩、环抱、托脸、牵手时,身体接触必须符合真实人体结构,不要出现手臂穿插、身体重叠错误、脸部融合或 AI 拼接感。

这类提示词看起来不浪漫,但非常实用。

越是亲密动作,越要写清楚人体结构和空间关系。


13|一套精品人像提示词,其实是一份摄影策划案

这几天做下来,我对 AI 人像提示词的理解变了,它已经不只是几句审美描述。一套真正能复用的人像写真 prompt,至少要包含这些模块:

身份保留
场景重建
发型变量
妆容体系
服装配色
配饰道具
镜头构图
表情节奏
眼神关系
左右位置
身体归属
人物比例
负面约束
成片结构

这些模块加起来,才会让 AI 从“随机生成好看的图”,变成“按摄影企划执行一组写真”。

能把摄影里的隐性经验写成模型能执行的结构,做出一整套像杂志选片的写真。
差距就在这些细节里。

最后:我的 AI 人像提示词框架

如果只保留一个最小框架,我会这样写:

1. 只把上传照片作为身份参考,不保留原图背景、衣服、场景和构图。
2. 明确身份锚点:脸型、五官比例、眉眼结构、肤色、年龄感、发际线、发型基础、整体气质。
3. 发型按三个变量控制:长度、有无刘海、发色,不硬套模板。
4. 妆容作为风格锚点,整组保持统一。
5. 服装、配饰、道具负责画面记忆点,但要二创,不照搬参考图。
6. 一组图先写镜头表,避免 AI 重复角度、姿势和构图。
7. 情侣写真要写眼神、关系、主动方、回应方和情绪流向。
8. 特写和身体互动要写左右、前后、手部归属和接触点。
9. 亲密动作必须增加人物比例、肢体结构和空间关系约束。
10. 最终目标是让每张图都像真实摄影师捕捉到的一个瞬间。

这就是我这几天做 AI 人像最大的收获:

好的人像 prompt 不是把画面夸得多美。
它是在替 AI 建一个完整的拍摄现场。

这些细节写清楚后,AI 人像才真正开始有“照片感”和“灵魂感”。

也更接近一套可以开源、复用、迭代的精品提示词系统。