loading image

少即是多(实测篇):给AI指明方向

Posted by Enovace on April 23, 2026

少即是多(实测篇):给AI指明方向

Banner

小作文一般的提示词,是不是产出的图像效果就更好?

上篇讲概念,中篇讲问题,实测篇直接上图。


案例一:文章封面

你刷 X 第一眼看到的就是封面,封面很大程度上会决定你点不点进去。

1A:AI 代写提示词

直接让 AI 写这张封面的提示词:

“帮我写个封面提示词,文章标题是'少即是多(实测篇)',要高级、吸引眼球,横版 5:2。”

AI 产出了一大段内容,致命问题在这一句:

……视觉概念:左侧一张混乱的长提示词卡片,充满密集灰色文字、关键词标签;右侧一张简洁的提示词卡片,保留三个核心模块”主体 / 光线 / 构图”,象征”更少的提示词带来更强的控制”。

Image

这不像封面, 像ppt,把文章观点直接画上去了。路人一眼看懂,看完就划走,血亏。

**封面唯一的目的就是勾引读者点击和收藏。**三张卡、一堆连线,全在稀释第一眼的冲击。

横版 5:2 封面,纯白背景,极简瑞士平面设计,黑白高对比,少量红色点缀,大量留白,干净网格排版,现代设计杂志封面质感。主标题中文大字:”少即是多”,粗壮克制,层级强,醒目高级。副标题”实测篇”。

Image

1B:参考图

但本篇文章封面要保持统一的系列感封面,所以要使用到参考图去图生图,直接把密斯肖像原图发给AI,然后产出一张系列相配的封面:

Image

以这张黑白肖像为基础,人物位于画面右侧,左侧大字衬线英文标题 "Less is More" ,下方中文"少即是多",再下方一条细红线 + 小字"实测篇 · FIELD TEST"。副题小字:"AI PROMPTING, PUT TO THE TEST"。

人物身前的建筑模型向左侧逐解构,漂浮成一团细小的提示词关键词标签(SUBJECT、LIGHT、TONE、DETAIL、CAMERA、STYLE、REFERENCE、COMPOSITION……),由密到疏,一条细红线从这团碎片引回右侧那座完整、干净的模型, 5:2横板

Image

**参考图,就是最有效的。**只需要讲一下图片增删的内容即可,模型会自然维持原图的风格。

回头看 1A ,如果纯是AI构思+代写提示词,一致性则很难保证。

1C:手写提示词

假如你手上没有参考图,第一次做封面。大多数人会怎么做?直接输入需求:

一个高端大气的文章封面,标题'少即是多'

Image

完全跑题了,这就是过于“简单”,导致的结果,所以,不是写的少就是好,内容必须要清楚。

1D:同一篇文章,三种平台,三条提示词

封面没有标准答案,也要看平台。但重点都是一致的。

① X 横版 5:2

瑞士极简杂志封面,横版 5:2,标题“少即是多”。

Image

② 公众号头条 2.35:1

公众号头条封面,横版 2.35:1,深色背景,正中一位真人半身像、夸张惊喜表情,一行白色超大标题“别再堆提示词了”,一抹亮色点缀。

Image

③ 小红书竖版 3:4

小红书竖版封面 3:4,画面正中一行超大粗体标题“90%的人,提示词都写反了”。

Image

三条提示词殊途同归,X 立标题,公众号立人脸加关键词,小红书立悬念。

爆款封面的本事,是让一个概念喊得最响、其余全减弱,这一条规则,哪个平台都适用。


案例二:文章插图

封面是门面,插图是节奏。长文没插图,读者看的会很累,人的注意力是需要缓冲来再次集中的,插图和文字的连续配合,才能让人沉下心读下去内容。

2A:给主题配图

以这篇文章的插图为例,文章的主旨是:避免堆砌,要明确方向

第一次测试,把“两个方向”的提示词全都放进去:

"一张概念插图,表达少即是多,极简又丰富,水彩质感混扁平矢量,柔和又强烈,8K 高细节,留白但信息量大,电影级光影"

Image

AI 混搭风格不是问题——水彩加矢量,线条加质感,完全可以共存

**但问题出在这几对提示词:「极简」和「信息量大」;「柔和」和「强烈」在视觉语言里方向相反。**这是两个互斥的指令,模型拿到相反的信号,只能各退一步——极简退成「半极简」,强烈妥协成「不强烈也不柔和」。

方向打架,画面就被稀释,可以看到复杂的松树和石头,纹理等内容充斥在整个画面中,既不极简,也不极繁,倒是有种微妙的感觉?


调整一下提示词内容,我们分成两种方向,一个极简,一个极繁:

极简向:"一张概念插图,极简风,水彩质感混扁平矢量,柔和,8K 高细节,留白,电影光影"

极繁向:"一张概念插图,极繁风,水彩质感混扁平矢量,冲击,8K 高细节,高信息,电影光影"

Image

**两个意象、两种结果:**极简向,AI 不画复杂叶片的松树,只画简单枝条;极繁向,画面尽量塞满元素,不留白。

2B:否定词的自我欺骗

不同模型的提示词写法略有不同,对于 Image-2 来说,提示词应该专注于想要的东西,避免提及不想要的东西。

  • SD:正向 prompt + negative prompt双通道,CFG 在采样时做减法,"不要"有专门去处。
  • gpt-image-2:只有一条自然语言 prompt,没有 negative prompt 接口。

所以在 image-2 里把"不要"写进正向提示词,等于让模型先激活这个概念、再试着压制——模型听得懂,但要分出额外的注意力去压制,所以直接写明正向提示词即可

有人要生成黑白填色本,写 without any color,宽屏反而冒出彩色铅笔;改成描述轮廓和留白就对了:

A black outline image of a grandma biking in a forest. All are made with clear, bold outlines, and the inside of the figures is left completely blank. Widescreen.

Image


案例三:海报

海报是信息密度的极端测试——又要好看,又要传达信息,最容易把提示词写成小作文。

3A:流派的力量

流派名不只是视觉语言,也是内容立场——一个流派词可以替代一堆冗杂的提示词。不同流派的设计语言差距很大,要与内容对应,不然就是生搬硬套。

场景 × 流派 × 标题

"Art Deco 风格海报,Cassandre 风格,标题'装饰即美德' "

"建筑展览海报,包豪斯风格,标题'形式追随功能' "

"音乐节海报,1980年代 Memphis Group 设计风格,Ettore Sottsass,大字标题'少即是无聊', "

"革命宣传海报,俄罗斯构成主义平面设计,El Lissitzky 风格,标题'打倒装饰主义' "

Image

每个海报的配色、字体、排版节奏全然不同,但标题内容和海报风格是相互配合的:包豪斯在用自己的口号,孟菲斯在反击极简主义,构成主义在喊革命。

每个流派背后站着一整套设计语言和内容立场,不用一条条描述,写出流派的名字就够了。

3B:品牌的力量

品牌名是最短的提示词,也是信息密度最高的提示词。

"Hermès style campaign poster"

"Aesop style product poster"

"Gucci style fashion poster"

"Supreme style poster"

"Nike style campaign poster"

"Rolex style product poster"

Image

**六个品牌,六套语言,每条提示词不超过四个词。**Hermès 的橙盒丝巾暖金、Aesop 的混凝土极简、Gucci 的巴洛克繁复、Supreme 的红黑街头冲击、Nike 的运动张力、Rolex 的暗绿深金静奢——模型一个字都不需要你解释。

它见过这些品牌几万张物料,配色、字体、光影方向、产品摆法,全在名字里压缩好了。


案例四:人物

人物是最容易堆形容词的:

“漂亮女孩,眼睛大而有神,皮肤白皙,长发飘逸,气质优雅,时尚有品位,神秘感,自信,微笑”

Image

一张可以发小红书、当头像、随时用的“AI糖水片”就诞生了,精致,但留不下印象。

这些提示词全在同一个维度上内卷:都在说”让她好看”。写这些提示词的时候,感觉把所有美好的品质都给了大模型,结果却实现了最平庸的结果。 可模型收到的只是低信号的同义词堆砌,这叫形容词的自我感动。

人像提示词有六个有效维度,每个维度一个词,各自控制一个轴:

景别— 决定截取范围:特写 / 半身像 / 全身 / 环境人像

视角— 决定观看关系:仰拍 / 俯拍 / 平视 / 45度侧

镜头感— 决定空间透视:85mm 人像 / 35mm 环境感 / 135mm 背景压缩

光位— 决定情绪质感:伦勃朗光 / 蝴蝶光 / 侧逆光 / 轮廓光

光质— 决定氛围软硬:窗边散射 / 正午硬光 / 黄金时段

姿势— 决定人物状态:回眸 / 低头 / 凝视前方 / 侧身靠墙

每个维度选一个词,合起来:

“女性,半身像,45度侧,85mm,伦勃朗光,回眸”

Image

摄影师名字是更进一步的压缩——把以上所有维度打包进一个词:

”Annie Leibovitz 风格人像”

”荒木经惟 风格黑白人像”

”Steve McCurry 风格纪实肖像”

”川内伦子 风格人像”

Image

四个名字,四套完全不同的语言:Leibovitz 的戏剧张力、荒木的黑白亲密感、McCurry 的纪实色彩冲击、川内伦子的柔光日常静谧。一个参数都不用单独写。

外貌一个字没写,光怎么打、镜头怎么放、人物动作如何? ——全都定住了,而且看起来也高级的多。


案例五:产品宣传图

需求:翡翠吊坠,区块链溯源概念,做一张宣传图。

第一反应是把所有卖点都画进去——认证徽章、规格参数、双语标题、国风意境、粒子光效等等。

Image

凭证堆满了,玉反而成了背景板。图的任务只有一件:让人想看这块玉。区块链不需要全部画出来,压进品牌定位一句话就够:

"翡翠吊坠产品展示页,玉石结合区块链溯源主题,深色质感背景,暖光聚焦玉石,中文主标题,极简版式,底部 ID 编号"

Image

总结

下次想生图,别上来就堆词。先把这段发给 AI:

我要生成一张图,在写提示词之前先帮我想清楚三件事:

  • 这张图最核心的一件事是什么?(主体、情绪、还是一个概念——只选一个)

  • 风格参考是什么?(流派名、品牌名、摄影师——选一个,不要混)

  • 有没有互相矛盾的方向?(比如”极简又信息量大”、”柔和又强烈”)

想清楚之后,给我一条简洁、方向单一、无歧义的提示词。

提示词是给模型的方向,不是对图像的描述。方向想清楚,字数自然就少了。精简靠的是你知道这张图最该保留什么。

当所有人往”堆料”这一个方向走,克制反而成了最稀缺的信号。别人在加,你敢减,这本身就是差异化。