如何把"AI 味"调成学术味、咨询味,或你想要的任何风格

文章第一部分为人类阅读部分,第二部分为AI阅读部分,可以直接复制给你的Claude Code或者Codex进行复现
第一部分 · 人类阅读区为什么所有人都在讨论"AI 味"
为什么过去这一年大家都在讨论"内容有没有 AI 味"?
这是信号价值坍塌的问题。
在 AI 写作普及之前,一段流畅、结构清晰、用词得体的文字本身就是一种投入证明。它意味着作者花了时间、有过训练、对这件事足够重视。读者会下意识用文本质量去推断作者的诚意和能力。
现在 AI 让"流畅得体"的边际成本无限趋近于0。
人们迫切想找一个新标准来回答一个很古老的问题:这个人到底有没有为我、为这件事付出过。"有没有 AI 味"这种讨论,其实是这种焦虑的代偿表达。
还有一个原因,是身份和审美的保卫战。
尤其是创作者群体,靠文字吃饭这帮人,会本能把"AI 化"标记成贬义词,用来贬低别人,确定人类的稀缺性和价值。
这跟当年摄影出现的时候,被画家说"那不是艺术"是同一回事。

那什么是 AI 味
AI 味不是一个单一特征,是一组可被识别统计的倾向。我把它拆成四层。
词汇和句式层
过度依赖某些安全词、连接词。最经典的就是"不是 X 而是 Y"、"值得注意的是"这种。句长趋于均匀,缺少长短错落的节奏。偏爱三元结构。靠大量形容词堆叠,但信息密度极低。
结构层
过度工整。总分总,要点必然 3-5 条,每条长度接近。喜欢用"首先、其次、最后"来显式标记逻辑。这种 PPT 化的结构感最容易被识别成 AI 创作的文字。
语义层(最值钱的一层,很少人讨论到)
AI 倾向于说"正确但没有承诺"的话。观点四平八稳,该有的角度全部覆盖到,但没有一句话是作者自己的判断。没有那种 100% 肯定的情感,没有具体到让人不舒服的细节,没有"我恰好不这么认为"的棱角。
读起来像一份尽职但匿名的备忘录。
语用层
缺少对具体读者、具体场景的针对性。AI 默认在对一个平均化的抽象读者说话,带着一种谁都不得罪的客套。
但内容创作的真相是反着的。你不可能讨好所有人,只能讨好和你立场相关的人。只能吸引同类,吸引不了异类。

那 AI 味可不可以被解决
可以,但要分层看。
技术上能压表层
通过提示词工程、风格 DNA 编码、给具体的语境和约束,可以大幅压低表层 AI 味。句式、结构、用词这些都能被矫正。
语义层和语用层很难靠模型自己解决
因为真实的判断、具体的经验、棱角分明的立场,这些信息不在模型手里。
模型不知道你昨天跟供应商吵架的细节。不知道你为什么偏偏不信某个流行观点。它能模仿"有棱角的文风",但模仿的棱角仍然是统计意义上的平均棱角。

但说实话,我不认为"AI 味"是一个真问题
它根本就不该存在。
我们今天真正该讨论的,是文风工程化——我能怎么样去定义我想要的风格,并且把它实现出来。
学术味、咨询味、口语味、医生味、律师味,你想要什么味就调成什么味。
这才是这篇文章的重点。下面 4 条原理 + 第二部分的代码,就是给出完整的可复制方案。
我跑通的 4 条原理
原理 1 · 标准来自语料
我以自己为例。我现在要写论文。希望我的论文在当前领域里跟主流的语言表达一致(这里说的是语言表达,不是观点表达)。
那"好"的定义是什么?
我能确切知道哪些文章是高质量的。最简单的判据就是在顶级期刊发表过的。尤其是过去 5 年、在 AI 还没出现之前的那一批,基本上属于高质量语料。
我把这些文章下载下来,处理成 Markdown 格式。
让语料自己定义什么算"这个子领域的好写作"。不用 Strunk & White,也不用任何风格指南。
原理 2 · 四层指纹,词汇层最敏感
很多人一上来就想分析论证结构、段落组织这种高阶东西。
实际上从最敏感到最不敏感是:词汇、句法、修辞、风格学。
AI 漏馅 80% 在词汇层。主要是形容词。crucial、robust、comprehensive、pivotal、meaningful 这些抽象褒义词才是 AI 真正的签名。
现在网上也有 AI 最爱用的形容词词汇表,可以下载下来让脚本去抓。
跑一遍语料,再跑一遍自己的稿。两份频率表一对比,AI 漏馅全部显形。
原理 3 · 抽指纹时不能先读自己的稿
这条最关键。大部分人栽在这一条。
我们一开始都会想:先读自己的稿件找问题,然后再去语料里找解药。
这个操作已经被验证是失败的。
人会下意识对照自己抽样。结果就是把现有的 AI 味当成基准,抽出来的指纹是个安慰剂。
正确做法:独立去抽语料的词频、句长、模板,然后拿指纹反过来审自己的稿。
这样基准是那些高质量内容的指纹,不是你自己稿子的影子。
原理 4 · 脚本化让改稿能拿分数
指纹光写成 markdown 没用。要做成可执行脚本。
每改一稿跑一次。V1 是 9/12 通过,V3 是 11/12,V4 跑到 12/13。可以发了。
改稿循环从"念几遍觉得顺了"换成"跑一下脚本看分数"。
前 3 条原理没有这步就是愿望清单。
指纹自己也会出错
V4 唯一失分的是名词化密度 11.4%,超过目标 8%。
跑出来一看,被算上的全是 implementation、intervention、evaluation 这些专业领域必需的术语。
是指纹算法的假阳性,不是写作的问题。
任何"通用规则"在专业领域都有边界。规则本身要跟着迭代。做法是给指纹加领域白名单,代码在下面第二部分。
第二部分 · 给你的 AI 操作区
下面所有内容直接复制给你的 AI(Claude / ChatGPT / Gemini)。
它会按这套指令把任何文本调成你想要的风格——学术味、咨询味、口语味、AI 味都行。
你不用懂代码,AI 会按下面的脚本骨架自己跑。
一键 prompt(给你的 AI 复制粘贴这一段)
我要做"文风工程化"——把我的稿子调成 [STYLE_GOAL] 风格。
请你严格按下面这套方法执行:
【准备阶段】
1. 我会给你 8-15 篇 [STYLE_GOAL] 风格的高质量参考文本(语料)。
2. 你完全不读我的稿子,独立从参考文本里抽风格指纹。
指纹包括:
- 词汇层:高频形容词 top 30、句首词分布、动词类型偏好、名词化密度
- 句法层:平均句长、句长标准差、被动率、从句嵌套深度
- 修辞层:设问频率、三联式频率、标点节奏
- 风格学层:高频 4-gram 前 50、词汇复现率
【审核阶段】
3. 现在你读我的稿子,拿上面的指纹反审。
4. 输出每条规则的通过率(X/Y 形式)。
5. 失分项里告诉我哪些是"领域必需的术语"算法假阳性,可以加白名单。
【改稿阶段】
6. 给我具体的修改建议,让分数提到 12/13 以上。
7. 重写时严格对齐 [STYLE_GOAL] 风格的词频、句长、句式分布。
[STYLE_GOAL]:(在这里填学术味 / 咨询公司味 / 口语味 / 医生味 / 律师味等)
参考文本(语料):
(粘贴 8-15 篇 .txt 内容)
我的稿子:
(粘贴自己的稿)
准备语料目录
用法:先跑语料,再跑自己的稿。两份频率表一对比,差异点就是要改的地方。
# 跑参考语料的高频形容词 top 30
import spacy
from collections import Counter
from pathlib import Path
nlp = spacy.load("en_core_web_sm") # 中文用 zh_core_web_sm
corpus = "\n".join(p.read_text() for p in Path("style-corpus/raw").glob("*.txt"))
doc = nlp(corpus)
adjs = [t.lemma_.lower() for t in doc if t.pos_ == "ADJ"]
top30 = Counter(adjs).most_common(30)
for adj, count in top30:
print(f"{count:>6} {adj}")
跑 audit(audit.py)
# 多规则审稿骨架,可直接套用
import spacy
from collections import Counter
nlp = spacy.load("en_core_web_sm")
# 这里填你想避开的形容词(AI 高频褒义词举例,按目标风格自定义)
BLACKLIST_ADJ = {
"crucial", "robust", "comprehensive", "pivotal",
"profound", "substantial", "meaningful", "valuable",
}
def audit(text: str) -> dict:
doc = nlp(text)
sents = list(doc.sents)
n_sent = len(sents)
out = {}
# 规则 1: 黑名单形容词
hits = [t.text for t in doc
if t.pos_ == "ADJ" and t.lemma_.lower() in BLACKLIST_ADJ]
out["blacklist_adj"] = (len(hits) == 0, hits)
# 规则 2: 平均句长在合理区间
avg_len = sum(len(list(s)) for s in sents) / n_sent
out["avg_sent_len"] = (15 <= avg_len <= 28, round(avg_len, 1))
# 规则 3: 被动率不过半
passive = sum(1 for t in doc if t.dep_ == "auxpass")
out["passive_ratio"] = (passive / n_sent < 0.3, round(passive / n_sent, 2))
# 规则 4: 句首词不全是同一个
first_words = Counter(s[0].text.lower() for s in sents)
most_common_ratio = first_words.most_common(1)[0][1] / n_sent
out["sentence_start_diversity"] = (most_common_ratio < 0.25, round(most_common_ratio, 2))
return out
if __name__ == "__main__":
import sys
text = open(sys.argv[1]).read()
for rule, (ok, val) in audit(text).items():
mark = "✓" if ok else "✗"
print(f"{mark} {rule}: {val}")
加领域白名单,避免假阳性
# 当某些"必需的领域术语"被指纹错判为 AI 词时,加白名单豁免
DOMAIN_WHITELIST = {
"implementation", "intervention", "evaluation",
"foundations", "recommendations",
# 按你的领域往里加
}
nominalizations = [
t for t in doc
if t.text.lower().endswith("tion")
and t.lemma_.lower() not in DOMAIN_WHITELIST
]
拿去用在哪些场景
学术写作 拿你目标期刊近 5 年的 8-15 篇当语料,调"学术味"。
咨询公司风 麦肯锡、BCG、贝恩的公开报告都是现成的语料,调"咨询味"。
口语播客脚本 找你喜欢的 3-5 个播客逐字稿当语料,调"口语味"。
医生科普 拿丁香医生、协和八这些优质科普稿当语料,调"医生味"。
律师、法律文书 法院判决书加知名律师专栏,调"律师味"。
公众号、X 推文 各平台抽一份目标语料,套同一套 audit.py。
克隆某作者风格 拿他 5 万字当语料抽指纹,反审自己的稿。
PhD 章节 同领域博论当语料,按学科抽指纹,加领域白名单。
复制粘贴清单(一键操作流程)
☐ 想清楚你要的目标风格(学术 / 咨询 / 口语 / 医生 / 律师等)
☐ 收集该风格 8-15 篇高质量样本 → style-corpus/raw/
☐ 完全不读自己的稿
☐ 把上面"一键 prompt"复制给你的 AI,填入 [STYLE_GOAL] + 粘贴语料
☐ 让 AI 抽四层指纹(词汇 / 句法 / 修辞 / 风格学)
☐ 拿自己的稿丢给 AI 跑 audit
☐ 失分项里挑出算法假阳性的,让 AI 加领域白名单
☐ 按 AI 的修改建议改 V2 / V3 / V4,直到分数到 12/13 以上
回到开头那句话。文风不是"AI 味" vs "人味"的二选一。是你想要什么味,就调成什么味。
下次再有人说我写得像 AI,我直接问他:你想让我写成什么味?

