loading image

如何把"AI 味"调成学术味、咨询味,或你想要的任何风格

Posted by Enovace on May 17, 2026

如何把"AI 味"调成学术味、咨询味,或你想要的任何风格

Banner

文章第一部分为人类阅读部分,第二部分为AI阅读部分,可以直接复制给你的Claude Code或者Codex进行复现

第一部分 · 人类阅读区为什么所有人都在讨论"AI 味"

为什么过去这一年大家都在讨论"内容有没有 AI 味"?

这是信号价值坍塌的问题。

在 AI 写作普及之前,一段流畅、结构清晰、用词得体的文字本身就是一种投入证明。它意味着作者花了时间、有过训练、对这件事足够重视。读者会下意识用文本质量去推断作者的诚意和能力。

现在 AI 让"流畅得体"的边际成本无限趋近于0。

人们迫切想找一个新标准来回答一个很古老的问题:这个人到底有没有为我、为这件事付出过。"有没有 AI 味"这种讨论,其实是这种焦虑的代偿表达。

还有一个原因,是身份和审美的保卫战。

尤其是创作者群体,靠文字吃饭这帮人,会本能把"AI 化"标记成贬义词,用来贬低别人,确定人类的稀缺性和价值。

这跟当年摄影出现的时候,被画家说"那不是艺术"是同一回事。

Image

那什么是 AI 味

AI 味不是一个单一特征,是一组可被识别统计的倾向。我把它拆成四层。

词汇和句式层

过度依赖某些安全词、连接词。最经典的就是"不是 X 而是 Y"、"值得注意的是"这种。句长趋于均匀,缺少长短错落的节奏。偏爱三元结构。靠大量形容词堆叠,但信息密度极低。

结构层

过度工整。总分总,要点必然 3-5 条,每条长度接近。喜欢用"首先、其次、最后"来显式标记逻辑。这种 PPT 化的结构感最容易被识别成 AI 创作的文字。

语义层(最值钱的一层,很少人讨论到)

AI 倾向于说"正确但没有承诺"的话。观点四平八稳,该有的角度全部覆盖到,但没有一句话是作者自己的判断。没有那种 100% 肯定的情感,没有具体到让人不舒服的细节,没有"我恰好不这么认为"的棱角。

读起来像一份尽职但匿名的备忘录。

语用层

缺少对具体读者、具体场景的针对性。AI 默认在对一个平均化的抽象读者说话,带着一种谁都不得罪的客套。

但内容创作的真相是反着的。你不可能讨好所有人,只能讨好和你立场相关的人。只能吸引同类,吸引不了异类。

Image

那 AI 味可不可以被解决

可以,但要分层看。

技术上能压表层

通过提示词工程、风格 DNA 编码、给具体的语境和约束,可以大幅压低表层 AI 味。句式、结构、用词这些都能被矫正。

语义层和语用层很难靠模型自己解决

因为真实的判断、具体的经验、棱角分明的立场,这些信息不在模型手里。

模型不知道你昨天跟供应商吵架的细节。不知道你为什么偏偏不信某个流行观点。它能模仿"有棱角的文风",但模仿的棱角仍然是统计意义上的平均棱角。

Image

但说实话,我不认为"AI 味"是一个真问题

它根本就不该存在。

我们今天真正该讨论的,是文风工程化——我能怎么样去定义我想要的风格,并且把它实现出来。

学术味、咨询味、口语味、医生味、律师味,你想要什么味就调成什么味。

这才是这篇文章的重点。下面 4 条原理 + 第二部分的代码,就是给出完整的可复制方案。

我跑通的 4 条原理

原理 1 · 标准来自语料

我以自己为例。我现在要写论文。希望我的论文在当前领域里跟主流的语言表达一致(这里说的是语言表达,不是观点表达)。

那"好"的定义是什么?

我能确切知道哪些文章是高质量的。最简单的判据就是在顶级期刊发表过的。尤其是过去 5 年、在 AI 还没出现之前的那一批,基本上属于高质量语料。

我把这些文章下载下来,处理成 Markdown 格式。

让语料自己定义什么算"这个子领域的好写作"。不用 Strunk & White,也不用任何风格指南。

原理 2 · 四层指纹,词汇层最敏感

很多人一上来就想分析论证结构、段落组织这种高阶东西。

实际上从最敏感到最不敏感是:词汇、句法、修辞、风格学。

AI 漏馅 80% 在词汇层。主要是形容词。crucial、robust、comprehensive、pivotal、meaningful 这些抽象褒义词才是 AI 真正的签名。

现在网上也有 AI 最爱用的形容词词汇表,可以下载下来让脚本去抓。

跑一遍语料,再跑一遍自己的稿。两份频率表一对比,AI 漏馅全部显形。

原理 3 · 抽指纹时不能先读自己的稿

这条最关键。大部分人栽在这一条。

我们一开始都会想:先读自己的稿件找问题,然后再去语料里找解药。

这个操作已经被验证是失败的。

人会下意识对照自己抽样。结果就是把现有的 AI 味当成基准,抽出来的指纹是个安慰剂。

正确做法:独立去抽语料的词频、句长、模板,然后拿指纹反过来审自己的稿。

这样基准是那些高质量内容的指纹,不是你自己稿子的影子。

原理 4 · 脚本化让改稿能拿分数

指纹光写成 markdown 没用。要做成可执行脚本。

每改一稿跑一次。V1 是 9/12 通过,V3 是 11/12,V4 跑到 12/13。可以发了。

改稿循环从"念几遍觉得顺了"换成"跑一下脚本看分数"。

前 3 条原理没有这步就是愿望清单。

指纹自己也会出错

V4 唯一失分的是名词化密度 11.4%,超过目标 8%。

跑出来一看,被算上的全是 implementation、intervention、evaluation 这些专业领域必需的术语。

是指纹算法的假阳性,不是写作的问题。

任何"通用规则"在专业领域都有边界。规则本身要跟着迭代。做法是给指纹加领域白名单,代码在下面第二部分。


第二部分 · 给你的 AI 操作区

下面所有内容直接复制给你的 AI(Claude / ChatGPT / Gemini)。
它会按这套指令把任何文本调成你想要的风格——学术味、咨询味、口语味、AI 味都行。
你不用懂代码,AI 会按下面的脚本骨架自己跑。

一键 prompt(给你的 AI 复制粘贴这一段)

我要做"文风工程化"——把我的稿子调成 [STYLE_GOAL] 风格。
请你严格按下面这套方法执行:

【准备阶段】
1. 我会给你 8-15 篇 [STYLE_GOAL] 风格的高质量参考文本(语料)。
2. 你完全不读我的稿子,独立从参考文本里抽风格指纹。
   指纹包括:
   - 词汇层:高频形容词 top 30、句首词分布、动词类型偏好、名词化密度
   - 句法层:平均句长、句长标准差、被动率、从句嵌套深度
   - 修辞层:设问频率、三联式频率、标点节奏
   - 风格学层:高频 4-gram 前 50、词汇复现率

【审核阶段】
3. 现在你读我的稿子,拿上面的指纹反审。
4. 输出每条规则的通过率(X/Y 形式)。
5. 失分项里告诉我哪些是"领域必需的术语"算法假阳性,可以加白名单。

【改稿阶段】
6. 给我具体的修改建议,让分数提到 12/13 以上。
7. 重写时严格对齐 [STYLE_GOAL] 风格的词频、句长、句式分布。

[STYLE_GOAL]:(在这里填学术味 / 咨询公司味 / 口语味 / 医生味 / 律师味等)

参考文本(语料):
(粘贴 8-15 篇 .txt 内容)

我的稿子:
(粘贴自己的稿)

准备语料目录

用法:先跑语料,再跑自己的稿。两份频率表一对比,差异点就是要改的地方。

# 跑参考语料的高频形容词 top 30
import spacy
from collections import Counter
from pathlib import Path

nlp = spacy.load("en_core_web_sm")  # 中文用 zh_core_web_sm
corpus = "\n".join(p.read_text() for p in Path("style-corpus/raw").glob("*.txt"))
doc = nlp(corpus)

adjs = [t.lemma_.lower() for t in doc if t.pos_ == "ADJ"]
top30 = Counter(adjs).most_common(30)
for adj, count in top30:
    print(f"{count:>6}  {adj}")

跑 audit(audit.py)

# 多规则审稿骨架,可直接套用
import spacy
from collections import Counter

nlp = spacy.load("en_core_web_sm")

# 这里填你想避开的形容词(AI 高频褒义词举例,按目标风格自定义)
BLACKLIST_ADJ = {
    "crucial", "robust", "comprehensive", "pivotal",
    "profound", "substantial", "meaningful", "valuable",
}

def audit(text: str) -> dict:
    doc = nlp(text)
    sents = list(doc.sents)
    n_sent = len(sents)
    out = {}

    # 规则 1: 黑名单形容词
    hits = [t.text for t in doc
            if t.pos_ == "ADJ" and t.lemma_.lower() in BLACKLIST_ADJ]
    out["blacklist_adj"] = (len(hits) == 0, hits)

    # 规则 2: 平均句长在合理区间
    avg_len = sum(len(list(s)) for s in sents) / n_sent
    out["avg_sent_len"] = (15 <= avg_len <= 28, round(avg_len, 1))

    # 规则 3: 被动率不过半
    passive = sum(1 for t in doc if t.dep_ == "auxpass")
    out["passive_ratio"] = (passive / n_sent < 0.3, round(passive / n_sent, 2))

    # 规则 4: 句首词不全是同一个
    first_words = Counter(s[0].text.lower() for s in sents)
    most_common_ratio = first_words.most_common(1)[0][1] / n_sent
    out["sentence_start_diversity"] = (most_common_ratio < 0.25, round(most_common_ratio, 2))

    return out

if __name__ == "__main__":
    import sys
    text = open(sys.argv[1]).read()
    for rule, (ok, val) in audit(text).items():
        mark = "✓" if ok else "✗"
        print(f"{mark} {rule}: {val}")

加领域白名单,避免假阳性

# 当某些"必需的领域术语"被指纹错判为 AI 词时,加白名单豁免
DOMAIN_WHITELIST = {
    "implementation", "intervention", "evaluation",
    "foundations", "recommendations",
    # 按你的领域往里加
}

nominalizations = [
    t for t in doc
    if t.text.lower().endswith("tion")
    and t.lemma_.lower() not in DOMAIN_WHITELIST
]

拿去用在哪些场景

学术写作 拿你目标期刊近 5 年的 8-15 篇当语料,调"学术味"。

咨询公司风 麦肯锡、BCG、贝恩的公开报告都是现成的语料,调"咨询味"。

口语播客脚本 找你喜欢的 3-5 个播客逐字稿当语料,调"口语味"。

医生科普 拿丁香医生、协和八这些优质科普稿当语料,调"医生味"。

律师、法律文书 法院判决书加知名律师专栏,调"律师味"。

公众号、X 推文 各平台抽一份目标语料,套同一套 audit.py

克隆某作者风格 拿他 5 万字当语料抽指纹,反审自己的稿。

PhD 章节 同领域博论当语料,按学科抽指纹,加领域白名单。

复制粘贴清单(一键操作流程)

☐ 想清楚你要的目标风格(学术 / 咨询 / 口语 / 医生 / 律师等)
☐ 收集该风格 8-15 篇高质量样本 → style-corpus/raw/
☐ 完全不读自己的稿
☐ 把上面"一键 prompt"复制给你的 AI,填入 [STYLE_GOAL] + 粘贴语料
☐ 让 AI 抽四层指纹(词汇 / 句法 / 修辞 / 风格学)
☐ 拿自己的稿丢给 AI 跑 audit
☐ 失分项里挑出算法假阳性的,让 AI 加领域白名单
☐ 按 AI 的修改建议改 V2 / V3 / V4,直到分数到 12/13 以上

回到开头那句话。文风不是"AI 味" vs "人味"的二选一。是你想要什么味,就调成什么味。

下次再有人说我写得像 AI,我直接问他:你想让我写成什么味?