Claude Fable 5：把它当水电用的时代结束了

Banner

这份材料真正值得讨论的，不是某个型号是否“最强”，而是一个更长期的问题：当高能力模型的单价、推理长度和合规条件显著不同，统一使用默认模型是否仍然合理？

能力数字必须附带条件

原文列出多项未经本阶段核验的说法，包括：

SWE-Bench Pro 80.3%，对比所谓 Opus 4.8 的 69.2%
SWE-Bench Verified 95.0%，对比 88.6%
Stripe 在一天内迁移 5000 万行 Ruby 代码
通过截图重建 Web App，并完成复杂游戏任务

这些数字缺少本稿可确认的官方链接、评测配置和复现方法。即使之后能找到来源，也要进一步检查模型版本、工具权限、采样参数、任务范围和是否来自厂商案例。

更稳妥的阅读方法是：基准分数只描述特定条件下的表现，不等于模型在所有领域、所有工具配置和所有安全策略下的保证值。安全护栏、路由、上下文、工具和任务类型，都可能改变实际结果。

长任务中的记忆是一种工作流能力

原文把 Fable 5 的差异概括为“会自己做笔记”：模型在长任务中记录失败、回查材料、提炼规则，再把规则应用到后续决策。

材料还引用了游戏实验和持续学习基准，但其模型名称、数据和实验来源同样需要核验。抛开具体分数，这里有一个可复用的工程判断：

失败 → 调查 → 验证 → 提炼 → 应用

当 Agent 能把中间结论写入受控文件，并在后续会话中重新读取，它就不必完全依赖单次上下文窗口。真正的能力来自模型、工具、持久化格式和验证机制的组合，而不只是窗口大小。

成本不只看标价

原文声称该模型的输入与输出单价、单任务 token 消耗和订阅配额显著高于其他型号，并据此估算单任务成本可能达到 2 至 4 倍。这些价格和比例均待核验。

但成本分析框架是成立的。评估模型时至少要同时计算：

输入与输出单价
平均推理和工具调用长度
失败重试次数
人工介入时间
缓存命中率
任务完成率和返工成本

更贵的单 token 不一定意味着更贵的完整任务；相反，单价较低但反复失败的模型，也可能带来更高总成本。应以“完成一个合格任务的综合成本”比较，而不是只看价目表。

成本感知路由

如果模型之间存在明显的能力和价格梯度，把最高档模型设为所有任务的默认值通常并不经济。更合理的结构是：

低成本模型处理分类、提取、格式转换等明确任务。
中档模型执行大多数常规分析和代码工作。
高成本模型只处理复杂度高、失败代价大、产出价值高的任务。
对敏感领域、数据保留和安全策略设置单独路由。

原文提到所谓 Advisor 架构、Fallback API、缓存和批处理，并列出多组节省比例；这些产品名称、功能和数据都需要官方来源确认。即便最终名称不同，顾问模型、故障回退、提示缓存与批处理仍是常见的成本控制思路。

合规政策必须单独核验

原文声称相关模型流量强制保留 30 天，且不同型号的零保留政策不同。这类信息高度敏感，也极易随产品和合同变化，不能仅凭二手文章采用。

医疗、法律、金融和企业数据场景应直接检查：

当前官方隐私与数据保留文档
所用 API、云平台和地区的具体条款
企业合同是否覆盖零保留或例外安排
日志、缓存、工具调用和第三方服务是否形成额外副本

原文还包含一个 2026 年 6 月 9 日至 22 日的免费试用窗口。它属于明确的时效性促销信息，已从正文建议中移除；如需保留历史记录，也必须先核验。

选择模型时问三个问题

无论具体型号叫什么，决策都可以压缩成三个问题：

任务是否复杂到需要更强的规划、推理或长程执行？
产出的价值是否覆盖更高的综合成本？
任务是否触及安全限制、数据保留或行业合规要求？

前两个答案为“是”，第三个风险可接受时，才考虑更高档模型；否则使用更便宜、限制更匹配的模型。

这篇材料最终留下的可靠方法，不是“默认使用某个前沿型号”，而是按任务复杂度、完成成本和合规条件路由模型。具体产品事实必须先核验，方法框架才有资格进入生产系统。

端午安康，钱到万家～端午提示词不要堆元素，要先抓一个主意象。比如粽叶，不要只让它包粽子，而是让它变成江河、巨浪、船帆、笔锋、沙漏。画面只保留一个核心隐喻，其他元素全部降级。风格上可以选水墨、工笔、景泰蓝、极简留白，但一张图只选一种。画面上要有主次：大标题、主视觉、少量辅助元素，不要把龙舟、粽子、艾草、屈原全塞满。真正高级的端午海报，不是“端午元素很多”，而是“一个端午元素被用出了新意思”。

AIJun 19

Claude Prompts

Claude 的 30 个 System Prompts，不是模板合集，是专家模式开关

这 30 个 System Prompts 最值得看的，不是 30 段可以复制粘贴的话。它们真正讲透的是：Claude 能不能从“会聊天”变成“像专家一样交付”，很多时候差的就是任务开始前那套岗位定义。先规定身份、规则、流程和输出标准，再让模型工作。这个顺序，比在普通对话里反复补充要求稳定得多。五组高频工作场景这份清单覆盖五组场景：内容与写作、研究与分析、商业与策略、技术与开发、个人效率。主题很多，但它们都在做同一件事：把 C

AIJun 17

AI生图 Prompt Engineering

四套毕业照 AI 提示词：从电影海报到校园写真

毕业照最难的部分，通常不是“生成一张穿学位服的照片”，而是同时控制三件事：人物仍然像本人、学校元素不出错、画面有明确的叙事。如果提示词只写“高级、电影感、毕业季”，模型会自己补齐大量细节。结果可能好看，却不是你的学校、你的学位服，甚至不是你的脸。下面四套模板分别解决四种常见需求：电影级二次曝光、时间流动感纪实、正式影棚学位照，以及自然校园写真。使用时先替换花括号中的变量，再上传清晰的人脸、服装和校园参考图。 AI 无法保证百分之百还

AIJun 15

AI生图视觉表达

周末愉快，一起搞怪！比丑大赛，即刻开赛

「怪诞手绘风」看完《瑞克和莫蒂》以及辛普森一家之后，想把日常照片也进行“丑化、恶搞”。于是乎... 结尾彩蛋，有胆你就试试这个版本

AIJun 13

AI生图视觉表达

蒙德里安真正迷人的是秩序

初中的时候，我买过一件蒙德里安风格的 T 恤。那时候我还不知道蒙德里安是谁，也不知道 De Stijl 是什么，更不知道这背后是一整套现代主义视觉语言。只是单纯被那种红、黄、蓝、白、黑之间的秩序感吸引。有些东西就是这样，先打动你，很多年后你才知道它叫什么。最近做提示词，我一直想把这种感觉做出来。昨天做的是黑白秩序，今天换成彩色秩序。这套提示词的重点，是把任何主题重新放进红黄蓝白黑的网格系统里：让色块建立节奏，让黑线组织结构，让标

AIJun 12

AI生图视觉表达

「重塑雕像的权利风」更像我对自己的评价：克制、秩序、先锋

这套黑白灰先锋海报，和之前偏“黑白杂志风”的方向不太一样。它不追求杂志封面的信息密度，也不靠栏目、编号、小字、排版标签制造设计感，而是更强调秩序、结构和视觉张力。核心是用黑白灰建立空间层次，用随机字体排版打破模板感，再用圆形、线条、矩形、网格、路径等几何母题组织画面。它看起来克制，但不呆板；极简，但不空洞；有先锋感，也有清晰的视觉系统。适合做 AI、设计、思想类主题封面，尤其适合那些想要“高级、冷静、有实验性”的内容。 Punk

AIJun 11

AI工具工作流

为什么AI有时厉害有时平庸

今天突然意识到一个事情。为什么有时候我们会觉得 AI 太好用了，AI 太厉害了，好像比自己强很多。但有时候又会觉得 AI 很蠢，没那么好用，也不太能解决自己的实际问题。我今天不想从技术或者大模型本身性能的角度聊这个事情，而是想从使用者的体感来说。有没有一种可能，当我们在了解一个自己并不熟悉的领域时，作为外行去问 AI，AI 给到的回答大概率足以让我们觉得满足。因为这个领域里，它能给出的平均水平，已经超过了我们的知识储备和认知。但当我

AIJun 11

AI工具工作流

AI 大模型越来越强，怎么把它仅剩的“幻觉”赶尽杀绝？

一 Fable 5 刚发布，迄今到现在为止最强的模型。昨天我拿它做测试，随手让它帮我查一个东西。它给我写了一大段，逻辑很完整，结构清楚，细节也像那么回事。读完以后，我差点就直接信了。但里面有个关键数据，我顺手核了一下。错的。这种错误不离谱，甚至很难一眼看出来。它错的比较巧妙：周围全是对的，中间那一句，是模型自己补进去的。真正让我后背发凉的地方。是它错得太自然。前后都对，逻辑也通，那句假的被裹在一堆真的里面，我差一点就没看

AIJun 11

Claude Fable 5：把它当水电用的时代结束了

一份基于原始材料、尚待官方来源核验的成本路由分析

能力数字必须附带条件

长任务中的记忆是一种工作流能力

成本不只看标价

成本感知路由

合规政策必须单独核验

选择模型时问三个问题

You May Also Like

CATALOG

能力数字必须附带条件

长任务中的记忆是一种工作流能力

成本不只看标价

成本感知路由

合规政策必须单独核验

选择模型时问三个问题

You May Also Like

CATALOG

Related Posts