loading image

X 推荐算法源码里的 9 个关键机制:发帖时间、权重排序、负向惩罚全拆解

基于 X 官方开源代码 · xai org/x algorithm · 2026 05 15 最新版 X 最近把推荐算法的源代码公开了。 我把这份代码库拆开来翻,重点挖了推荐流程、打分逻辑和 v1 到 v2 的变化,找出了几个大多数人——包括很多做内容的人——都不知道的事实。 这

Posted by Enovace on May 16, 2026

基于 X 官方开源代码 · xai-org/x-algorithm · 2026-05-15 最新版


X 最近把推荐算法的源代码公开了。

我把这份代码库拆开来翻,重点挖了推荐流程、打分逻辑和 v1 到 v2 的变化,找出了几个大多数人——包括很多做内容的人——都不知道的事实。

这不是猜测,不是"据说",是代码里白纸黑字写着的逻辑。


背景:两个版本,一次大升级

X 目前公开了两个版本的推荐算法:

  • v1(2026-01-20):基础版,建立了 For You 的整体流水线框架
  • v2(2026-05-15):大幅扩展,净新增约 18,000 行代码,187 个文件改动

v2 最大的变化是加入了内容理解能力——算法开始真正"读懂"帖子说什么,而不只是数互动量。这个变化的含义贯穿后面所有的分析。

值得注意的是:代码里的打分权重(比如"点赞值多少分")并没有写死,而是由 X 的 A/B 实验系统在运行时动态注入。也就是说,X 随时可以偷偷调权重,不用发布新版本。我们从代码里能看到的,是机制和框架,不是具体数字。


For You 是怎么工作的:三个系统

图像

每次你下拉刷新 For You,后台有三个系统在协作:

Thunder:专门处理你关注的人发的内容。纯内存运行,速度极快,保留最近 2 天的帖子。

Phoenix:主力推荐引擎,负责从全平台内容里找出你可能感兴趣的帖子。先用向量检索快速筛出几百条候选,再用 AI 模型精细打分排序。

Grox(v2 新增):内容理解流水线。每条帖子发出后异步处理——做垃圾检测、安全分级、爆款潜力判断,还会对视频做语音识别。Grox 的结果直接影响帖子能不能进推荐池。

三个系统的输出最终混合在一起,加上广告、推荐关注等,才是你看到的 For You。


第一件事:你的帖子只有 80 小时的生命

代码里有一个常量:

POST_AGE_MAX_MINUTES = 4800

4800 分钟 = 80 小时。

这是 For You 推荐系统能识别的帖子最大年龄。超过这个时间,你的帖子就被扔进一个叫"溢出桶"的地方——算法不会再精细地评估它,实际上等于从推荐池里消失了。

**80 小时就是帖子的有效寿命。**不是 7 天,不是 30 天。是 80 小时。

你以前发的那些帖子,哪怕内容再好,超时了也很难再被人看到——除非有人主动搜索。


第二件事:算法不只看点赞,它同时打 19 个分

图像

大多数人以为:点赞多 = 算法推你。

实际上,算法同时预测 19 种行为发生的概率,把它们加权求和,才得出最终分数。

这 19 个信号分三类:

正向(越多越好)- 点赞、回复、转推、引用

  • 展开图片、点击帖子、访问你的主页
  • 私信分享、复制链接分享
  • 视频质量观看(不是随便播,是"真的看了")
  • 在帖子上停留- 关注你负向(越多越惨)**- 点"不感兴趣"
  • 屏蔽你
  • 静音你
  • 举报你
  • **快速划过(最新版新增)**注意最后一条:快速划过现在是负分。不是没分,是扣分。

第三件事:关注 >> 点赞,差距很大

图像

在这 19 个信号里,"关注作者"的权重在代码里被排在正向信号的核心位置,明显高于普通点赞。

换句话说:

  • 有人看了你的帖子,点了个赞 → 普通加分
  • 有人看了你的帖子,点了关注 → 高权重加分,意义远超前者

为什么?因为"关注"这个动作表达的信号更强:这个人认为你值得长期追踪。这种高质量信号,算法给的回报也更大。

所以帖子末尾加一句"关注我获取更多",不是在求关注,而是在直接拉动算法里权重最高的正向指标。


第四件事:停留时长是两个独立的加分项

算法里,"停留"被拆成了两个独立指标:

指标一:有没有停(离散的是/否) 只要你在这条帖子上停下来,就算一次正向信号。

指标二:停了多久(连续的秒数) 算法把停留时长归一化到 0–30 秒:停 15 秒记 0.5,停满 30 秒以上记 1.0。这个数值会独立计入加分。

两个指标分别有各自的权重,加分效果叠加

而且最新版本(v2)还加了第三个维度:如果你根本没停——快速滑走——这本身就是一个负向惩罚项

结论:内容越能让人停下来、读下去,得分越高;被快速划过,得分会被主动拖低。


第五件事:负向信号的惩罚,比你想象的严重得多

图像

代码里有一段逻辑(在 ranking_scorer.rs 里):

如果一条帖子的加权总分是负数,它不会得 0 分——而是被压缩成一个接近 0 的极小正数

实际推送概率约等于零。

更严重的是:这个负向动作会被记录进用户的互动历史。下次算法在为这个用户打分时,它知道这个人对"类似内容"有过负向反馈,会系统性地降低同类帖子的未来推荐。

**几个人屏蔽你 / 举报你,可能让你的一整类内容在这些人的 Feed 里永久消失。**所以:发帖前想清楚受众。错配的内容,代价不只是"没人看",而是主动被惩罚。


第六件事:同一天发太多帖子,后面几条分数会自动打折

算法里有一个叫 Author Diversity Scorer 的机制,目的是防止同一个人的内容垄断别人的 Feed。

具体逻辑是:当同一个人的多条帖子出现在同一次刷新请求里,第 2 条的分数会乘以一个衰减系数,第 3 条再乘一次,以此类推。

**同一天集中发 5 条,不如每隔几小时发 1 条。**原因:每隔一段时间发,不同用户刷 Feed 的时间点不同,你的帖子每次都作为"第 1 条"参与竞争,不承受衰减惩罚。


第七件事:发帖后前 2–3 小时,决定了这条帖子的命运

图像

前面说了,帖子只有 80 小时的寿命。但这 80 小时并不平均。

发帖后,算法首先把内容推给你的粉丝——这是最初的一批受众。如果他们产生了互动(点赞、回复、停留),算法就会判断"这条帖子有吸引力",开始把它推给更多不关注你的人,范围越来越大。

这是一个正反馈循环:早期互动 → 算法扩散 → 更多互动 → 继续扩散。

但如果发帖后前 2–3 小时内几乎没有互动,算法就不会触发这个扩散机制。帖子基本就死在了那里,剩下的 77 个小时也很难再翻身。

**发帖时机比任何其他因素都重要。**选你的目标受众最活跃的时间段发帖。发完之后,主动回复早期评论,拉高互动率,激活正反馈。


第八件事:你的最近 128 条互动,决定了你的 Feed 长什么样

算法在每次为你打分排序时,会读取你最近 128 条互动记录(点赞、回复、转推、停留……),把这 128 条行为合成你当前的"口味画像",然后用它来决定哪些帖子对你的分数最高。

这意味着:

  • 你的 For You 不是"系统猜你喜欢什么",而是"系统根据你最近的行为推算你喜欢什么"。
  • 如果你想改变推荐方向,主动点赞 / 回复你想看的内容比什么都有效。连续几天密集互动某类内容,这类内容就会在你的 128 条历史里占主导,推荐方向会跟着转。
  • 如果你陷入信息茧房,原因很可能就是 128 条历史里某类内容占比过高,形成了自我强化。打破茧房最直接的方式,是主动去互动你想看但平时不互动的内容。

第九件事:算法会"听"你视频里说的话

最新版本(v2)里,X 加了一个叫 ASR(自动语音识别)的模块。

每条视频发布后,系统会自动把视频里的语音转成文字,再用安全分类器扫描这段文字。如果口头内容触发了敏感标签,视频的推送会受到影响。

**视频里说的话,和写出来的文字适用同样的内容规则。**不要以为"只是口头说说,又没写出来"就安全——语音会被识别出来,然后被分析。


总结:算法在奖励什么

把这 9 条合在一起,背后有一个清晰的逻辑:

**X 的算法正在从"数互动数量"转向"判断内容质量"。**以前,刷量、买赞、频繁发帖是有效的。但从代码里可以看出,最新版本明确在惩罚"快速划过"、奖励"真实停留"、重视"关注"这种高质量信号——这些都是没办法靠刷量伪造的行为。

对创作者来说,这个变化的含义很明确:

  • 写让人愿意停下来读完的内容
  • 写让人愿意点关注的内容
  • 不要写让人想划走、想屏蔽的内容
  • 发帖时机和节奏比数量更重要

这不是玄学,是代码里写死的逻辑。


以上内容基于 X 官方开源代码 (xai-org/x-algorithm),2026-05-15 版本。代码里的权重数值由 X 的 A/B 实验系统动态注入,不在源码中硬编码——也就是说,具体权重 X 随时可以调,但这里描述的机制和逻辑框架是代码定死的。


**mousepotato(土豆哥)| 美国计算机全奖博士 | 硅谷 11 年技术管理 | AI · OPC · 产品 | X **@iluciddreaming

关注我,获取 AI 前沿、技术、管理、产品、硅谷生活见闻。