2026年5月,xAI把X的推荐算法代码上传到GitHub,任何人都可以去读。这是第一次有完整的代码可以验证For You算法的实际行为。以下完整拆解和行动指南
一、你的帖子怎么进候选池
推荐算法的第一步不是打分,是筛选。从全平台所有内容里,决定哪些帖子有资格进入评分环节。
筛选分两条路同时进行:
关注账号的内容:你关注的账号发的帖子,直接进候选池,不需要额外匹配。
陌生人的内容:你没关注的账号的内容,通过相似度计算进池。算法把你的历史互动行为压缩成算法能读的格式,从全平台帖子库里找出"行为模式最接近你"的内容,拉进候选池。
两条路并行,最终合并排名。关注者少,不等于曝光少——陌生人内容是独立的检索通道。
值得注意的一个细节:算法把用户主动关注的话题也作为匹配信号。你的内容与目标受众所关注话题的重合度,直接影响能否进入他们的候选池。话题一致性比粉丝数量更直接影响你能触达谁。
二、进候选池之前就被过滤掉的情况
帖子进入评分之前,有一层硬过滤。命中以下任何一条,直接被剔除,不参与后续打分:
看过的内容:系统给每个用户维护一张"看过的内容"清单。已经曝光过的帖子会被过滤掉,基本不会再次进入候选池。
屏蔽的关键词:用户屏蔽了某个词,包含该词的帖子在打分前就被过滤,不参与评分。
太旧的内容:超过一定时间窗口的帖子被排除。
被拉黑或静音的账号:对方拉黑或静音你,你的内容从他的候选池里消失。
这几个过滤器意味着:帖子还没进到打分阶段,就已经从部分用户的信息流里消失了。
其中"已看内容"这条最关键——一条帖子曝光给一个用户,对方划走没有互动,这个曝光就用完了。算法不会把同一条内容再推给同一个人。没有"再刷一次也许就点了"。
三、算法怎么给帖子打分

算法预测15种用户行为发生的概率,每种行为乘上一个权重系数,加总得出推荐分,通过过滤的帖子进入打分环节。打分公式是:
最终推荐分 = Σ(权重 × 预测概率)
4种负权重行为的具体数值没有公开,但结构上可以确认:最终推荐分是正向信号收益减去负向信号损耗的结果。
高争议内容的问题在这里出现。一条强观点帖可以拿到大量回复和引用(加分),但同样的内容会让一部分人按"不感兴趣"或举报(扣分)。两端同时升高,净分不一定高。**互动量高不等于推荐量高。**每条帖子独立打分——打分时只看当前用户的历史偏好,看不到同批次里其他帖子的情况。帖子A的分数不影响帖子B,帐号层面没有跨帖的惩罚传导。一条差帖只影响那条帖子本身的曝光,不累积到下一条。
四、排名阶段的两道调整
模型打完分之后,不直接按分数排序输出。有两个调整层叠加在上面。
作者多样性限制限制同一个信息流里同一个作者的出现频率。多条帖子同时进入同一个用户的候选队列,算法会主动压低部分帖子的权重。
短时间密集发帖的直接结果:每条帖子分到的曝光量被稀释,不是叠加。质量相同的情况下,分散发布比集中发布能拿到更多总曝光。
陌生人内容额外过一关来自非关注账号的内容,在打完分之后还有一个专门针对"陌生人内容"的额外评分层。关注者的内容不经过这一层。陌生人内容进入你的信息流,实际上经过了两轮评估。
五、帖子发出之后,后台在给它贴标签
独立于打分流程,有一套内容理解服务在后台异步运行,处理的是帖子本身的内容,不是用户行为。
这套系统包含几个分类器:
垃圾内容识别:识别重复模板、过度套用格式、机器生成感强的内容。
高质量内容识别:识别高传播潜力的内容。这是算法里明确存在的一套机制,不是模糊的"好内容自然有流量"——系统有一个专门的识别器在判断。
安全分类:内容政策执行层,违规内容在进入推荐流程前被拦截。
此外,这套系统还会对帖子的文字、图片和视频内容进行语义理解,不只是读文字。
**帖子发出之后,进入打分之前,内容本身已经被分类完毕。**被判为低质量的内容,推荐概率直接受影响;被识别为高质量的内容,可能获得额外权重。
根据算法行为,可以调整的六件事

1. 把每次曝光当最后一次机会"已看内容"清单意味着同一条帖子不会推给看过它的人第二次。帖子曝光出去了,对方划走没互动,这个用户就结束了。
帖子的开头决定的不只是这次互动率,而是这个用户有没有留下来的可能性。曝光给他了,记录里有了,没有第二次。
2. 集中在固定话题发帖用户关注的话题是检索匹配的信号之一。你的内容与目标受众关注的话题越吻合,进入他们候选池的概率越高,不需要他们关注你这个账号。
频繁跨话题发帖,每个话题的积累信号都被稀释,反而更难被稳定检索到。
3. 发帖前估一下负向信号算法打分时同时预测举报、拉黑、按"不感兴趣"的概率,四种行为有负权重,直接从推荐分里扣。
高争议帖拿到大量回复的同时,负向行为的预测概率也在上升。两端同时升高,净分不可预测。发帖前问自己:看到这条帖子最可能按"不感兴趣"的是哪类人?如果这个群体不小,就考虑改。
4. 拉开发帖间距作者多样性限制会压低同一用户候选队列里同一作者的多条帖子权重。短时间内连发多条,每条帖子分到的曝光量被稀释,不是叠加。
等上一条帖子先跑起来,再发下一条。
5. 不要用固定格式反复套垃圾内容识别针对重复结构和模板化写法。同一套框架反复套,每次只换填充内容,会增加在进入打分之前就被标记为低质量的风险。
6. 差帖不用等,下一条是新开始每条帖子独立打分,帐号层面没有跨帖的惩罚传导。一条帖子效果差,只影响那条帖子本身的曝光,不叠加到下一条。
这次开源,xAI公开的是结构,不是参数。我们知道算法用了哪些信号,不知道每个信号的具体权重。
但这已经足够。知道结构,就知道什么样的内容会被系统天然支持,什么样的内容会被系统天然惩罚。
平台从来没有明确说过这些规则,因为规则不在帮助中心里。规则在代码里,而代码现在是公开的。
算法只读行为,不读努力。

