当前位置: 首页 > news >正文

马斯克开源X算法:虽不完美但迈出关键一步,能否成“社交媒体界Linux”待验证

X算法开源:从“不完整”到“真开源”

自从马斯克开源X以后,大家常抱怨其未完整开源,拿到代码也无法自制X平台。但现在,X开源仓库页迎来史上最大更新,用户真能下载代码自制X平台了。

2023年3月31日,当时还叫Twitter的X平台,官方把twitter/the - algorithm和twitter/the - algorithm - ml两个仓库放上GitHub,公开了For You时间线背后的部分推荐逻辑。不过,那次更像“代码透明度展示”,外界看不到训练数据、模型权重、广告推荐系统等关键部分。而此次,马斯克动真格了。

X平台现状:重要但面临挑战

X并非全球最大社交平台,月活数量为5.7亿,2026年预计收入约29亿美元,较马斯克收购前的50.8亿美元下降43%,收购前广告收入占比高达90%,收购后仍占总收入不到70%。

但它仍是全球最重要的社交平台之一,拥有每天处理12亿条内容、服务5亿用户的完整生产系统,Anthropic、OpenAI等顶尖AI公司都以X作为第一信息分发平台。马斯克发出开源推文不到24小时,X的开源GitHub仓库就冲到2万颗星星。

马斯克在开源声明中称:“我们知道这个算法很笨,需要大幅改进,但至少你可以看到我们实时且透明地努力让它变得更好。没有其他社交媒体公司这样做。”

开源具体内容:有亮点也有保留

此次开源的X算法,核心是基于Grok的transformer推荐系统。系统架构不复杂,设计思路清晰:从Thunder和Phoenix Retrieval两个来源获取候选内容,用机器学习模型统一排序,过滤不合适内容后推送给用户。

Thunder负责“网内内容”,即关注账号发布的帖子,是内存数据库,实时追踪用户最新发帖,响应速度亚毫秒级别。Phoenix Retrieval负责“网外内容”,通过机器学习做相似度搜索,从全球语料库找相关帖子,这是推荐系统关键部分。

候选内容汇总后进入排序阶段,核心是基于Grok的Transformer模型Phoenix Scorer,它不预测“相关性”,而是预测用户对内容可能采取的行动,如点赞、转发等概率,各行动有权重,最终得分是加权求和,得分高的内容排前。

X强调已消除手工特征工程和大部分启发式规则,Grok - based Transformer通过理解用户互动历史自动判断相关内容,这使依赖关键词堆砌等的运营策略失效,系统更注重语义理解。

不过,开源并非完全开放。首先,模型权重未完全开放,GitHub仓库的mini Phoenix模型只是教学样本,与生产环境使用的模型规模差异大。其次,训练数据未公开,因涉及隐私和商业机密,没有这些数据难以训练出好用的推荐系统。第三,广告系统只开源框架,未开源策略。第四,内容理解管道Grox只开源部分能力,具体判断细节未透明。所以,虽能搭建类似推荐系统,但无法1比1复刻X平台。

开源原因:应对监管与重建信任

早在2022年10月收购Twitter时,马斯克就表示要让算法开源以增加信任。2023年3月31日,X平台在GitHub发布部分推荐算法源代码,引发巨大关注,但那次开源不完整,开发者抱怨代码库维护和文档问题。

此次开源,马斯克吸取教训。有意思的是,他发推文时在北京,但开源目标是欧洲。X平台在欧洲面临严格监管审查,2025年7月,法国检察机关对其展开调查,欧盟委员会也发出文件保留令。X曾拒绝配合,马斯克甚至回复脏话,但拒绝并非长久之计,于是选择开源。

开源虽有代价,如竞争对手可学习架构设计,暴露X的弱点,但马斯克认为值得。X当前最大问题是信任,开源算法是重建信任的直接方式,能证明X无暗箱操作,愿意接受公众监督。马斯克曾希望X成为互联网上最透明的系统,像Linux一样强大,如今看来他很认真,X能否成为“社交媒体界的Linux”,还需时间验证,但在开源上,马斯克已领先主流社交平台。

http://www.jsqmd.com/news/833879/

相关文章:

  • 终极解决方案:5步轻松搞定AcFun视频批量下载与离线观看
  • 为开源项目OpenClaw配置Taotoken作为后端模型供应商
  • 从光强到相位:基于Zernike多项式与SPGD算法的无波前传感校正实战
  • 61.连云港报考CPPM与SCMP,职场进阶优选众智商学院 - 众智商学院课程中心
  • Split APKs Installer:Android拆分应用安装的终极解决方案指南
  • NVIDIA显卡性能调优终极指南:如何用Profile Inspector解锁隐藏潜能
  • Altium Designer 21 实战:5分钟搞定BGA封装盲埋孔设置,告别布线焦虑
  • XHS-Downloader终极指南:5分钟掌握小红书无水印批量下载技巧
  • 63.江门报考CPPM与SCMP,职场进阶优选众智商学院 - 众智商学院课程中心
  • 荣品RV1126 SDK编译避坑指南:从环境配置到分区调整,手把手解决常见编译错误
  • Rust安装总失败?试试这个‘组合拳’:一键脚本+镜像源自动切换
  • 基于静态站点生成器的技术文档本地化项目实战:以Cursor日本社区为例
  • Boss直聘职位数据自动化采集:Python爬虫架构设计与工程实践
  • 模型微调为什么一上长上下文就开始位置编码失配:从 RoPE 外推到 NTK-Aware 插值的工程实战
  • 如何快速掌握通达信数据解析:mootdx完整实战指南
  • 告别网盘客户端束缚:九大网盘直链下载终极解决方案
  • 别再只把RTC当时钟了!用GD32的备份寄存器和闹钟中断,做个断电数据保存和定时唤醒的“看门狗”
  • 62.淮安报考CPPM与SCMP,职场进阶优选众智商学院 - 众智商学院课程中心
  • FPGA高速ADC数据采集实战——基于AD9253 LVDS接口与ISERDESE2设计
  • 从短信分类到贷款预测:用Spark ML Pipeline快速搭建机器学习工作流
  • 仿生扑翼飞行器集群运动学建模【附仿真】
  • 告别串口调试助手:用CSerialPort和MFC快速撸一个自己的串口通信工具
  • 动态规划-斜率优化 2026.5.17
  • LinkSwift:跨平台网盘直链提取解决方案的技术实现与应用实践
  • NVIDIA Profile Inspector深度解析:解锁显卡隐藏性能的实战指南
  • Godot卡牌游戏框架终极指南:3小时从零构建专业级卡牌游戏
  • 如何快速捕获网页视频:猫抓资源嗅探扩展的完整使用指南
  • 2026年4月做得好的热流道生产厂家推荐,热流道加热圈/塑胶模具热流道/注塑热流道/家电热流道,热流道实力厂家有哪些 - 品牌推荐师
  • Qt资源管理避坑指南:从.qrc文件到可执行程序,你的图标为什么没显示?
  • 告别答辩PPT焦虑:用百考通AI高效打造专业答辩演示