当前位置: 首页 > news >正文

arXiv开始拒收综述,CS新人发论文得找人背书

一水 发自 凹非寺
量子位 | 公众号 QbitAI

坏了!在arXiv发综述的门,已经被关上了。

arXiv接收门槛收紧后,最新受害者已急哭:

arXiv的审核越来越严格了。综述论文已经不再被允许发表了,计算机科学领域彻底完蛋了,现在发表文章需要邀请函……

(帖主背景是一位理工研一生)

还不只这一位受害者,评论区直接秒变小型吐苦水现场(快看是不是也戳你心窝子了)


等等,arXiv收紧综述、要求投稿背书,不是去年底就发生过的事吗?怎么半年过去了又被翻出来骂?

答案有点扎心——因为伤害是滞后的

按时间线一梳理你就会发现,半年时间,arXiv已经悄悄甩出了四刀。一刀比一刀深,最痛的那一刀,恰好赶在这个春天才在大批研究者身上显形。

而且一旦追根溯源,你会发现arXiv这样做的理由,远非“减少AI影响”这一个表面原因。

更深的原因,可能藏在水面之下。

到底怎么回事?

一切都要追溯到去年10月,arXiv发布的一篇措辞客气、实则杀伤力极大的博客。

博客标题翻译过来就是《关于CS类别综述与立场论文的最新审核实践》,核心内容简单粗暴:

以后所有想投到arXiv计算机科学(CS)类目下的综述(review/survey)论文和立场(position)论文,必须先被正式的期刊或会议接收,并完成同行评审。提交时必须同时给出同行评审通过证明和DOI,否则一律拒收。

啥意思?以前写篇综述,请几个朋友互相引用一下,就能挂到arXiv撑场面。

现在不行了,先老老实实蹲三个月期刊评审再说吧。

而且还有个细节特别讨厌——Workshop不算数

Workshop就是开在顶会旁边的小型研讨会,通常审稿周期更短、评审标准也相对宽松。

以前大家还能拿它凑数当同行评审证明,现在arXiv明确表示:不认。

不收综述就算了,毕竟arXiv其实从一开始就没给综述开门。

它在公告里特别强调,综述文章和立场论文从来就不在arXiv官方接收的内容类型清单里。过去能挂上去,全靠版主们“看在质量过硬的份上”网开一面。

但没想到后来发生的一切才让人意识到,这仅仅是arXiv挥下的第一刀。

不说了,咱直接看图吧:

图片由AI生成

半年间,arXiv连甩四刀,刀刀都有人受到伤害。

尤其是背书这一条,国内外投稿者几乎都苦不堪言。它的规定是这样的:

从2026年1月21日起,新投稿者必须同时满足两个条件才能自动获得投稿资格:

  • 来自学术/研究机构的邮箱地址;

  • 在你想投稿的“背书域”(endorsement domain)中已经有过被接收的论文。

以前满足条件一即可,现在不行了,所以很多新人都得找一位在同一背书域里已具备投稿资格的“老人”帮忙背书。

这也是为什么开头的小哥说“需要邀请函”的真相。

而背书新规一出,很多人一夜之间就被卡了。

你在cs.LG发过论文,这次想转头投个cs.CL?

对不起,cs.CL在另一个背书域里,之前积累的资格全部清零,得重新去求人。

独立研究者更惨,没机构邮箱、靠自学卷进AI圈的工程师们,几乎一夜之间丧失了发预印本的能力。

哪怕你是刚入学的博士生、导师是图灵奖得主、机构邮箱也刚到手,但只要还没发过论文,对不起,还是得跪求大佬手动背书。

随机打开国内社交媒体平台,我们也能看到大量中国研究者的求助帖。

这几件事叠加在一起,伤害值终于积累到顶点,一下子全爆出来了。

去年10月那刀砍下来时,没人立刻喊疼,毕竟综述论文从写作到投期刊再到出评审意见,本来就要3到6个月。

1月底的背书新政更是个慢热的炸弹,对新人冲击最大,但发酵到春季开学、招新、第一篇论文投稿这个节点上,杀伤力才真正释放出来。

更巧的是,5月本身就是学术圈众所周知的“地狱月”——

ICLR 2026刚出结果,ACL临近截稿,NeurIPS准备工作也在赶节奏。所有原本就高压的环节叠在一起,再撞上arXiv的几把大刀,矛盾在这个春天集中爆发也就不奇怪了。

那么问题来了——

arXiv为啥要这样做?

至少在明面上看,一切都被指向了AI

一边是接收量太大,中间又没人审查,结果arXiv这两年没少被群嘲——

“AI水文集散地”、“arXiv越来越像贴吧”……骂声不绝于耳。

而arXiv自己也心知肚明。以拒收综述为例,它在官方公告里给出的逻辑链其实非常清楚:

AI让写论文变得更容易,造成投稿量激增,尤其是CS领域。

论文多了之后,arXiv的志愿者审核员根本忙不过来,毕竟光是综述,每月就要处理上百篇。

而这些综述里,绝大多数又都是“带注释的参考文献列表”,几乎没有对开放研究问题的实质性讨论。

因此,既然arXiv自己没精力深度把关,那就干脆把质量控制外包给已有同行评审机制的期刊和会议。

而背书新政的底层逻辑也几乎完全一致。

看上去,一切都是因为AI让水文供给侧爆炸,arXiv撑不住了,所以才只能加门槛。

逻辑是很合理,但依然有大量研究者不买账。

最具代表性的吐槽,来自DeepMind前研究员Ahmad Beirami:

理解arXiv想筛掉垃圾,但这种“先过期刊”的硬门槛会把优质内容也一起误杀,拖慢成果发布速度——而arXiv之所以能在过去三十年成为CS领域的“科研生命线”,恰恰就是因为它快。

更扎心的是,arXiv想把质量风险甩给同行评审,但同行评审自己也快撑不住了

去年NeurIPS投稿量暴涨至21575篇时,Jeff Dean就曾回忆起早年“蒸馏论文”被拒的往事。

由此也说明,在海量投稿中,好工作也可能被淹没。当审稿资源被稀释,认真做研究的人反而更容易被仓促、潦草的评审误伤。

更要命的是,AI不只在写论文,也在悄悄渗透评审本身

ICLR 2026“AI审稿”的事想必大家都不陌生。

这个瓜最初是由CMU教授Graham Neubig曝出的,他用Pangram Labs的AI文本检测工具EditLens扫描了ICLR 2026公开的75800条评审意见,结果发现:

其中21%被高度怀疑“完全由AI生成”。

把这些事拼在一起,画面就完整了:

arXiv因为AI综述泛滥,要求论文先过同行评审;但同期顶会的同行评审,已经有21%被AI接管。

AI写的综述,要先经过AI写的评审,才能上arXiv

合着绕了一大圈,AI依然是最后赢家。

而最让人不解的是,如果只是为了对抗AI,arXiv完全可以选一些更柔和的方式,比如网友们提到的加AI检测、给综述单开板块、引入信誉机制等。

为什么偏偏要在半年内连下四道硬门槛?

真正的答案,可能藏在一个很容易被忽略的细节里。

是的,arXiv也要自立门户了

就在上个月,arXiv其实发过一条公告:

从2026年7月1日起,arXiv将正式脱离康奈尔大学,转型为一家独立运营的非营利组织。

几乎同一时间,Cornell Tech也挂出了招聘启事,面向全球招聘arXiv首任CEO,年薪约30万美元。

听起来是不是和我们前面说的毫无关联,但当你把这些消息和“半年四刀”放在同一条时间线上看,所有政策瞬间就通了——

这哪是收紧,分明是arXiv搬家前的大扫除

关于arXiv为什么要独立,Cornell Tech院长Greg Morrisett曾罕见透露:

一些捐赠者其实并不太放心把钱直接打给康奈尔,他们更希望资金能直接进入arXiv自己的账户。

同时arXiv创始人Paul Ginsparg在三十年后回头反思时,也说了一句意味深长的话:

大学,尽管有很多优点,但并没有长期运营这种全球科研基础设施的历史。

个人理解,像arXiv这种面向全球的科研基础设施,继续长期挂靠在单一大学体系之下,无论是融资、治理还是扩张能力,都会越来越受到限制。

某种意义上,随着规模和影响力不断膨胀,arXiv其实早已不再只是“康奈尔的一个项目”,而更像是整个科研共同体的公共底层设施。

因此,独立运营这一步,几乎已经不可避免。

这也符合行业趋势,毕竟之前不是没有先例——去年,生物学预印本平台bioRxiv和医学预印本平台medRxiv就已经从冷泉港实验室迁出,组建了独立非营利组织openRxiv。

更何况现在的arXiv,压力确实已经大到有点扛不住了。Science杂志扒出了这样一组数据:

  • arXiv当前年度运营成本约670万美元,2025年赤字约30万美元;

  • 雇员从2022年起翻倍到27人,但全球日处理量仍主要靠约300名志愿审核员撑着;

  • 投稿量预计2026年突破30万篇,比五年前翻了一倍多。

就是说,AI让论文生产成本骤降,投稿量暴涨。

与此同时,审核仍高度依赖人工志愿者,平台本身还面临持续的财务压力。

在这种背景下,arXiv一边要筹备独立运营,一边又必须想办法控制审核负担、提高系统可持续性。

于是过去半年里,我们看到了一连串越来越“收紧”的动作。

而在这些动作下,投稿人的感受总是最直接、最明显——综述要先过期刊,新人要找邀请函,非英语论文要附英文翻译……每一道新规,都会真切落在每一个具体的研究者身上。

因此,虽然暂时无法知晓独立后的arXiv会变好还是变坏。

但至少有一点已经越来越明显:

那个“人人能发、即发即见”的arXiv,可能真的正在慢慢远去。

参考链接:
[1]https://x.com/Estetico2026/status/2053464670447784374
[2]https://x.com/Yuchenj_UW/status/1998485506699702403
[3]https://tagteam.harvard.edu/hub_feeds/119/feed_items/17500161?utm_source=chatgpt.com

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

中国AIGC产业峰会最新嘉宾阵容来了

从AI最新架构到应用生态,从AI音乐、AI漫剧、AI浏览器再到世界模型、AI硬件... 这一次,我们希望聚齐AI赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。🔍了解详情

5月20日,北京·金茂万丽酒店@所有人,马上AI起来!👉 报名参会

一键关注 👇 点亮星标

http://www.jsqmd.com/news/876367/

相关文章:

  • 如何快速提升电脑性能:5个终极系统调优技巧指南
  • 【AI面试八股文 Vol.1.5 | 主流Agent框架】选型不是站队:LangGraph、AutoGen、CrewAI、Dify、Semantic Kernel、MetaGPT 到底怎么选
  • 终极指南:如何用OpenCore Legacy Patcher让旧Mac焕发新生,完美运行最新macOS
  • NHSE终极指南:5分钟掌握动物森友会存档编辑技巧
  • 机器学习推挤速度模型:数据驱动与物理规则融合的人群动力学新范式
  • 【AI Agent零售落地实战指南】:2024年已验证的7大高ROI场景与避坑清单
  • OpenAI大神教你如何榨干Codex
  • 模型不确定性下的公平性评估:自一致性指标与集成弃权策略
  • 3个维度解析:如何实现Windows进程内存的精准操控?
  • BetterGI原神自动化工具:5分钟快速上手指南,解放你的游戏时间
  • ncmdumpGUI:Windows下网易云音乐NCM格式转换解密工具完全指南
  • Vuforia 10升级避坑指南:Unity URP迁移与真机兼容性实战
  • 如何用免费Chrome插件一键保存完整网页?终极教程指南
  • 登录页面渗透测试实战:从零基础到发现高危漏洞链
  • 企业级微信网页版解决方案:wechat-need-web插件架构深度解析与高效配置指南
  • BabelDOC:3步完成智能PDF文档翻译,完美保留格式与布局的终极解决方案
  • 算法公平性评估:如何用自洽性与方差分析区分真实偏见与随机噪声
  • 解锁AMD Ryzen隐藏性能:一款开源调试工具如何让你成为硬件调优高手
  • 避坑指南:在vSphere ESXi 7.0上安装openEuler虚拟机,这几个配置细节千万别错
  • HAR模型调优实战:为何精心调优的线性模型能击败复杂机器学习?
  • 如何通过Thorium浏览器实现3倍启动速度与40%内存节省:终极Chromium性能优化指南
  • Cortex-R82低功耗模式与时钟管理机制解析
  • QMCDump:轻松解锁QQ音乐加密格式,实现音乐格式自由转换
  • AI Agent如何重构内容生产链?揭秘Netflix、腾讯视频正在内部测试的3层智能娱乐架构
  • “五类人AI替代不了,企业做第二名最稳妥” | 昆仑万维方汉@AIGC2026
  • Windows控制台程序逆向入门:从破解到理解的实战指南
  • VMware Workstation Pro 17免费许可证密钥完整指南:快速激活专业虚拟化工具
  • 终极指南:如何用猫抓浏览器扩展轻松捕获在线视频资源
  • 2026年GEO优化源码出售服务商横向评测与避坑选型实战指南 - 品牌报告
  • DS4Windows终极指南:解锁PS4手柄在PC上的完整潜力