当前位置：首页 > news >正文

强人工智能（Artificial General Intelligence，通用人工智能）论文目录

news 2026/6/19 7:46:25

持续更新中。主要包含：大型语言模型LLM，多模态大模型MLLM，其他AGI相关的零散优秀论文，少量脑神经科学中与认知心理学方面的论文。除此之外，还会将一些相关的技术资料进行分享，包括但不限于LLM，Transformer，GNN，DRL，Diffusion Model等等，还有人脑结构，认知，记忆等。
也欢迎有实现强人工智能想法，热爱AGI的小伙伴有疑问可以私信进行探讨。
友情链接：大模型相关资料、基础技术和排行榜

强人工智能（AGI）论文

标题和时间	作者	来源	简介
Artificial General Intelligence: Concept, State of the Art, and Future Prospects，2014	Goertzel	Journal of Artificial General Intelligence	14年的一篇AGI综述，里面探讨了AGI的定义、分类和评估方法等，作者貌似现在是AGI大会的编辑了hh
Towards artificial general intelligence with hybrid Tianjic chip architecture，2020	Pei jing	Nature	2020年的一个讨论实现AGI硬件的论文，其实现了在同一芯片上同时运行MLP-like和SNN神经网络的硬件环境
AGI Brain II: The Upgraded Version with Increased Versatility Index，2021	Mohammadreza Alidoust	AGI2021	1.提出一个AGI指标，2.用Mamdani模糊推理联想记忆代替原本的神经网络NN表示外显记忆
Training language models to follow instructions with human feedback，2022	Long Ouyang等人	OpenAI	InstructGPT，在大型语言模型的基础上引入人工引导和强化学习，大大提升模型性能
Yann Lecun: A Path Towards Autonomous Machine Intelligence 自主机器学习和AGI,2022	Yann Lecun	Machine Learning	提出了自主智能体的架构和训练范式,论文地址
GPT-4原论文详细解读（GPT-4 Technical Report）,2023	OpenAI	OpenAI	GPT-4，提出了多模态的大型语言模型，具备一定的常识和认知能力
ChatGLM，2023	Aohan Zeng，Du等人	International Conference on Learning Representations (ICLR)	ChatGLM，ChatGLM-6B结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）
LLaMA: Open and Efficient Foundation Language Models,2023	Hugo Touvron	preprint	LLaMA是 Meta AI 发布的包含 7-65B 参数规模的LLM，其中LLaMA-13B 仅以 1/10 规模的参数在多数的 benchmarks 上性能优于 GPT-3(175B)。开源。
A Survey of Large Language Models，2023	Wayne Xin Zhao,	preprint	大型语言模型综述，非常详细，格局打开！
ChatDB: AUGMENTING LLMS WITH DATABASES AS THEIR SYMBOLIC MEMORY，2023	Chenxu Hu	preprint	ChatDB清华团队针对大模型LLMs的长期记忆能力进行的改进，提出数据库与大模型结合开源
LONGNET: Scaling Transformers to1,000,000,000 Tokens，2023	Jiayu Ding	preprint	LONGNET微软做的针对大模型的长文本学习，长期记忆进行的改进，开源
Focused Transformer: Contrastive Training for Context Scaling，2023	Szymon Tworkowski	preprint	LongLlama谷歌DeepMind研究团队提出了一种注意力集中的transformer架构FOT
Towards Benchmarking and Improving the Temporal Reasoning Capability of Large Language Models，2023	谭清宇，Hwee Tou Ng，邴立东	ACL 2023 main conference	LLM理解时间变迁。达摩院联合NUS提出时间推理数据集以及时间强化的训练范式
UnIVAL: Unified Model for Image, Video, Audio and Language Tasks，2023	Mustafa Shukor	preprint	UnIVAL，该算法不依赖于数据集大小或具有数十亿参数的大模型，仅仅具有约0.25B的参数量，而且将文本、图像、视频和音频这4个多模态任务统一到了一个模型中
Graph of Thoughts: Solving Elaborate Problems with Large Language Models，2023	Besta Maciej	preprint	思维图，将LLM生成的信息建模为任意图，其中信息单位是顶点，边代表顶点之间的依赖关系
The Rise and Potential of Large Language Model Based Agents: A Survey，2023	Xi Zhi heng	preprint	Agent，综述
NExT-GPT: Any-to-Any Multimodal LLM，2023	新加坡国立大学，吴胜琼	preprint	NExT-GPT，多模态大模型，实现任意模态之间的转换。NextGPT整体结构图、模型示意图和使用模型时示意图
Toolformer: Language Models Can Teach Themselves to Use Tools，2023	Schick Timo	preprint	Toolsformer，GPT与各种工具结合
The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)，2023	Yang Zhengyuan	preprint	GPT-4V测评报告
EFFICIENT STREAMING LANGUAGE MODELS WITH ATTENTION SINKS，2023	Xiao Guangxuan	preprint	流式LLM，无限扩展LLM长度
Improving Image Generation with Better Captions，2023	Betker James	Open AI	DaLLE3，作画大师接入chatgpt，论文中文版见这
Instruction Tuning for Large Language Models: A Survey，2023	Zhang Linfeng	preprint	思维链综述
RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models	Wang Zekun Moore	preprint	角色扮演大模型
A Survey on Multimodal Large Language Models，2023	Yin Chaoyou	preprint	多模态大模型综述
Visual Instruction Tuning，2023	Liu Haotian	preprint	视觉大模型llava,通过视觉调优，支持基于图片的聊天
ChatGLM3，2023	ZHIPU, Tinghua	web	ChatGLM3
AI Alignment: A Comprehensive Survey，2023	Jiaming Ji	preprint	AI对齐技术综述，怎么让AI符合人类意图和价值观
RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation,2023	Yufei Wang	preprint	具身智能代表性工作
A Comprehensive Overview of Large Language Models, 2023	Naveed Humza	arXiv	大模型的全面回顾，看透大模型
Source Code Data Augmentation for Deep Learning: A Survey	蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合	arXiv	代码生成数据增强综述
COGVLM: VISUAL EXPERT FOR LARGE LANGUAGE MODELS，2023	清华，Wang Weihan	arXiv	多模态大模型的创新代表文章
Enhancing Chat Language Models by Scaling High-quality Instructional Conversations，2023	Ding Ning	arXiv	大模型：高质量对话数据生成
Mixture of Experts Explained，2023	Blog	Blog	混合专家模型MOE，论文地址
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs，2023	清华	arXiv	基于工具的代表性工作
ChemLLM: A Chemical Large Language Model,2024	上海人工智能实验室	arXiv	标准垂直领域大模型训练构建指南，工作主要在数据处理部分
Self-Rewarding Language Models，2024	Meta、纽约大学	arXiv	大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4
Larimar: Large Language Models with Episodic Memory Control	IBM	arXiv	提出具有情景记忆的大模型
When LLMs Meet Cunning Questions: A Fallacy Understanding Benchmark for Large Language Models	香港科技大学	arXiv	首个基于弱智吧贴文的大模型谬误理解评测基准
Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study	北京智源人工智能研究院、新加坡南洋理工大学、北京大学	arXiv	让智能体直接控制键盘、鼠标，与一切软件交互
MemGPT: Towards LLMs as Operating Systems	伯克利	arXiv	类似操作系统管理内存的方式，管理记忆，使得模型可以处理超长文本
多模态数学推理数据集：MATH-V和MATHVISTA	前者是港中大的工作，后者是加利福尼亚大学洛杉矶分校的工作	MATHVISTA已发ICLR，MATH-V在arXiv上	最先进的多模态数学推理数据集
多模态多轮对话的工具模型，2024	华东师范大学	blog	一个帮你b站点歌放视频的多模态多轮对话模型
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation，2024	新加坡国立大学	arXiv	统一多模态理解与生成的全能Transformer，论文地址
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention，2024	Google	arXiv	长期记忆和超长上下文，论文地址
Qwen3: Think Deeper, Act Faster，2025	Qwen	Blog	截止2025，5月最强开源大模型技术介绍
Olmo3，2025	Olmo3	Report	pretrain+post-train 7B和32B全开源，代码，模型，数据细节全公开，直逼Qwen2.5性能
Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models（超长文本模型论文HSA），2025	Ant蚂蚁	arXiv	HSA-UltraLong，这是一个基于分层稀疏注意力（Hierarchical Sparse Attention, HSA）机制的模型。该模型能够在仅使用 32K 长度进行训练的情况下，成功将上下文窗口外推到 1600万（16M）Token
MoM (Mixture-of-Memories)新型线性序列建模架构），2025	Shanghai AI Laboratory	arXiv	论文旨在解决当前线性序列模型（如 Linear Attention, Mamba/SSM, Linear RNNs）存在的一个核心缺陷：记忆干扰（Memory Interference）
DeepSeek V4 的架构详解，2026	DeepSeek	Report	稀疏注意力+mHC 的架构工作，DeepSeek V4的 OPD 的训练问题
Sora技术简单过一遍	OpenAI	Blog	Sora技术的关键要点
ARC-AGI Benchmark	François Chollet（弗朗索瓦·肖莱）、Mike Knoop（迈克·克努普）、ARC Prize Foundation（ARC 奖基金会）	Blog	非传统 AGI Benchmark
世界模型Genie	Google	arXiv	世界模型代表论文