当前位置: 首页 > news >正文

回看23年的llm学习

LLM核心论文23篇

  1. Sentiment Neuron: Learning to Generate Reviews and Discovering Sentiment
  2. GPT-1: Improving Language Understanding by Generative Pre-Training
  3. Scaling Law: Scaling Laws for Neural Language Models
  4. GPT-3: Language Models are Few-Shot Learners


价值对齐

  1. InstructGPT: Training language models to follow instructions with human feedback
  2. Constitutional AI: Harmlessness from AI Feedback


架构

  1. Transformer: Attention is All You Need
  2. T5: Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
  3. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding


轻量微调

  1. Rethinking Efficient Tuning Methods from a Unified Perspective


推理时算法

  1. Chain-of-Thought: Chain-of-Thought Prompting Elicits Reasoning in Large Language Models


榜单

  1. MMLU: Measuring Massive Multitask Language Understanding
  2. MATH: Measuring Mathematical Problem Solving With the MATH Dataset


多模态

  1. Multimodal Few-Shot Learning with Frozen Language Models
  2. CLIP: Learning Transferable Visual Models From Natural Language Supervision
  3. Flamingo: a Visual Language Model for Few-Shot Learning


高观点

  1. Pretrained Transformers as Universal Computation Engines
  2. Large Language Models as General Pattern Machines
  3. An Observation on Generalization


讲座

  1. Ilya's talk at GTC2023
  2. Alec Radford on LM (Youtube)


过去与未来

  1. Learning Meaning in Natural Language Processing — The Semantics Mega-Thread
  2. What will GPT-2030 look like

或许有25年的25篇 但是我还没整理 待更新

http://www.jsqmd.com/news/431052/

相关文章:

  • 瑞云渲染大赛官网报名入口及参赛指南(参赛倒计时仅7天!)
  • 【qmcdump】解决加密音乐转换难题:音频格式自由转换的创新方案
  • 闭环参数与外围电路—反馈网络、偏置、补偿引发失真优化
  • 2026江苏车铣复合培训学校热门排行大盘点,UG培训/加工中心培训/SolidWorks培训,车铣复合培训学校口碑推荐 - 品牌推荐师
  • shell 比较两个文件内容是否一致
  • vue基于springboot框架的学生宿舍线上报修缴费管理系统--论文
  • 5个核心优势让Unity玩家轻松突破游戏语言壁垒
  • 细聊运城学烘焙师学校哪个好,怎么选择合适的 - 工业推荐榜
  • American English Nickname Collection数据集介绍,官网编号LDC2012T11
  • EPPlus:让.NET Excel处理效率提升300%的开源工具
  • EdgeRemover:彻底解决Microsoft Edge卸载难题的PowerShell工具
  • 3大突破!如何用m3u8-downloader攻克M3U8视频下载难题?
  • Mem Reduct:让老旧电脑重获新生的内存优化神器
  • 3大核心技术打造AI视频增强神器:Video2X全方位应用指南
  • 告别光猫配置解密难题:华为光猫终端解码工具的智能解决方案
  • 电源不当引发的运放失真及根治方案
  • 开源Xbox手柄驱动:macOS跨平台适配全流程指南
  • 2026年轨道交通电力电缆生产厂家推荐名单:轨道交通电力电缆厂家汇总 - 品牌2026
  • vue基于springboot框架的生产设备报修以设备仓库信息管理系统的设计与实现
  • 负载与驱动能力不匹配—运放带载失真、自激、振铃解决
  • 中小学生个性化阅读平台 任务奖励 微信小程序
  • 蓝奏云直链解析API:赋能开发者的文件链接转换解决方案
  • 解锁微信记忆:让聊天记录成为你的数字时光机
  • 自注意力机制
  • 2026年比较好的大连考公笔试班/大连考公考编推荐参考 - 品牌宣传支持者
  • 2026年靠谱的大连考研/大连考研辅导班推荐参考 - 品牌宣传支持者
  • 批量任务调度系统解决开源工具自动化难题:多线程队列架构实践指南
  • 2026雅思报班终极指南|实测5家靠谱机构,避坑不花冤枉钱(博主亲测版) - 品牌测评鉴赏家
  • 2026年进口高密度矩阵肌电代理商权威推荐榜:专业肌电设备代理/高精度矩阵采集/科研临床适用/品牌口碑优选 - 品牌推荐大师1
  • 开源PLC编程进阶指南:从技术原理到工业落地实践