当前位置: 首页 > news >正文

数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

来源:跟着大咖学AI


著名数学家、菲尔兹获得者陶哲轩在最近的一次视频访谈中谈到AI并发表了自己的观点。他认为,训练和运行大语言模型和其他现代AI所需的数学知识并不高深,本科数学专业的基础就足够支撑,核心只需掌握矩阵乘法和基础微积分。

人类早已掌握大语言模型的搭建、训练和运行方法,真正的核心难题并非“如何让模型跑起来”,而是缺乏可靠的理论框架来提前预测其任务表现。

以下相关视频和文字内容:

『 训练和运行大语言模型(或其他现代 AI)所需的数学知识并没有那么复杂。本科数学专业的学生就已经具备了必要的相关知识 —— 本质上,你只需要掌握矩阵乘法和一点微积分就行。

The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.

真正的难点不在于让这些模型 “如何运行”,我们已经知道怎么构建、训练和操作大语言模型了。难点在于理论层面我们缺少可靠的方法来评估或预测它们的性能。

The real challenge isn’thowthese models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance.

让人意外的是,这些模型在某些任务上表现极佳,在另一些任务上却效果很差,但我们没法提前预判哪些任务会是哪种情况。我们甚至连基础的经验法则都没有,只能依赖实证实验。

What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』

视频来源:

https://www.youtube.com/watch?v=ukpCHo5v-Gc ,油管 ,@DrBrianKeating

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

http://www.jsqmd.com/news/226615/

相关文章:

  • hal_uart_transmit在PLC通信中的应用:实战案例解析
  • 完整示例:Proteus中构建独立按键+数码管电路
  • 前端开发利器 hbuilderx下载 后的初始化设置说明
  • screen指令在ARM开发板调试中的应用详解
  • 救命神器2026 TOP10 AI论文软件:专科生毕业论文救星测评
  • 一文说清STM32MP1在ARM平台上的资源分配策略
  • 达美乐中国1月1日在46个城市新开62家门店 | 美通社头条
  • 利用UART串口通信实现HMI与控制器互联:完整示例
  • 基于nodejs+Vue的二手书估价回收平台_r7iyy6nh
  • 新手必看:工业控制项目中正确使用STLink引脚图
  • 大数据挖掘中的自动化异常检测
  • ue5 插件 WebSocket
  • 全网最全8个AI论文工具,专科生搞定毕业论文!
  • 使用Keil uVision5进行工控系统故障追踪:调试全解
  • vivado2025中集成DMA的高效通信系统实战案例
  • 手把手教你用寄存器映射理解ISR入口地址设置
  • 快速理解交叉编译工具链三元组:工业嵌入式入门必看
  • Keil5智能感知配置实战:从零实现自动补全
  • STM32CubeMX固件包下载支持的USB类型全面讲解
  • ego1开发板大作业vivado:硬件描述基础全面讲解
  • 基于nodejs+Vue学生社团管理系统的设计与实现_33x07u9r
  • 基于 nodejs_vvue的企业财务电子报销系统设计与实现_73w52x8b
  • 基于nodejs+Vue框架的健康医疗体检管理系统_q06y6362
  • 微服务安全认证的未来发展趋势与技术展望
  • 图解STLink引脚图:小白指南教你如何正确识别管脚
  • Keil5安装教程51单片机(STC89C52):新手入门必看指南
  • Keil5安装教程51单片机(STC89C52):新手入门必看指南
  • i2c读写eeprom代码多字节写入实战演示
  • 在compose页面中显示JAVA自定义控件
  • C++ 结构体(struct)