当前位置: 首页 > news >正文

大模型算法学习2026.6.1

主播是双非本211硕研0,计科本软工硕,之前了解过简单的机器学习和深度学习,目前打算冲大模型算法,同时准备agent应用开发作为planB。暂时打算是学cs224n、cs336和之前准备复试买的一个深度学习课,学完后做2个项目投小厂的算法实习,以后会不定期更新学习内容。

----------------------------------------------------------分割线--------------------------------------------------------------

Softmax函数作用:Softmax属于激活函数(activation function),Softmax函数的核心作用是将一组任意实数转换为总和为1、取值在0到1之间的概率分布,它通过指数运算放大数值间的差距,让较大数值对应的概率更突出、较小数值对应的概率被压缩,从而清晰呈现每个类别的置信度;该函数广泛用于深度学习的分类任务,在Transformer架构(含大语言模型)中,注意力机制权重计算和模型输出层预测下一个词的概率时都依赖Softmax,是连接模型原始分数与概率决策的关键函数。

分布语义学:一个单词的含义由经常出现在它附近的单词给出。

数据用100维、300维来表示是什么意思?

用100维、300维表示数据就是把一个原本复杂的事物(比如一个词、一张图、一个人)抽象成由100个或300个数字组成的列表(数学上叫“向量”),每一个数字都代表这个事物的某个潜在特征或属性,而这些特征通常是计算机从大量数据中自动学习出来的,不是我们人为定义的。比如,假设用300维的稠密向量表示“苹果”,第38维表示“水果”,第102维表示“手机”。当然维度越高表达能力越强,但计算成本和数据需求也越大。

word2vec:

word2vec 是一种用于从大规模无标注文本语料中学习词向量(Word Embedding)的浅层神经网络模型。由 Mikolov 等人在 Google 于 2013 年提出。其核心思想是分布式假设(Distributional Hypothesis):语义相似的词具有相似的上下文分布。通过预测目标词与其上下文词之间的共现关系,模型将每个词映射到一个低维、稠密的实值向量空间中,使得语义或语法相近的词在向量空间中距离较近。

http://www.jsqmd.com/news/959375/

相关文章:

  • 当AI学会‘读心’:从AOL搜索数据泄露看NLP时代的隐私保卫战
  • 从一次生产环境MySQL启动失败,聊聊Linux文件权限和SELinux的那些“坑”(实战复盘)
  • HoRain云--Claude Code 与 remotion-best-practices 制作视频
  • Anthropic发布Opus 4.8,首次超越OpenAI
  • 2026年评价高的厂房换气风机/铁皮负压风机/蒸发冷风机/风机厂家推荐与选型指南 - 行业平台推荐
  • 《和死对头成亲后》小说|下载|txt
  • 2026年四川密封固化剂地坪/无机磨石地坪/工厂地面翻新品牌厂家推荐 - 品牌宣传支持者
  • Altium Designer新手避坑:从PCB设计到Gerber文件导出的完整流程与常见错误排查
  • 多模态对话代理的强化学习优化与潜在动作空间技术
  • 从仿真到实战:手把手教你用MATLAB Simulink建模分析变压器漏感(变比400:800案例)
  • 2026年Q2巴斯曼快速半导体保护熔断器服务商权威评测:LEM莱姆开环闭环电流传感器、LEM莱姆电压传感器、LEM莱姆电流传感器选择指南 - 优质品牌商家
  • C# 索引器 this[]
  • 【2027最新】基于SpringBoot+Vue的医疗挂号管理系统管理系统源码+MyBatis+MySQL
  • 01-React基础入门——11-Refs 与 DOM 操作
  • 讲真的2026年武汉离婚律师推荐 这5位实战派值得选 - 本地品牌推荐
  • 随着树木和非树木植被覆盖的扩大,全球人口暴露于城市绿地的不平等加剧
  • 【大白话说Java面试题 第97题】【Mysql篇】第27题:说说分库与分表的设计?
  • 2026年质量好的镶件机械手/车床机械手/伺服机械手深度厂家推荐 - 品牌宣传支持者
  • 2026年口碑好的地库地坪/无机磨石地坪/混凝土地面施工/厂房地坪生产厂家推荐 - 行业平台推荐
  • 新手开店不会管水站?数字化工具助力新店平稳起步
  • 从STM32转战HC32,GPIO配置这5个坑我帮你踩过了(含解锁、等待时间、复用功能避坑)
  • GRB X射线吸收研究:TEPID模型与介质特性分析
  • 告别接线混乱!ESP8266驱动1.44寸ST7735屏,TFT_eSPI库的OVERLAP模式实战(附完整代码)
  • 从‘边缘’到‘语义’:手把手教你用TensorBoard逐层可视化ResNet的‘认知’过程(PyTorch版)
  • 告别原生File类:用Hutool的FileUtil,5分钟搞定Java文件操作(附避坑指南)
  • 【C++初阶】STL 开篇:站在巨人肩膀上,先聊聊编码和现代语法
  • 入门大模型工程师第五课----通过微调改善大模型在垂直领域的表现
  • STM32CubeMX配置USART空闲中断+DMA接收不定长数据,5分钟搞定(HAL库版)
  • Speechless终极指南:3分钟学会微博备份,永久保存你的数字记忆
  • 保姆级教程:用ROS1在局域网内搞定两台机器人的主从通信(含rqt_graph可视化验证)