当前位置: 首页 > news >正文

logit 函数 与 原始分数 logits

logit函数与原始分数logits

1. logit 定义

logit是一个数学函数,常称为“对数几率函数”(log-odds)。

它把概率值p ∈ ( 0 , 1 ) p \in (0,1)p(0,1)映射到整个实数轴( − ∞ , + ∞ ) (-\infty,+\infty)(,+)

l o g i t ( p ) = ln ⁡ p 1 − p \mathrm{logit}(p)=\ln\frac{p}{1-p}logit(p)=ln1pp

其中几个术语可以这样理解:

  • 几率(odds):不是概率本身,而是“发生 : 不发生”的比值,
    o d d s = p 1 − p \mathrm{odds}=\frac{p}{1-p}odds=1pp
    例如p = 0.8 p=0.8p=0.8,则o d d s = 0.8 / 0.2 = 4 \mathrm{odds}=0.8/0.2=4odds=0.8/0.2=4,表示“发生是不发生的 4 倍”。

  • 对数(log):指数运算的反运算。机器学习里常用自然对数ln(底数为e ee,约等于2.7183 2.71832.7183)。

  • 对数几率(log-odds):先算几率,再取对数,即
    log ⁡ p 1 − p \log\frac{p}{1-p}log1pp

术语来源上,1944 年,Joseph Berkson 将函数ln ⁡ p 1 − p \ln\frac{p}{1-p}ln1pp命名为logit,即logistic unit的缩写。术语“逻辑回归”(logistic regression)也由此而来。

数学定义上,它对应的是log-odds对数几率:先求几率,再取对数。


2. 与Sigmoid 互为反函数

Sigmoid函数为:

σ ( x ) = 1 1 + e − x \sigma(x)=\frac{1}{1+e^{-x}}σ(x)=1+ex1

logitSigmoid互为反函数:

σ ( l o g i t ( p ) ) = p , l o g i t ( σ ( x ) ) = x \sigma(\mathrm{logit}(p))=p,\quad \mathrm{logit}(\sigma(x))=xσ(logit(p))=p,logit(σ(x))=x

直观上:

  • Sigmoid:把任意实数映射到( 0 , 1 ) (0,1)(0,1)
  • logit:把( 0 , 1 ) (0,1)(0,1)的概率映射回任意实数。

3. logits

在深度学习里,logits(复数)通常指模型最后一层“激活前”的原始输出分数,取值可为任意实数。

  • 二分类:一个logit常送入sigmoid得到正类概率;
  • 多分类:一组logits送入softmax得到类别概率分布。

例如,[3.0, 1.0, 0.2]是一组logits,经过softmax后会得到类似[0.84, 0.11, 0.05]的概率分布。


4. logit 与 logits 的区别(易混点)

  • logit:数学函数名,l o g i t ( p ) = ln ⁡ p 1 − p \mathrm{logit}(p)=\ln\frac{p}{1-p}logit(p)=ln1pp
  • logits:神经网络术语,表示一组原始分数(模型输出,未归一化)。

一句话记忆:

logit是“函数”,logits是“数据(模型输出–原始分数)”。


5. 一个简短示例(PyTorch)

importtorch# 概率值, 标量转张量用于计算p1=torch.tensor([0.8])# logit函数实现:概率 -> 实数值logit_p1=torch.log(p1/(1-p1))print("logit(0.8) =",logit_p1.item())# 约 1.3863# sigmoid函数:是logit的反函数p2=torch.sigmoid(logit_p1)print(torch.allclose(p2,p1))# True# 多分类:logits数据,经softmax转换为概率分布probslogits=torch.tensor([3.0,1.0,0.2])probs=torch.softmax(logits,dim=0)#沿着第0维计算softmaxprint("probs =",probs)print("sum =",probs.sum().item())# 1.0
http://www.jsqmd.com/news/843867/

相关文章:

  • SQL注入技术详解:从联合查询到盲注实战
  • 高效构建离线学习库:MoocDownloader一站式MOOC下载方案终极指南
  • 魔兽争霸III终极兼容性解决方案:WarcraftHelper完全配置指南
  • Windows远程桌面终极突破:RDP Wrapper创新性解锁多用户并发连接
  • 【无人机三维路径规划】基于遗传算法GA实现复杂山地环境下无人机三维路径规划研究(Matlab代码实现)
  • Windows防休眠终极指南:如何让电脑时刻保持清醒工作状态
  • 3种高效方法部署Windows包管理器:PowerShell一键安装Winget指南
  • 终极解决方案:NoSleep防休眠工具让你的Windows永不休眠
  • 靠谱的涡流模块个性化开发方案推荐 - mypinpai
  • XNBCLI终极指南:掌握星露谷物语XNB文件解包打包技术
  • 构建开源情报平台:模块化设计与自动化聚合实战
  • 网易云音乐NCM格式转换:三步解密法让音乐自由播放
  • NotebookLM赋能图书馆学研究:3大颠覆性应用+5个未公开工作流
  • Keil µVision多目标配置与条件编译实战指南
  • 如何在2026年继续畅玩Flash游戏?开源解决方案CefFlashBrowser深度指南
  • 靠谱的视频拍摄公司推荐 - mypinpai
  • 别再手动配置了!用Vivado 2018.2的MicroBlaze MCS IP核,5分钟搭建你的第一个软核处理器系统
  • 甲骨文云实例重启后公网 IP 地址会发生改变吗?
  • LKY Office Tools:一键自动化部署Office的终极解决方案
  • Dify 进阶篇:五类应用怎么选?从 Chat Assistant 到 Workflow 的场景拆解
  • 第十三章:R 读取 txt、csv 表格数据
  • 中兴光猫终极管理工具:一键开启工厂模式与永久Telnet完全指南
  • Pcap04高精度电容测量芯片在工业传感器中的应用:如何配置寄存器实现多通道差分测量
  • 3分钟掌握RVC语音克隆:零基础打造你的专属AI语音助手
  • 为什么中国探月工程团队已禁用传统文献管理工具?NotebookLM在嫦娥六号热控系统设计中的8小时知识闭环实践
  • 2026年亲测降至5%以下!10款快速降AI率工具推荐 - 降AI实验室
  • Ansible自动化运维:从入门到实战,掌握无代理架构与声明式配置
  • Valmet Metso A413654 通信接口板
  • HC5503晨芯阳70mΩ,2.1A 5V USB 高侧限流负载开关
  • 利用Taotoken模型广场为不同业务场景挑选合适的大模型