当前位置: 首页 > news >正文

别再让 NaN 和 None 把你搞晕了:谈谈 Python 里的“空值”哲学

搞数据处理或者写后端接口的朋友,大概率都经历过这种“鬼打墙”的时刻:

数据库里明明是NULL,读到 Python 里变成了None,扔进 Pandas 做个计算变成了NaN,最后想转成 JSON 返回给前端时,因为包含NaN直接报错,或者变成了一个前端 JS 无法识别的NaN符号。

最近读了 Filip Mularczyk 的一篇名为《Nothing to Declare》的文章,很有共鸣。特别是在 Pandas 3.0 普及的当下,我们处理“没有值”这种状态时,依然容易掉坑里。

今天就来聊聊这三个长得像、但脾气完全不同的“空值”:NaNNonenull,以及如何在工程中优雅地处理它们。

三个“空”,三种命

首先得祛魅,这三位在 Python 的内存里完全是三个物种:

  1. None (Python 的亲儿子)

    • 它是 Python 的内置对象,属于NoneType
    • 它代表**“逻辑上的无”**。比如“用户没有填昵称”,这就是None
    • 它是一个单例(Singleton),用来做判断时,永远要用is None而不是== None
  2. NaN (数学界的怪胎)

    • 全称 Not a Number,但它在 Python 里居然是float类型!
    • 它代表**“数值上的缺失或计算错误”**。比如0/0或者读取了一个空的 CSV 数值格。
    • 它最反直觉的地方在于“六亲不认”:NaN != NaN是成立的。这意味着你没法用==去在列表里找它,必须用math.isnan()pd.isna()
  3. null (外来的和尚)

    • Python 语法里没有null
    • 它通常存在于JSONSQL中。
    • 当我们谈论null时,通常是在讨论数据交换(IO)。当一个 JSON 的null传进来,Python 的json库默认把它转成None

工程实践中的“灾难现场”

Filip 在文章里提到了一个非常典型的场景:使用 Pydantic 做数据校验

假设前端给你发来这样一个 JSON:

{"temperature":null,"humidity":"NaN"}

如果你在 Pydantic 模型里定义字段为float,事情就变得微妙了。

  • 对于null:Pydantic 默认可能抛错,除非你声明类型为float | None(或者Optional[float])。
  • 对于"NaN":Pydantic 会很“贴心”地把它转成 Python 的float('nan')

问题来了:当你把这个清洗后的模型存入数据库,或者做数学运算时,混入的NoneNaN会导致完全不同的结果。None可能会让数学运算抛出 TypeError,而NaN会像病毒一样,让所有跟它运算的结果都变成NaN

怎么处理才优雅?

结合文章观点和现在的工程习惯,我有几个建议:

1. 语义分离:是“没填”还是“算错了”?

在定义数据模型(Model)时,要明确区分这两种状态。

  • 如果是因为用户没填,或者数据暂缺,尽量保持为None
  • 如果是传感器读数错误、计算溢出,保留NaN是合理的,因为它保留了“这是一个数值类型”的特征。
2. 利用 Pydantic 的 Validator

不要指望自动转换能完全符合心意。在 Pydantic 中,最好写个field_validator(v2 写法):

# 伪代码示例:确保导出时行为可控@field_validator('score')@classmethoddefhandle_empty_score(cls,v):ifvisNone:returnfloat('nan')# 如果业务要求必须是数值计算returnv

或者反过来,在序列化成 JSON 之前,把所有的NaN清洗回None,因为标准的 JSON 规范其实并不支持NaN(虽然有些解析器能容忍),传null给前端通常是最安全的做法。

3. Pandas 3.0 的新常态

现在是 2026 年,Pandas 3.0 已经让Nullable类型(如Float64Int64,注意是大写首字母)成为了主流。

以前最让人头大的问题是:一个整数列里混进一个NaN,整列会被强制强转成浮点数。现在,推荐使用 PyArrow 后端或者 Pandas 的 Nullable 类型。这允许None(在 Pandas 里表现为<NA>)和整数和平共处,而不需要动不动就退化成浮点型的NaN

总结

并没有一种万能的“空值”能解决所有问题。

  • 做数学计算:请用NaN,并小心它的传染性。
  • 做逻辑流转:请用None
  • 做接口交互:认准null,并确保在 Python 边界处(比如 Pydantic 层)把NaNNone的转换规则定死,别让它们“自由发挥”。

写代码时多想一步:“这个空,到底是因为不存在,还是因为算不出来?”这一秒的思考,能帮你省下好几个小时 debug 的时间。

http://www.jsqmd.com/news/344332/

相关文章:

  • 基于Java的建筑机械智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 第12章-空间数据库与PostGIS - 实践
  • 2026年可靠的全面预算管理系统公司口碑推荐榜单:五大厂商集成协同实证分析 - 星野科技
  • 基于Java的建筑条款智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 2026可持续财务指南:热门的全面预算管理系统品牌哪家好 - 星野科技
  • 基于Java的建筑布展智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 基于Java的建筑施工监管智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • DeepSeek-OCR:10倍光学压缩新范式 - 实践
  • 用 XinServer 给桌面端应用搭建轻量后台
  • 从零到一构建企业级云原生中间件:基于RocketMQ 5.0与Kubernetes Operator实现万亿级消息处理架构的设计与实践全流程深度拆解
  • 用React Native开发OpenHarmony应用:View层级关系管理
  • Generative Recolor:图标画到手抽筋?“矢量矩阵流” 10分钟重构全套 UI 资产库
  • openlayer实现给线的附近添加点,点支持移动
  • React Native鸿蒙版:View弹性盒子布局
  • OpenHarmony环境下React Native:ImageBackground覆盖层布局
  • 别再只用加号了!Python字符串拼接的正确姿势
  • 细胞电生理仿真软件:NEURON_(19).NEURON与其他生物模拟软件的互操作性
  • React Native + OpenHarmony:View布局容器组件
  • 细胞电生理仿真软件:NEURON_(17).NEURON图形界面操作
  • OpenHarmony + RN:Image图片混合模式
  • 细胞电生理仿真软件:NEURON_(14).实验数据的拟合与验证
  • 用React Native开发OpenHarmony应用:Image图片滤镜效果
  • React Native鸿蒙:ImageBackground背景图适配
  • React Native鸿蒙版:Image图片遮罩效果
  • 详细介绍:AI喷洒无人机助力智慧菜田除草新模式,基于最新以注意力为核心的YOLOv12全系列【n/s/m/l/x】参数模型开发构建无人机航拍农田巡检场景下田地杂草智能化检测识别系统
  • 【完整源码+数据集+部署教程】饮品类型识别分割系统源码&数据集分享 [yolov8-seg-C2f-SCcConv&yolov8-seg-aux等50+全套改进创新点发刊_一键训练教程_Web前端展
  • C++11核心特性全解析
  • 你的电视 2.3.5 | 空壳直播软件,支持多个线路,附直播源
  • 互联网大厂Java求职面试实战:涵盖Spring Boot、微服务与AI技术栈
  • 靠谱的青少年法治教育展厅设计专业公司有哪些 - 工业品牌热点