当前位置：首页 > news >正文

python uuid

news 2026/7/26 0:42:31

# 聊聊Python里的UUID：那些看似随机却又唯一的标识符

在编程的世界里，我们经常需要给各种东西一个独一无二的身份标识。比如给数据库里的每一条记录、网络请求的每一次会话、或者分布式系统中的每一个节点。这时候，UUID就派上用场了。它就像给每个对象发了一张全球唯一的身份证，不管你在哪里生成，理论上都不会和别人撞号。

它到底是什么

UUID的全称是Universally Unique Identifier，翻译过来就是通用唯一标识符。它本质上是一个128位的数字，通常用32个十六进制字符表示，中间用连字符分成五段，看起来像这样：550e8400-e29b-41d4-a716-446655440000。

这个标准最早是在1990年代提出的，后来被收录到RFC 4122文档中。有趣的是，UUID的设计思路其实挺巧妙的——它不依赖中央注册机构来保证唯一性，而是通过算法本身来确保极低的碰撞概率。理论上说，如果你每秒生成10亿个UUID，需要大约100年才会出现一次重复。在实际应用中，这个概率小到可以忽略不计。

它能解决什么问题

想象一下，你在开发一个大型的分布式系统，有几十台服务器同时在处理用户请求。每台服务器都需要生成一些唯一的ID来标记各种操作。如果每台服务器都自己生成ID，怎么保证它们不会生成相同的ID呢？

UUID就是为解决这类问题而生的。它让每台机器都能独立生成ID，而不需要去一个中心服务器申请。这在分布式系统中特别有用，因为避免了单点故障和网络延迟。

另一个常见的场景是数据库设计。如果你需要把多个数据库的数据合并到一起，用自增整数作为主键就会遇到冲突问题。但用UUID就不会，因为每个记录都有全球唯一的标识。

还有Web开发中的会话管理、文件上传时的临时文件名、消息队列中的消息标识等等，UUID都能派上用场。它就像编程世界里的“指纹”，给每个对象一个独特的标记。

在Python里怎么用

Python标准库里的uuid模块用起来相当简单。这个模块提供了几种不同的UUID生成方法，每种都有不同的适用场景。

最常用的是uuid4()，它基于随机数生成UUID。用起来特别简单：

importuuid# 生成一个随机的UUIDunique_id=uuid.uuid4()print(unique_id)# 输出类似：f47ac10b-58cc-4372-a567-0e02b2c3d479

如果你需要把UUID存到数据库或者通过网络传输，可以把它转换成字符串：

str_id=str(unique_id)# 或者hex_id=unique_id.hex# 去掉连字符的32位十六进制字符串

从字符串恢复成UUID对象也很简单：

original_uuid=uuid.UUID('f47ac10b-58cc-4372-a567-0e02b2c3d479')# 或者从去掉连字符的字符串恢复another_uuid=uuid.UUID(hex='f47ac10b58cc4372a5670e02b2c3d479')

除了uuid4()，还有其他几种生成方式。uuid1()基于主机MAC地址和时间戳生成，这在某些需要可追溯性的场景下有用，但因为暴露了MAC地址，在安全要求高的环境中要慎用。uuid3()和uuid5()基于命名空间和名称生成确定性UUID，同样的输入总是得到同样的输出，适合需要可重复生成的场景。

一些实际使用中的考量

虽然UUID用起来方便，但在实际项目中还是有一些需要注意的地方。

首先是性能问题。UUID是128位的，比普通的自增整数大不少。在数据库里，如果用UUID做主键，可能会影响索引性能，特别是当数据量很大的时候。有些数据库对UUID的支持也不够优化。一个折中的办法是，可以用自增整数作为主键，同时用UUID作为业务逻辑上的唯一标识。

存储空间也是个考虑因素。UUID的字符串表示需要36个字符（32个十六进制字符加4个连字符）。如果存储大量UUID，可以考虑用二进制格式存储，能节省不少空间。在Python里，可以用uuid_obj.bytes获取16字节的二进制表示。

在Web开发中，如果把UUID暴露在URL里，那36个字符的字符串看起来可能不太友好。有些开发者会选择Base64编码来缩短它，但要注意URL安全性。

还有一个细节是UUID的版本问题。开头提到的uuid4()生成的是版本4的UUID，基于随机数。如果你看到UUID的第一个数字段（第三组字符的第一个数字）是4，那就是版本4。版本1是时间戳+MAC地址，版本3和5是基于名称的。了解这些版本的区别，有助于在合适的场景选择合适的生成方式。

和其他方案对比

除了UUID，还有其他生成唯一ID的方法，各有各的适用场景。

数据库自增ID是最简单直接的，性能好，存储空间小。但它有个明显的缺点——在分布式系统中不好用，需要中心化的ID生成服务。而且如果暴露给客户端，可能会泄露业务量信息。

Twitter的Snowflake算法是另一种流行的方案，它生成的是64位的整数，包含时间戳、机器ID和序列号。比UUID更节省空间，而且按时间有序，对数据库索引更友好。但需要维护机器ID的分配，系统稍微复杂一些。

还有一些数据库自带的UUID功能，比如PostgreSQL有uuid-ossp扩展，MySQL有UUID()函数。这些和Python生成的UUID是兼容的，可以在数据库层面直接生成。

选择哪种方案，主要看具体需求。如果只是单机应用，自增ID可能就足够了。如果是分布式系统，需要各节点独立生成ID，UUID是个不错的选择。如果对存储空间和性能有更高要求，可以考虑Snowflake这类方案。

UUID在Python生态里用得很广泛，很多框架都内置了对它的支持。比如Django的模型字段有UUIDField，SQLAlchemy也有对应的UUID类型。这些框架层的支持让使用UUID变得更加方便。

说到底，技术选型没有绝对的好坏，只有适合与否。理解每种方案的特点，根据实际场景做出选择，这才是最重要的。UUID作为其中一种成熟的方案，在需要全局唯一标识的场景下，确实是个可靠的选择。

查看全文

http://www.jsqmd.com/news/588401/

【实战指南】Green Hills MULTI-IDE 从零安装到工程创建全流程

OpenCode插件codecraft实战：实现文件规划法，让AI帮你写代码

计算机毕业设计：Python新能源汽车多维分析与矩阵分解推荐系统 Django框架 snowNLP 协同过滤推荐算法 requests爬虫可视化（建议收藏）✅

13 个在线接码网站汇总（免费为主）

低噪放（LNA）关键参数在5G通信电路设计中的优化策略

Serpent 算法：从保守设计到硬件安全典范的深度剖析

Z-Image Atelier 跨平台部署：Node.js后端服务构建与API封装

搜维尔科技：DG-5F-S机械手采用五指、20自由度多关节结构，旨在支持精准抓取和操作

保姆级教程：在Ubuntu 20.04上从零搭建AFL++模糊测试环境（含QEMU模式配置与常见报错解决）

SpeedyBee F405 V4 55A飞塔到手后，除了接线你还需要注意这3个关键设置

易语言VS VUE：编程工具终极对决

GAN知识蒸馏全攻略：从FAKD原理到EdgeSRGAN模型优化技巧

ComfyUI实战：LivePortrait对口型技术深度解析，打造动态人像新体验

imx6ull静态IP配置与MobaXterm远程登录实战指南

Hyperf方案 Apollo配置中心

WarcraftHelper：突破经典游戏限制的焕新体验工具

避坑指南：RcisTarget转录因子分析中常见的5个错误及解决方案（附数据库选择建议）

道路设施目标检测数据集（约5000张已标注）｜YOLO训练与智能交通应用数据集

别再乱写音视频了！FFmpeg的av_interleaved_write_frame到底怎么用才不卡顿？

信号处理实战：为什么分析心电(ECG)这类非平稳信号，连续小波变换(CWT)比傅里叶变换更合适？

行人与骑行者目标检测数据集（5000张高质量标注）｜YOLO训练数据集

[具身智能-220]：“关节空间”与“操作空间”

AI Agent 记忆写入机制设计：从噪声过滤到 GraphRAG 架构

复旦微FM33单片机GPIO的“高级”玩法：用FL库实现软件PWM、按键扫描和LED流水灯

2026年APP兼容性测试平台选型指南：精准破局兼容性难题困扰

Galaxy新手必看：5分钟搞定生物信息学工作流搭建（附Circos图实战）

Python 实现常用的 23 种设计模式（详解）- 附完整代码与类图

5步打造专业虚拟摄像头：OBS插件从部署到精通

基于Python的充电桩时空供需动态解析：以深圳峰谷电价与节假日效应为例

项目实际情况：已经开发一段时间，现在后端引入SpringDoc/OpenAPI，前端采用哪个方案更合适？用vite-plugin-openapi-ts？还是用openapi-typescript