当前位置: 首页 > news >正文

C++中TAS和CAS实现自旋锁

目录

1.TAS和CAS介绍

2.TAS 使用场景:极简自旋锁

3.CAS 核心使用场景

3.1.高性能自旋锁(多核首选)

3.2.无锁线程安全计数器(不用锁,纯 CAS)

3.3.线程安全变量更新(通用值替换)

4.测试代码

5.TAS vs CAS对比


1.TAS和CAS介绍

它们是CPU 硬件提供的两种最基础的原子读 - 改 - 写(RMW)指令,专门用来解决多线程并发竞争问题,是所有锁、无锁结构的底层基石。

TAS = Test-And-Set 「测试并设置」

  • 读取内存里的旧值
  • 强制把这个内存写成 1(true)
  • 返回刚才读到的旧值

核心特征:一定会写,不管原来是什么

CAS = Compare-And-Swap 「比较并交换」

  • 拿内存当前值 和 你给的期望值对比
  • 如果相等,才把内存改成新值
  • 如果不等,什么都不做
  • 返回是否修改成功

核心特征:条件写入,不满足就不碰内存

总结:

  • TAS:先写为占用,再告诉你之前是不是空闲
  • CAS:先看是不是空闲,是才占用,不是就放弃

两者都是原子操作,CPU 保证整个过程一步完成,不会被其他线程打断。

2.TAS 使用场景:极简自旋锁

TAS 是 CPU 原生的最简单原子指令,只能实现基础互斥自旋锁,优点是代码极简,缺点是多核性能差。

#include <atomic> #include <thread> #include <iostream> //intel指令 #include <immintrin.h> //_mm_pause(); // 和 pause 汇编完全一样 // 自旋等待优化(x86) #define asm_volatile_pause() asm volatile ("pause") // -------------------------- // TAS 实现:极简自旋锁 // 场景:临界区极短、低并发、追求代码最简单 // -------------------------- class TasSpinLock { private: // C++ 原生 TAS 原子变量(硬件直接支持) std::atomic_flag lock_ = ATOMIC_FLAG_INIT; public: void lock() { // TAS 核心:test_and_set = 原子读旧值 + 强制写true while (lock_.test_and_set(std::memory_order_acquire)) { asm_volatile_pause(); // 自旋优化 } } void unlock() { lock_.clear(std::memory_order_release); } }; // 测试:多线程计数 int cnt = 0; TasSpinLock tas_lock; void work() { for (int i = 0; i < 100000; ++i) { std::lock_guard<TasSpinLock> guard(tas_lock); cnt++; } } int main() { std::thread t1(work), t2(work); t1.join(); t2.join(); std::cout << "TAS 自旋锁结果: " << cnt << std::endl; // 200000 return 0; }

✅ 适合:简单互斥、低并发、代码极简

❌ 不适合:多核高竞争(缓存颠簸严重)

3.CAS 核心使用场景

CAS 是现代并发编程的基石,支持条件写入,自旋时不修改共享变量,多核性能远超 TAS

3.1.高性能自旋锁(多核首选)

// -------------------------- // CAS 实现:高性能自旋锁 // 场景:多核高并发、低延迟临界区 // -------------------------- class CasSpinLock { private: std::atomic<bool> locked_{false}; public: void lock() { bool expected = false; // CAS 核心:只有值=expected(false),才写入true while (!locked_.compare_exchange_weak( expected, true, std::memory_order_acquire )) { expected = false; // 重置期望值 asm_volatile_pause(); } } void unlock() { locked_.store(false, std::memory_order_release); } };

3.2.无锁线程安全计数器(不用锁,纯 CAS)

CAS 可以实现完全无锁的并发操作,比自旋锁更快:

// -------------------------- // CAS 实现:无锁原子计数器 // 场景:高并发计数(无锁、高性能) // -------------------------- std::atomic<int> cas_cnt{0}; void lock_free_count() { int old_val, new_val; for (int i = 0; i < 100000; ++i) { do { old_val = cas_cnt; // 读旧值 new_val = old_val + 1;// 计算新值 // CAS:只有旧值没被修改,才更新成功 } while (!cas_cnt.compare_exchange_weak(old_val, new_val)); } } // 测试 int main() { std::thread t1(lock_free_count), t2(lock_free_count); t1.join(); t2.join(); std::cout << "CAS 无锁计数器: " << cas_cnt << std::endl; // 200000 return 0; }

3.3.线程安全变量更新(通用值替换)

// -------------------------- // CAS 实现:安全更新共享变量 // 场景:任意线程安全值修改 // -------------------------- std::atomic<int> value{10}; void update_value(int target) { int old = value; // 只有当前值=old,才更新为target if (value.compare_exchange_weak(old, target)) { std::cout << "更新成功!\n"; } else { std::cout << "值已被修改,更新失败!\n"; } }

4.测试代码

// ===================== C++ RAII 自动锁(通用)===================== template <typename Lock> class ScopedLock { private: Lock& lock_; public: explicit ScopedLock(Lock& lock) : lock_(lock) { lock_.lock(); } ~ScopedLock() { lock_.unlock(); } // 禁用拷贝 ScopedLock(const ScopedLock&) = delete; ScopedLock& operator=(const ScopedLock&) = delete; }; // ===================== 测试代码 ===================== int counter = 0; // 二选一测试:TasSpinLock 或 CasSpinLock TasSpinLock spin_lock; // CasSpinLock spin_lock; // 线程工作函数 void work() { for (int i = 0; i < 100000; ++i) { ScopedLock<decltype(spin_lock)> lock(spin_lock); // 自动加锁/解锁 counter++; } } int main() { // 创建两个线程竞争锁 std::thread t1(work); std::thread t2(work); t1.join(); t2.join(); // 正确结果:200000 std::cout << "最终计数: " << counter << std::endl; return 0; }

5.TAS vs CAS对比

特性TAS 自旋锁CAS 自旋锁
原子操作atomic_exchange(强制写)atomic_cmpxchg(条件写)
自旋行为每次循环都修改锁变量自旋时只读,不修改
缓存性能差(多核缓存颠簸、总线流量大)优(缓存一致性友好)
性能场景单核 / 低竞争尚可,多核高竞争拉胯多核 / 高竞争首选,现代标准实现
灵活性仅能做简单自旋锁可实现无锁队列、公平锁、futex 等
http://www.jsqmd.com/news/694856/

相关文章:

  • vue2 和 vue3 的核心区别
  • N_m3u8DL-RE:跨平台流媒体下载工具的完整技术解析与实战指南
  • 免费B站视频转换终极指南:m4s-converter实现音视频资源永久保存
  • VSCode里调用本地大模型总报错?7类高频Error代码级诊断手册,资深架构师连夜整理
  • Atcoder-ABC-454-E LRUD Moving
  • 从混淆矩阵到决策曲线:用Matplotlib一步步拆解DCA背后的净获益计算
  • Phi-3.5-mini-instruct网页版惊艳效果:将微信聊天记录→会议纪要→待办事项清单三步生成
  • 2032 年全球微型直流电动机市场将达 226.5 亿美元
  • 基于YOLOv26深度学习算法的社区路灯故障检测系统研究与实现
  • C++函数重载和缺省参数:告别‘iAdd’和‘dAdd’,写出更优雅的代码
  • 【MATLAB源码-第423期】基于MATLAB的机器视觉与多特征融合迁移学习的道路裂多类别缺陷检测仿真。
  • 仅限首批200家三甲医院技术科获取的VSCode医疗校验配置包(含NMPA审评要点映射表)
  • AI图像分层终极指南:3分钟掌握layerdivider完整教程
  • 3步快速教程:免费在Windows 11上运行Android应用的完整方案
  • 《PySide6 GUI开发指南:QML核心与实践》 第八篇:性能优化大师——QML应用性能调优实战
  • Jetson Xavier NX开机慢?试试调整UEFI这3个设置,启动速度立竿见影
  • 【VSCode协作效率翻倍实战手册】:基于LSP+CRDT双引擎重构的6步优化路径,仅限内部团队验证的3项未公开配置
  • 2026-2032期间,电池包断路单元(BDU)市场年复合增长率(CAGR)为9.1%
  • 系统进入强震荡或失稳状态
  • 从Colab到Kaggle:手把手教你用Accelerate在免费GPU/TPU笔记本里跑通PyTorch大模型训练
  • 【嵌入式IDE迁移避坑白皮书】:告别Keil/IAR!用VSCode实现同等专业级调试能力——含反汇编窗口同步、RTOS线程视图、硬件断点精准控制
  • 2026年研学旅行机构寻找实力GEO服务商:选型标准与主流服务商推荐 - 商业小白条
  • 从实战复盘到技巧精讲:一次DASCTF解题的深度剖析与通用Writeup方法论
  • Python数据科学:目标变量变换技术详解与应用
  • 如何永久保存微信聊天记录并生成个性化年度报告
  • ResNet50V2学习笔记
  • 30天快速上手Python-01 开发环境 PyCharm
  • 机器学习中的近似方法:从数学基础到工程实践
  • Qianfan-OCR企业实操:合同文档表格Markdown识别+条款抽取落地案例
  • 奢侈品护理培训 - GrowthUME