​【深入理解Linux内核锁】| 原子操作

【深入理解linux内核锁】三、原子操作

​【深入理解Linux内核锁】| 原子操作

1、原子操作概念

原子操作(atomic operation)是不可分割的操作。其通过原子变量实现,确保在单个CPU周期内,读写该变量不会被中断,从而通过判断该变量的值来解决并发引起的互斥问题。

Atomic类型的函数在执行期间可以禁止中断,并保证访问变量时的原子性。

同时,Linux内核提供了两种原子操作接口,分别针对位和整型变量。

2、整型变量原子操作

2.1 API接口

/*设置原子变量的值*/atomic_t v = ATOMIC_INIT(0);            /* 定义原子变量v并初始化为0 */void atomic_set(atomic_t *v, int i);    /* 设置原子变量的值为i */

/获取原子变量的值/atomic_read(atomic_t v); / 返回原子变量的值*/

/原子变量的加减/void atomic_add(int i, atomic_t v); / 原子变量增加i /void atomic_sub(int i, atomic_t v); / 原子变量减少i /

/原子变量的自增,自减/void atomic_inc(atomic_t v); / 原子变量增加1 /void atomic_dec(atomic_t v); / 原子变量减少1 /

/原子变量的操作并测试/int atomic_inc_and_test(atomic_t v); /进行对应操作后,测试原子变量值是否为0/int atomic_dec_and_test(atomic_t v);int atomic_sub_and_test(int i, atomic_t *v);

/原子变量的操作并返回/int atomic_add_return(int i, atomic_t v); /进行对应操作后,返回新的值/int atomic_sub_return(int i, atomic_t v);int atomic_inc_return(atomic_t v);int atomic_dec_return(atomic_t v);

2.2 API实现

2.2.1 原子变量结构体

typedef struct {
int counter;} atomic_t;

结构体名称:atomic_t

文件位置:include/linux/types.h

主要作用:原子变量结构体,包含一个整型成员变量counter,用于存储原子变量的值。

2.2.2 设置原子变量操作

2.2.2.1 ATOMIC_INIT

#define ATOMIC_INIT(i) { (i) }

函数介绍:定义了一个ATOMIC类型的变量,并初始化为给定的值。

文件位置:arch/arm/include/asm/atomic.h,由include/linux/atomic.h引用

实现方法:通过大括号将值包裹起来作为一个结构体,结构体的第一个成员就是给定的该值。

2.2.2.2 atomic_set

#define atomic_set(v,i) WRITE_ONCE(((v)->counter), (i))

define WRITE_ONCE(x, val)

({ union { typeof(x) val; char c[1]; } u = { .val = (force typeof(x)) (val) }; write_once_size(&(x), u.c, sizeof(x)); u.val; })static always_inline void write_once_size(volatile void p, void res, int size){switch (size) {case 1: *(volatile u8 )p = (u8 )res; break;case 2: (volatile u16 )p = (u16 )res; break;case 4: (volatile u32 )p = (u32 )res; break;case 8: (volatile u64 )p = (u64 *)res; break;default:barrier();builtin_memcpy((void )p, (const void )res, size);barrier();}}

函数介绍:该函数用于初始化原子变量。

文件位置:由include/linux/atomic.h引用arch/arm/include/asm/atomic.h,再引用include/linux/compiler.h

Trae国内版 Trae国内版

国内首款AI原生IDE,专为中国开发者打造

Trae国内版 815 查看详情 Trae国内版

实现方式:通过调用WRITE_ONCE来实现,其中WRITE_ONCE宏实现了一些屏蔽编译器优化的技巧,确保写入操作是原子的。

atomic_set调用WRITE_ONCEi的值写入原子变量(v)->counter中,WRITE_ONCE确保操作的原子性。WRITE_ONCE通过创建union联合体来确保操作的原子性,联合体的特点是所有成员共享同一个内存空间。write_once_size函数使用volatile关键字保证操作的原子性,并根据不同数据类型的大小进行相应的存储操作。

2.2.3 原子变量的加减

2.2.3.1 ATOMIC_OPS

/* 

  • ARMv6 UP and SMP safe atomic ops. We use load exclusive and
  • store exclusive to ensure that these are atomic. We may loop
  • to ensure that the update happens. */

    define ATOMIC_OP(op, c_op, asm_op)

    static inline void atomic_##op(int i, atomict *v) { unsigned long tmp; int result; \prefetchw(&v->counter); asm volatile("@ atomic" #op "n" "1: ldrex %0, [%3]n" " " #asm_op " %0, %0, %4n" " strex %1, %0, [%3]n" " teq %1, #0n" " bne 1b" : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter) : "r" (&v->counter), "Ir" (i) : "cc"); }

    define ATOMIC_OP_RETURN(op, c_op, asm_op)

    static inline int atomic_##op##_return_relaxed(int i, atomict *v) { unsigned long tmp; int result; \prefetchw(&v->counter); \asm volatile("@ atomic" #op "_returnn" "1: ldrex %0, [%3]n" " " #asm_op " %0, %0, %4n" " strex %1, %0, [%3]n" " teq %1, #0n" " bne 1b" : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter) : "r" (&v->counter), "Ir" (i) : "cc"); \return result; }

    define ATOMIC_FETCH_OP(op, c_op, asm_op)

    static inline int atomicfetch##op##_relaxed(int i, atomic_t *v) { unsigned long tmp; int result, val; \prefetchw(&v->counter); \asm volatile("@ atomicfetch" #op "n" "1: ldrex %0, [%4]n" " " #asm_op " %1, %0, %5n" " strex %2, %1, [%4]n" " teq %2, #0n" " bne 1b" : "=&r" (result), "=&r" (val), "=&r" (tmp), "+Qo" (v->counter) : "r" (&v->counter), "Ir" (i) : "cc"); \return result; }

    define ATOMIC_OPS(op, c_op, asm_op)

    ATOMIC_OP(op, c_op, asm_op) ATOMIC_OP_RETURN(op, c_op, asm_op) ATOMIC_FETCH_OP(op, c_op, asm_op)

函数作用:通过一系列宏定义,实现原子变量的addsubandor等原子操作。

文件位置:arch/arm/include/asm/atomic.h

实现方式:ATOMIC_OP宏通过汇编指令实现原子操作。prefetchw预取数据到L1缓存,提高性能。ldrexstrex用于独占式读取和写入操作,确保操作的原子性。如果写入失败,则会循环重试。

2.2.3.2 atomic_add和atomic_sub定义

ATOMIC_OPS(add, +=, add)ATOMIC_OPS(sub, -=, sub)

3、位原子操作

3.1 API接口

void set_bit(nr, void addr);  // 设置位:将addr地址的第nr位设置为1void clear_bit(nr, void addr);  // 清除位:将addr地址的第nr位设置为0void change_bit(nr, void addr); // 改变位:对addr地址的第nr位进行反置。test_bit(nr, void addr);   // 测试位:返回addr地址的第nr位。int test_and_set_bit(nr, void addr); // 测试并设置位int test_and_clear_bit(nr, void addr); // 测试并清除位int test_and_change_bit(nr, void *addr); // 测试并改变位

3.2 API实现

3.2.1 set_bit

#define set_bit(nr,p)   ATOMIC_BITOP(set_bit,nr,p)

define ATOMIC_BITOP(name,nr,p)

(builtin_constant_p(nr) ? __atomic##name(nr, p) : ##name(nr,p))extern void _set_bit(int nr, volatile unsigned long p);/

  • These functions are the basis of our bit ops.
  • First, the atomic bitops. These use native endian. /static inline void ____atomic_set_bit(unsigned int bit, volatile unsigned long p){unsigned long flags;unsigned long mask = BIT_MASK(bit);p += BIT_WORD(bit);raw_local_irq_save(flags);*p |= mask;raw_local_irq_restore(flags);}

    define BIT_MASK(nr) (1UL

  • 函数介绍:该函数用于原子操作某个地址的某一位。

    文件位置:/arch/arm/include/asm/bitops.h

    实现方式:builtin_constant_p用于判断表达式是否为常量。如果是常量,则调用__atomic_set_bit函数。____atomic_set_bit通过中断屏蔽来保证位操作的原子性。BIT_MASK获取操作位的掩码,BIT_WORD确定要操作位的偏移。

    4、总结

    本文详细探讨了Linux内核锁的原子操作,原子操作分为两种:整型变量的原子操作和位原子操作。

    整型变量的原子操作:通过ldrexstrex来实现。

    位原子操作:通过中断屏蔽来实现。

    以上就是​【深入理解Linux内核锁】| 原子操作的详细内容,更多请关注创想鸟其它相关文章!

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
    如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
    发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/452243.html

    (0)
    打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
    上一篇 2025年11月7日 23:53:44
    下一篇 2025年11月7日 23:54:22

    相关推荐

    • 怎样处理C++中的UTF-16编码文件 wifstream和codecvt应用

      直接读取utf-16文件会乱码,因为c++++默认字符编码不兼容utf-16且未正确处理字节序。1. 使用wifstream结合codecvt处理宽字符;2. 检测bom以确定字节序(utf-16le为0xfffe,utf-16be为0xfeff);3. 设置对应locale并跳过bom;4. 无b…

      2025年12月18日 好文分享
      000
    • 位域结构体有什么实用价值 位操作与硬件寄存器访问实例

      位域结构体相比普通结构体的优势在于能更精细地控制内存使用,允许按位分配内存而非字节,从而节省空间。例如,多个1bit标志在普通结构体中各自占用一字节,而位域结构体可将它们打包至同一字节。其典型应用场景包括设备驱动开发、通信协议解析和内存管理。例如,在can总线通信中,使用位域结构体定义帧id和控制字…

      2025年12月18日 好文分享
      000
    • C++自定义内存分配器怎么实现 替代标准内存管理的设计方法

      自定义内存分配器在c++++中用于优化性能、减少碎片和调试内存问题,适用于频繁分配小块内存、嵌入式系统及stl容器。1. 需要自定义分配器的原因包括:默认new/delete不适合特定场景、减少系统调用开销、避免内存碎片、提升数据结构性能;2. 设计基本分配器需提供allocate、dealloca…

      2025年12月18日 好文分享
      000
    • 怎样实现类似智能指针的类 手写简化版智能指针教学示例

      实现一个类似智能指针的类核心在于利用raii原则绑定资源与对象生命周期,通过封装原始指针确保资源自动释放,解决内存泄漏和悬空指针等问题。1. 使用模板类包装原始指针并重载解引用与成员访问运算符;2. 在析构函数中释放资源以实现自动管理;3. 禁用拷贝构造与赋值操作确保独占所有权;4. 实现移动构造与…

      2025年12月18日 好文分享
      000
    • C++宽松内存序有什么风险 探讨memory_order_relaxed使用边界

      c++++的memory_order_relaxed允许最大程度的优化,但不保证顺序性。它仅保证原子性,可能导致数据竞争和不可预测行为。适用场景包括:1. 简单计数器,如统计事件发生次数,只要最终结果正确即可;2. 收集统计信息,对精确性要求不高;3. 与锁结合使用时,因锁已提供同步保证。风险包括:…

      2025年12月18日 好文分享
      000
    • 什么是C++的内存碎片 减少内存碎片化的策略

      内存碎片是因内存分配释放导致可用内存分散为小块而无法满足大块连续请求的现象。1. 使用内存池或对象池可减少频繁分配释放,但需预知大小数量;2. 定制化分配器如伙伴系统优化分配策略,但实现复杂;3. 尽量使用vector等连续结构提高访问效率;4. 避免频繁小块分配,一次性分配后自行管理;5. 使用智…

      2025年12月18日 好文分享
      000
    • 数组和vector性能有什么区别 内存布局与访问效率对比

      数组和 vector 的性能区别主要体现在内存布局、访问效率及插入删除操作上。1. 数组是固定大小,编译时确定,vector 动态扩容,按指数级增长,摊销插入成本;2. 两者随机访问均为 o(1),但数组无边界检查,vector 可启用 at() 检查,更安全;3. 插入/删除时,vector 在中…

      2025年12月18日 好文分享
      000
    • C++医疗影像分析环境怎么搭建 ITK与VTK联合编程配置

      c++++医疗影像分析环境搭建核心在于正确配置itk和vtk。1. 首先下载并安装vtk,选择生成示例程序以验证安装;2. 接着安装itk,并在cmake中指定vtk的安装路径以建立依赖关系;3. 在ide(如visual studio)中配置头文件目录、库文件目录及依赖项,完成代码编译链接;4. …

      2025年12月18日
      000
    • C++范围for循环怎么用 现代C++遍历容器新语法

      范围for循环是c++++11引入的语法特性,用于简化容器或数组遍历。其基本结构为for (declaration : range),其中declaration为每次迭代取出的元素变量,range为可迭代集合;例如遍历vector时无需手动控制索引,代码更简洁;使用auto可自动推导类型,避免手动输…

      2025年12月18日 好文分享
      000
    • 为什么C++移动操作要标记为noexcept STL容器对异常安全的要求

      在c++++中,移动操作应标记为noexcept以确保stl容器在扩容时优先使用移动而非复制。1. 若未标记noexcept,标准库会认为移动可能抛异常,从而改用更安全但低效的复制操作。2. 异常安全策略要求容器在异常发生时保持状态一致,只有noexcept移动操作能满足此要求。3. 忽略noexc…

      2025年12月18日
      000
    • 怎样用C++优化数学计算性能 查表法与近似计算实践

      查表法和近似计算是c++++中优化数学性能的两种常用手段。1. 查表法通过预存结果减少实时计算,适用于频繁调用、输入范围有限且精度要求不高的场景,如sin、cos函数实现;2. 近似计算通过简化公式提高效率,适合灵活处理需求,如快速平方根倒数、log2近似等;3. 实践中需权衡速度与精度,测试实际效…

      2025年12月18日 好文分享
      000
    • 如何设计C++的高效内存分配器 slab分配器实现原理

      slab分配器是一种高效的内存管理机制,特别适合频繁申请和释放相同大小对象的场景。其核心思想是将内存按固定大小预先划分成多个“slab”块,每个slab负责某一类对象的分配,从而减少内存碎片并提升分配与释放效率。设计一个基本的slab分配器需要:1. 定义slab结构体用于记录状态;2. 实现内存对…

      2025年12月18日 好文分享
      000
    • C++如何实现多态 C++多态的实现原理与应用场景

      c++++中多态的实现依赖于虚函数和继承。具体步骤包括:1. 在基类中使用virtual关键字声明虚函数;2. 派生类继承基类并重写虚函数,保持函数签名一致;3. 通过基类指针或引用调用虚函数,实现运行时多态;4. 编译器通过虚函数表(vtable)和虚指针(vptr)机制确定实际调用的函数;5. …

      2025年12月18日 好文分享
      000
    • C++异常与标准库算法怎么配合 STL算法中的异常传播规则

      c++++异常与标准库算法配合的关键在于理解stl算法如何处理和传播异常,并在自定义代码中正确抛出和捕获异常。1. stl算法通常不主动抛出异常,而是依赖用户提供的函数对象抛出异常,算法会尝试保持容器状态一致;2. 确保异常安全需从函数对象本身的安全性、选择提供强异常保证的算法、使用事务语义等方面入…

      2025年12月18日 好文分享
      000
    • C++标准库异常类有哪些 详解std exception及其派生类

      c++++标准库异常类体系定义在中,继承自std::exception,用于报告运行错误。1. std::exception是基类,提供虚函数what()描述异常信息,不可直接抛出。2. 异常分为逻辑错误(如invalid_argument、domain_error、length_error、out…

      2025年12月18日 好文分享
      000
    • 如何实现STL兼容的迭代器 为自定义类添加迭代支持

      在c++++中为自定义容器类实现stl兼容迭代器需遵循以下步骤:1.定义类型别名如value_type、iterator_category等;2.重载操作符如*、->、++、==、!=;3.在容器类中实现begin()和end()方法;4.注意迭代器失效、const正确性、类别选择等问题。具体…

      2025年12月18日 好文分享
      000
    • 数组作为类成员怎么初始化 初始化列表与静态常量数组

      普通数组成员初始化需用构造函数初始化列表,如 myc++lass() : arr{1, 2, 3, 4, 5} {};静态常量数组应在类外定义并初始化,如 const int myclass::values[3] = {10, 20, 30};;c++11起可用列表初始化,旧标准可手动赋值或使用 s…

      2025年12月18日
      000
    • C++智能指针如何管理内存 shared_ptr与unique_ptr实践

      c++++中智能指针的核心是shared_ptr和unique_ptr。1.shared_ptr适用于共享所有权场景,采用引用计数机制,适合多处共享资源的情况,但需注意避免循环引用,可通过weak_ptr解决;2.unique_ptr适用于独占所有权场景,不可复制只能移动,适合生命周期明确、无需共享…

      2025年12月18日 好文分享
      000
    • STL中的allocator有什么作用 自定义内存分配策略实现方法

      stl中的allocator主要负责对象内存的分配与释放,其核心作用是将对象构造与内存管理分离。默认使用std::allocator,通过new和delete实现基础内存操作,但自定义allocator可提供更高效的策略,例如:1. 内存池:减少系统调用提高性能;2. 固定大小分配:减少内存碎片;3…

      2025年12月18日 好文分享
      000
    • C++中内存对齐有什么作用 探讨对齐对性能和数据访问的影响

      内存对齐在c++++中至关重要,因为它直接影响程序的性能和稳定性。其核心目的是提升cpu访问效率并避免硬件异常。现代cpu以“块”为单位读取内存,未对齐的数据可能需要多次访问,降低速度,甚至导致arm等平台崩溃。编译器自动对齐结构体成员,尽管可能引入填充字节,但提升了访问速度。例如,struct e…

      2025年12月18日 好文分享
      000

    发表回复

    登录后才能评论
    关注微信