百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

深入理解Linux内核中的内嵌汇编(纯代码)

ahcoder 2025-01-06 10:49 12 浏览

如果你是一个嵌入式开发人员,或者是Linux内核研发人员。可能经常会在内核中遇见如下代码:

/*
 * CPU interrupt mask handling.
 */
static inline unsigned long arch_local_irq_save(void)
{
    unsigned long flags;
    asm volatile(
        "mrs    %0, daif        // arch_local_irq_save\n"
        "msr    daifset, #2"
        : "=r" (flags)
        :
        : "memory");
    return flags;
}

以上代码是ARM架构屏蔽中断的实现。

嵌入式进阶教程分门别类整理好了,看的时候十分方便,由于内容较多,这里就截取一部分图吧。

需要的朋友私信【内核】即可领取

内核学习地址:Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈-学习视频教程-腾讯课堂

再比如还会遇到这样的代码:

#define ATOMIC_OP(op, asm_op)                       
static inline void atomic_##op(int i, atomic_t *v)          
{                                   
    unsigned long tmp;                      
    int result;                         
                                    
    asm volatile("// atomic_" #op "\n"              
"1: ldxr    %w0, %2\n"                      
"   " #asm_op " %w0, %w0, %w3\n"                
"   stxr    %w1, %w0, %2\n"                     
"   cbnz    %w1, 1b"                        
    : "=&r" (result), "=&r" (tmp), "+Q" (v->counter)        
    : "Ir" (i));                            
}

上述的代码是ARM架构原子操作OP的代码实现。

有的人对这种C原因中嵌入汇编不是很熟悉,也不是很了解。今天就带大家了解了解。

为什么会出现这种写法

Linux内核绝大部分代码是用C语言写的,而只有一小部分代码是使用内嵌汇编写的。这部分代码大多是和特定体系结构相关的代码和对性能影响很大的代码。GCC提供了内嵌汇编的功能,可以在C代码中直接内嵌汇编语言语句,大大方便了程序设计。

内嵌汇编语法

内嵌汇编语法如下: 
 __asm__( 汇编语句模板:          
          输出部分:          
          输入部分:
         破坏描述部分) 

共四个部分:汇编语句模板,输出部分,输入部分,破坏描述部分,各部分使用“:”格开,汇编语句模板必不可少,其他三部分可选,如果使用了后面的部分,而前面部分为空,也需要用“:”格开,相应部分内容为空。比如:

asm("msr    daifclr, #1" : : : "memory")

一般大家见到的样子是这样的:

asm volatile(
    "msr    daif, %0        // 汇编语句模板
    :                       // 输出部分
    : "r" (flags)           // 输入部分
    : "memory");            // 破坏描述部分

asm”表示后面的代码为内嵌汇编,“asm”是“asm”的别名。 “volatile”表示编译器不要优化代码,后面的指令保留原样, “volatile”是它的别名。

汇编语句模板

汇编语句模板由汇编语句序列组成,语句之间使用“;”、“\n”或“\n\t”分开。 指令中的操作数可以使用占位符引用C语言变量,操作数占位符最多10个,名称如下:%0,%1…,%9。

举例说明:

#define ATOMIC_OP(op, asm_op)                       
static inline void atomic_##op(int i, atomic_t *v)          
{                                   
    asm volatile("// atomic_" #op "\n"              
"1: ldxr    %w0, %2\n"                      
"   " #asm_op " %w0, %w0, %w3\n"                
"   stxr    %w1, %w0, %2\n"                     
"   cbnz    %w1, 1b"                        
    : "=&r" (result), "=&r" (tmp), "+Q" (v->counter)        
    : "Ir" (i));                            
}   

可以看到汇编语句模板有4行,每条汇编都是使用“\n“来分开。指令中的操作数%w0就代表从输出部分第一个数起。比如%w0代表“ =&r (result)“, %w1代表“=&r (tmp)“依次类推。最多到%9

输出部分

输出部分描述输出操作数,不同的操作数描述符之间用逗号格开,每个操作数描述符由限定字符串和C语言变量组成。每个输出操作数的限定字符串必须包含“=”表示他是一个输出操作数。

输入部分

输入部分描述输入操作数,不同的操作数描述符之间使用逗号格开,每个操作数描述符由限定字符串和C语言表达式或者C语言变量组成

破坏描述部分

为何要有破坏描述部分?我们的c代码是gcc来处理的,当遇到嵌入汇编代码的时候,gcc会将这些嵌入式汇编的文本送给gas进行后续处理。这样,gcc需要了解嵌入汇编代码对寄存器的修改情况,否则有可能会造成大麻烦。例如:gcc对c代码进行处理,将某些变量值保存在寄存器中,如果嵌入汇编修改了该寄存器的值,又没有通知gcc的话,那么,gcc会以为寄存器中仍然保存了之前的变量值,因此不会重新加载该变量到寄存器,而是直接使用这个被嵌入式汇编修改的寄存器。这时候,我们唯一能做的就是静静的等待程序的崩溃。

其中常见的就是内存修改通知: 如果一个内联汇编语句的指令列表中的指令对内存进行了修改,或者在此内联汇编出现的地方,内存内容可能发生改变,而被改变的内存地址你没有在其Output操作表达式中使用”m”约束,这种情况下,你需要使用在破坏描述部分使用字符串”memory”向GCC声明:”在这里,内存发生了,或可能发生了改变”;

举例:

asm("msr    daifclr, #8" : : : "memory")

限定字符

以下是常见的限定字符

r: 表示使用一个通用寄存器,由GCC在%eax/%ax/%al、%ebx/%bx/%bl、%ecx/%cx/%cl、%edx/%dx/%dl中选取一个GCC认为是合适的;
q: 表示使用一个通用寄存器,与r的意义相同;
m: 表示使用内存地址,使用系统支持的任何一种内存方式,不需要借助于寄存器
i: 表示使用一个整数类型的立即数;
F: 表示使用一个浮点类型的立即数;
+: 表示当前输出表达式的属性为可读可写;
=: 当前输出表达式的属性为只写;
&: GCC声明:"GCC不得为任何Input操作表达式分配与此Output操作表达式相同的寄存器;
...

举例说明

就使用ATOMIC_OPS(add, add)代码举例说明。

ATOMIC_OPS(add, add)
-----------------------
#define ATOMIC_OP(op, asm_op)                       
static inline void atomic_##op(int i, atomic_t *v)          
{                                   
    unsigned long tmp;                      
    int result;                        
                                    
    asm volatile("// atomic_" #op "\n"              
"1: ldxr    %w0, %2\n"                      
"   " #asm_op " %w0, %w0, %w3\n"                
"   stxr    %w1, %w0, %2\n"                     
"   cbnz    %w1, 1b"                        
    : "=&r" (result), "=&r" (tmp), "+Q" (v->counter)        
    : "Ir" (i));                            
}
---------------------------------------
将宏展开后
-----------------------------------------
static inline void atomic_add(int i, atomic_t *v)           
{                                   
    unsigned long tmp;                      
    int result;                         
                                    
    asm volatile("// atomic_add    \n"              
"1: ldxr    %w0, %2\n"                      
"   add     %w0, %w0, %w3\n"                
"   stxr    %w1, %w0, %2\n"                     
"   cbnz    %w1, 1b"                        
    : "=&r" (result), "=&r" (tmp), "+Q" (v->counter)        
    : "Ir" (i));                            
}

接下来一句一句解释:

"1: ldxr    %w0, %2\n"

ldxr: Load exclusive register (专用的装载寄存器) 简单来说,这句话就将v->counter放入到一个通用的寄存器中。

add     %w0, %w0, %w3\n"    

将通用寄存器中的值+1, 然后在将返回值存放到通用寄存器中。

stxr    %w1, %w0, %2\n" 

stxr : Store exclusive register, returning status 将通用寄存器的值放回到v->counter中,同时将返回结果放入到tmp中

cbnz    %w1, 1b"

判断返回值是否设置成功,如果设置失败再次跳转到标号1继续执行上述操作。

原文地址:https://cloud.tencent.com/developer/article/1995963(版本归原作者所有,侵权删除)

相关推荐

ARM64内核内存布局图(ARM64内核内存布局图解)

ARM64架构处理器采用48位物理寻址机制,最大可以寻找到256TB的物理地址空间。对于目前的应用来说已经足够了,不需要扩展到64位的物理地址寻址。虚拟地址也同样最大支持48位支持,所以在处理器的架构...

ARM64 linux 调试串口通信(ARM64 linux 调试串口通信实验报告)

ARM64linux调试串口通信随着国产机普及很多工作也转移到了新平台上,以前调试设备用的笔记本电脑也换成新国产ARM64架构的了。本文以绿联CM204USB-A转RJ45Console调试线...

Gentoo Linux 终止对 Itanium IA-64 体系的支持

GentooLinux是最后几个继续维护Itanium(IA-64)架构构建的Linux发行版之一,但现在这些已停产的英特尔处理器正在逐步淘汰。由于Linux6.7内核放弃了对Itan...

如何检查 Linux 系统是 32 位还是 64 位?这9个命令查的又快又准!

在Linux系统中,位数(bit)通常指的是CPU架构的位宽,即CPU一次能够处理的数据量。32位系统和64位系统在内存寻址能力、计算性能和软件支持上存在显著差异:「32位系统」:...

调出好画面!带你玩转飞凌嵌入式AM62x开发板的显示接口

来源:飞凌嵌入式官网“显示”是嵌入式开发板最为重要的功能之一,能够支持更多种类、更高规格的显示接口,意味着它能够应对的使用场景也更加广泛。每一款嵌入式开发板在出厂前都会做屏幕调试,但在客户的实际项目开...

带你玩转AM62x开发板的显示接口——LVDS的显示和修改方式

此前小编已为大家介绍过OK6254-C开发板的RGB显示和修改方式,今天将继续为大家介绍OK6254-C开发板的LVDS显示和修改方式。话不多说,我们进入正题。1、LVDS接口规格飞凌嵌入式OK62...

AM335x继任者?AM6254性能解析(am2361p)

飞凌嵌入式FET6254-C核心板基于TISitaraTMAM62x系列工业级处理器设计开发,采用ARMCortex-A53架构,主频最高可达1.4GHz;并集成了丰富的接口,可广泛应用于的工...

如何在 Linux 发行版中安装微信和 QQ?

很多人因为工作沟通的原因需要用到微信和QQ,那么如何在Linux发行版中安装微信和QQ呢?以下是一些尝试的解决方法。QQ上一个版本的QQLinux版还是在2009年,而在现在,基于N...

MySQL:物理备份工具XBK(mysql 备份方案)

XBK的优缺点:XBK(PerconaXtraBackup)优点:1.免费2.热备:备份期间不阻塞innodb和XtraDB表,但会阻塞Myisam表3.物理备份:备份恢复快XBK缺点:1.不支持远...

AMD锐龙9 9950X CPU AIDA64跑分曝光:比7950X最高快45%

IT之家6月26日消息,Anandtech论坛网友igor_kavinski本周一发布帖子,分享了AMD旗舰锐龙99950X处理器的AIDA64基准测试跑分,与当前基于Z...

qemu linux内核(5.10.209)开发环境搭建

版本信息宿主机:ubuntu20.04.6LTS(FocalFossa)虚拟机:ubuntu20.04.6LTS(FocalFossa)安装宿主机的步骤省略,和一般的在vmware中安...

iPhone 7成刷机神器,成功运行乌班图、Linux、安卓

在智能机刚开始流行的时候,很多手机发烧友都喜欢刷机,当时民间大神们制作了特别多优化的ROM。后来随着手机硬件的逐步提升,以及厂商们对系统的大力优化,让大家对于刷机的兴趣也越来越少。不知道大家还记得这部...

12 款最佳免费开源 Linux 渲染器 | 火狐浏览器 130.0 版本更新

12款最佳免费开源Linux渲染器Linux的一大优势在于其拥有丰富的开源软件,可以满足艺术家、摄影师、动画师和设计师的需求。凭借价格低廉的硬件、免费的软件以及少量的才能和灵感,任何人都可以创...

Linux中xargs 命令详解与实用场景

xargs是Linux系统中常用的命令行工具之一,它能够从标准输入构造参数列表并传递给其他命令使用,是处理批量数据操作时的重要利器。一、xargs的基本语法xargs[OPTION]...[C...

Linux 磁盘扩容(非LVM)方式(linux扩容lvm磁盘容量)

今天接到一个客户的需求,CentOS的/分区容量太小了,OA系统所有的数据都在这下面,由于当时前同事给客户安装系统时采用了标准分区,而不是LVM逻辑卷,所以不支持在线扩容。df-hT查看磁盘使...