Linux内核13-进程切换

程序猿 • 2025年11月2日 17:12:04 • 运维 • 阅读 2

进程切换，也称为任务切换、上下文切换或任务调度，本文将探讨linux内核中进程切换的实现。我们首先理解几个关键概念。

1.1 硬件上下文

每个进程都有自己的地址空间，但所有进程共享CPU寄存器。因此，在恢复进程执行前，内核必须确保挂起时的寄存器值被重新加载到CPU寄存器中。

这些需要加载到CPU寄存器中的值称为硬件上下文。硬件上下文是进程执行上下文的一个子集，包含进程执行所需的所有信息。在Linux中，进程的硬件上下文部分存储在进程描述符中，另一部分存储在内核态栈中。

在下文中，我们假设prev指向旧进程，next指向新进程。因此，进程切换就是保存prev进程的硬件上下文，然后加载next进程的硬件上下文。由于进程切换非常频繁，缩短保存和加载硬件上下文的时间至关重要。

旧版本的Linux利用x86架构提供的硬件支持，通过远程跳转指令（GNU-ljump；Intel-jmp far）进行进程切换，跳转到下一个进程的任务状态段（TSS）描述符。执行这条跳转指令时，CPU会自动执行硬件上下文切换，保存旧的硬件上下文，加载新的硬件上下文。然而，Linux 2.6版本以后，通过软件进行进程切换，原因如下：

通过一系列的mov指令逐步执行切换，可以更好地控制加载数据的合法性。特别是ds和es段寄存器的值，可能会被恶意用户篡改。使用远程跳转指令无法进行数据检查。新旧方法所需的时间大致相同。但是，优化硬件上下文切换是不可能的，因为这是由CPU完成的，而Linux使用软件替代硬件上下文切换，因此有优化的空间，以提高执行时间。进程切换只能在内核态发生。在进程切换之前，用户态进程使用的所有寄存器内容都已经包含在内核态栈中，其中包括指定用户态进程栈指针地址的ss和esp寄存器内容。

1.2 任务状态段-TSS

x86架构包含一个特殊的段寄存器，称为任务状态段（TSS），用来保存硬件上下文内容。尽管Linux不使用硬件上下文切换，但还是为每个不同CPU建立一个TSS。这么做的原因有两个：

当x86架构的CPU从用户态切换到内核态时，会从TSS中获取内核态的栈地址。用户态进程想要访问I/O端口时，CPU需要访问存储在TSS中的I/O权限位，判断进程是否被允许访问该I/O端口。

当用户态进程执行in或out指令时，I/O控制单元会检查eflags寄存器中的IOPL位（2位）。如果等于3，也就是超级用户权限，进程对于该I/O端口来说就是一个超级用户，直接执行I/O指令。否则，继续执行检查。访问tr寄存器，确定当前的TSS，以及正确的I/O访问权限。它检查I/O端口对应的访问权限位。如果清零，指令被执行；否则，控制单元发出常规保护的异常。内核中使用tss_struct结构体描述TSS。init_tss数组为系统中的每一个CPU包含一个tss_struct结构。每一次进程切换，内核更新TSS相关内容，使CPU控制单元能够安全地检索自己想要的信息。因此，TSS反映了当前运行在CPU上的进程的特权级别，但当进程不运行时，无需维护这些信息。

每个TSS具有8个字节长度的任务状态段描述符（TSSD）。这个描述符包含一个32位的基地址，指向TSS的起始地址，以及20位的Limit域，表示页的大小。TSSD的S标志被清零，说明这是一个系统段（参见第2章的段描述符）。

Type域设置为9或11都可以，表明该段是一个TSS段即可。Intel最初的设计中，系统中的每个进程都应该引用自己的TSS：Type域的低第2个有效位称为Busy位，如果被设为1，进程正在CPU上执行；设为0，没有执行。在Linux的设计中，每个CPU只有一个TSS，所以，Busy位总是设为1。换句话说，Linux中Type域一般为11。

创建的这些TSSD存储在全局描述符表（GDT）中，该表的基地址存储在CPU的gdtr寄存器中。每个CPU的tr寄存器包含对应TSS的TSSD选择器，还包含两个隐藏的、不可编程的域：TSSD的Base和Limit域。使用这种方法，CPU可以直接寻址TSS，而不必非得访问GDT中TSS的地址。

1.3 线程域

每当进程切换时，将要被替换掉的进程硬件上下文内容都应该被保存到某个地址。显然不能保存在TSS中，因为Linux为每个CPU建立了一个TSS，而不是为每个进程建立TSS。

因此，进程描述符中添加了一个类型为thread_struct的结构，通过它，内核保存旧进程的硬件上下文。后面我们会看到，该数据结构包含了大部分的CPU寄存器，除了通用目的寄存器，比如eax、ebx等，它们被存储在内核态栈中。

2 执行进程切换

进程切换的时机：在中断处理程序中直接调用schedule()函数，实现进程调度。内核线程是一个特殊的进程，只有内核态没有用户态。因此既可以主动调用schedule()函数进行调度，也可以被中断处理程序调用。内核态进程无法直接主动调度，因为schedule()是一个内核函数，不是系统调用。因此只能在中断处理程序中进行调度。关键代码梳理如下：

首先，schedule()函数会调用next = pick_next_task(rq, prev);，根据调度算法策略，选取要执行的下一个进程。其次，根据调度策略得到要执行的进程后，调用context_switch(rq, prev, next);，完成进程上下文切换。其中，最关键的switch_to(prev,next, prev);切换堆栈和寄存器的状态。我们假设prev指向被切换掉的进程描述符，next指向将要执行的进程描述符。我们将会在第7章发现，prev和next正是schedule()函数的局部变量。

2.1 `switch_to`宏

进程硬件上下文的切换是由宏switch_to完成的。该宏的实现与硬件架构息息相关，要想理解它需要下一番功夫。下面是基于X86架构下的该宏实现的汇编代码：

#define switch_to(prev, next, last)                             do {                                                                /* 进程切换可能会改变所有的寄存器，所以我们通过未使用的输出变量显式地修改它们。 */     /* EAX和EBP没有被列出，是因为EBP是为当前进程访问显式地保存和恢复的寄存器， */     /* 而EAX将会作为函数__switch_to()的返回值。 */                  unsigned long ebx, ecx, edx, esi, edi;                                                                                          asm volatile("pushflnt"               /* save    flags */              "pushl %%ebpnt"              /* save    EBP   */              "movl %%esp,%[prev_sp]nt"    /* save    ESP   */              "movl %[next_sp],%%espnt"    /* restore ESP   */              "movl $1f,%[prev_ip]nt"      /* save    EIP   */              "pushl %[next_ip]nt"         /* restore EIP   */              __switch_canary                                                 __retpoline_fill_return_buffer                                  "jmp __switch_ton"            /* regparm call  */              "1:t"                                                          "popl %%ebpnt"               /* restore EBP   */              "popfln"                      /* restore flags */                                                                              /* 输出参数 */                                                  : [prev_sp] "=m" (prev->thread.sp),                               [prev_ip] "=m" (prev->thread.ip),                               "=a" (last),                                                                                                                    /* 列出所有可能会修改的寄存器  */                               "=b" (ebx), "=c" (ecx), "=d" (edx),                             "=S" (esi), "=D" (edi)                                                                                                          __switch_canary_oparam                                                                                                          /* 输入参数 */                                                : [next_sp]  "m" (next->thread.sp),                               [next_ip]  "m" (next->thread.ip),                                                                                               /* 为函数__switch_to()设置寄存器参数 */                         [prev]     "a" (prev),                                          [next]     "d" (next)                                                                                                           __switch_canary_iparam                                                                                                        : /* reloaded segment registers */                             "memory");                                          } while (0)

首先，该宏具有3个参数，prev、next和last。prev和next这两个参数很容易理解，分别指向新旧进程的描述符地址；last是一个输出参数，用来记录是从哪个进程切换来的。为什么需要last参数呢？当进程切换涉及到3个进程的时候，3个进程分别假设为A、B、C。假设内核决定关掉A进程，激活B进程。在schedule函数中，prev指向A的描述符，而next指向B的描述符。只要switch_to宏使A失效，A的执行流就会冻结。后面，当内核想要重新激活A，必须关掉C进程，就要再执行一次switch_to宏，此时prev指向C，next指向A。当A进程想要继续执行之前的执行流时，会查找原先的内核态栈，发现prev等于A进程描述符，next等于B进程描述符。此时，调度器失去了对C进程的引用。保留这个引用非常有用，我们后面再讨论。图3-7分别展示了进程A、B和C内核态栈的内容，及寄存器eax的值。还展示了last的值，随后被eax中的值覆盖。

switch_to宏的处理过程如下：

将新旧进程描述符存放到CPU寄存器中。保存旧进程的内核态栈，比如eflags和ebp寄存器的内容。保存旧进程栈指针esp到prev->thread.esp中。操作数484(%eax)表明目的地址是寄存器eax中的地址加上484。将新进程的栈指针加载到esp寄存器中。

movl 484(%edx), %esp

保存标签1的地址->prev->thread.eip。

movl $1f, 480(%eax)

加载新进程的指令流。意义和第5步差不多，就是执行顺序相反。跳转到__switch_to()函数执行，是一个C函数。

至此，进程A被进程B取代：开始执行B进程的指令。第一步应该是先弹出eflags和ebp寄存器的值。

拷贝eax寄存器的内容（第一步加载的）到last变量中。也就是说，last记录了被取代的进程。

2.2 `__switch_to()`函数

实际上，大部分的进程切换工作是由__switch_to()函数完成的，它的参数是prev_p和next_p，分别指向旧进程和新进程。这个函数和普通的函数有些差别，因为__switch_to()函数从eax和edx寄存器中获取prev_p和next_p这两个参数（在分析switch_to宏的时候已经讲过），而不是像普通函数那样，从栈中获取参数。为了强制函数从寄存器中获取参数，内核使用__attribute__和regparm进行声明。这是gcc编译器对C语言的一个非标准扩展。__switch_to()函数定义在include/asm-i386/system.h文件中：

__switch_to(struct task_struct *prev_p, struct task_struct *next_p) __attribute__((regparm(3)));

这个函数执行的内容：

执行__unlazy_fpu()宏，保存旧进程的FPU、MMX和XMM寄存器。执行smp_processor_id()宏，获取正在执行代码的CPU的ID。从thread_info结构的cpu成员中获取。加载新进程的next_p->thread.esp0到当前CPU的TSS段中的esp0成员中。通过调用sysenter汇编指令从用户态切换到内核态引起的任何特权级别的改变都会导致将这个地址拷贝到esp寄存器中。将新进程的线程本地存储（TLS）段加载到当前CPU的GDT中。3个段选择器存储在进程描述符的tls_array数组中。存储fs和gs段寄存器的内容到旧进程的prev_p->thread.fs和prev_p->thread.gs中。汇编指令如下：

寄存器esi指向prev_p->thread结构。gs寄存器用来存放TLS段的地址。fs寄存器实际上Windows使用。

加载新进程的fs或gs寄存器内容。数据来源是新进程的thread_struct描述符中对应的值。汇编语言如下：

ebx寄存器指向next_p->thread结构。

载入新进程的调试寄存器中的信息。更新TSS中的I/O权限位（如果有必要的话）。也就是如果新旧进程对I/O访问有自己特殊的要求的话就需要更改。__switch_to()函数结束。

相应的汇编语言就是：

因为switch_to总是假设eax寄存器保存旧进程的进程描述符的地址。所以，这里把prev_p变量再次写入到eax寄存器中。

以上就是Linux内核13-进程切换的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/26238.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

在 Linux 中如何强制停止进程？kill 和 killall 命令有什么区别？

上一篇 2025年11月2日 17:05:57

CentOS7搭建个人站点

下一篇 2025年11月2日 17:38:30

好文分享

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
9000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
4000
好文分享

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
0000
好文分享

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
2000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
2000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
0000
好文分享

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
0000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
1000
好文分享

如何用HTML/JS实现Windows 10设置界面鼠标移动探照灯效果？

Win10设置界面中的鼠标移动探照灯效果实现指南想要在前端开发中实现类似于Windows 10设置界面的鼠标移动探照灯效果，有两种解决方案：CSS 和 HTML/JS 组合。 CSS 实现不幸的是，仅使用CSS无法完全实现该效果。立即学习“前端免费学习笔记（深入）”； HTML/JS 实现要…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
好文分享

如何用前端技术实现Windows 10 设置界面鼠标移动时的探照灯效果？

探索在前端中实现 Windows 10 设置界面鼠标移动时的探照灯效果在前端开发中，鼠标悬停在元素上时需要呈现类似于 Windows 10 设置界面所展示的探照灯效果，这其中涉及到了元素外围显示光圈效果的技术实现。 CSS 实现虽然 CSS 无法直接实现探照灯效果，但可以通过以下技巧营造出类似效…

程序猿
2025年12月24日
0000
好文分享

为什么在父元素为inline或inline-block时，子元素设置width: 100%会出现不同的显示效果？

width:100%在父元素为inline或inline-block下的显示问题问题提出当父元素为inline或inline-block时，内部元素设置width:100%会出现不同的显示效果。以代码为例：测试内容这是inline-block span 效果1：父元素为inline-bloc…

程序猿
2025年12月24日
4000
好文分享

苹果浏览器网页背景图色差问题：如何解决背景图不一致？

网页背景图在苹果浏览器上出现色差一位用户在使用苹果浏览器访问网页时遇到一个问题，网页上方的背景图比底部的背景图明显更亮。这个问题的原因很可能是背景图没有正确配置 background-size 属性。在 windows 浏览器中，背景图可能可以自动填满整个容器，但在苹果浏览器中可能需要显式设置 …

程序猿
2025年12月24日
4000
好文分享

苹果浏览器网页背景图像为何色差？

网页背景图像在苹果浏览器的色差问题在不同浏览器中，网站的背景图像有时会出现色差。例如，在 Windows 浏览器中显示正常的上层背景图，在苹果浏览器中却比下层背景图更亮。问题原因出现此问题的原因可能是背景图像未正确设置 background-size 属性。解决方案为确保背景图像在不同浏览…

程序猿
2025年12月24日
5000
好文分享

苹果电脑浏览器背景图亮度差异：为什么网页上下部背景图色差明显？

背景图在苹果电脑浏览器上亮度差异问题描述：在网页设计中，希望上部元素的背景图与页面底部的背景图完全对齐。而在 Windows 中使用浏览器时，该效果可以正常实现。然而，在苹果电脑的浏览器中却出现了明显的色差。原因分析：如果您已经排除屏幕分辨率差异的可能性，那么很可能是背景图的 backgro…

程序猿
2025年12月24日
0000
好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
1000
好文分享

如何在 VS Code 中解决折叠代码复制问题？

解决 VS Code 折叠代码复制问题在 VS Code 中使用折叠功能可以帮助组织长代码，但使用复制功能时，可能会遇到只复制可见部分的问题。以下是如何解决此问题：当代码被折叠时，可以使用以下简单操作复制整个折叠代码：按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

程序猿
2025年12月24日
0000