深入了解linux系统—— 进程池

前言:

本篇博客所涉及到的代码以同步到本人gitee进程池· 迟来的grown/linux – 码云 – 开源中国

一、池化技术

在之前的学习中,多多少少都听说过池,例如内存池,线程池等等。

那这些池到底是干什么的呢?池又指的是什么呢?

这种思想就好比在vector动态数组扩容一样,是按照2或者1.5倍进行扩容,这样减少开辟空间的开销从而提高效率。

二、进程池原理

我们也了解了进程间通信——管道,可以实现进程之间的通信技术;那现在我们可不可以利用父进程管理所有的子进程,并且让子进程去完成某些任务呢?

深入了解linux系统—— 进程池

那进程池又是什么东西呢?

池化技术是预先创建资源,通过复用来提升系统性能和资源利用率。

这里子进程要执行任务,如果这里父进程要传输信息给子进程时再去创建进程,子进程执行完任务之后就退出;这势必存储非常多的系统调用,而系统调用也是有成本的。那这里我们就可以预先创建多个子进程,让这些子进程等待父进程传输信息;执行完任务后继续等待父进程传输信息。

这样我们预先创建进程,让这些进程执行任务而不是在要执行任务时再创建进程;并且执行完任务的子进程还可以继续完成下一个任务,这样通过复用进程来通过系统性能和进制资源的利用率。

三、进程池实现

了解了进程池原理,现在来看它应该如何去实现:

首先,我们要预先创建一个进程池,并把它管理起来。其次,父进程要通过传输信息来控制子进程完成不同的任务;父进程就要发送信息,子进程就要接受信息并执行任务最后,进程池能够被创建出来,当然也要能够被释放(销毁)。1. 描述进程池

我们要预先创建一个进程池,并且要将它管理起来;那就要像将这个进程池描述出来;如何描述并管理这个进程池呢?

这里我们要实现的本质还是要进行父子进程间通信,要让父进程发信息来控制子进程;

先描述

那站着父进程的角度:

所以就可以设计一个channel类用来描述一个管道文件;那这个类具有哪些属性呢?

wfd:父进程中写端的文件描述符pid:管道文件对应子进程的pid,后续用来回收子进程代码语言:javascript代码运行次数:0运行复制

class channel{public:    channel(int wfd, int pid)        : _wfd(wfd), _pid(pid)    {    }    ~channel() {}private:    int _wfd;    int _pid;};

再组织

一个父进程它要创建多个管道文件也就是多个子进程,就要将这些子进程管理起来;

所以,这里可以设计一个channel_manage类来讲管道文件channel管理起来。

代码语言:javascript代码运行次数:0运行复制

class channel_manage{public:    channel_manage()    {    }    ~channel_manage()    {    }private:    std::vector _channels;};

描述进程池

在进程池中,一定是存在上面的组织管道文件channel_manage,因为我们要对其进行管理;

在进程池中还可能存在其他信息:进程负载情况,进程状态等等。

这里就只记录进程的数量。

代码语言:javascript代码运行次数:0运行复制

class channel_pool{public:    const int NUM = 5; // 进程池中进程数量    channel_pool()        : _processnum(NUM)    {}    ~channel_pool()    {}private:    channel_manage _cm;    int _processnum;};

2. 初始化进程池

描述出了进程池channel_pool,现在我们能够根据这个channel_pool创建出一个进程池对象,但是创建出来的这个进程池对象里面什么是都没有,一个进程都没有。

所以,我们就要对进程池进行初始化:那如何初始化呢?(这里暂定进程池中进程个数为5个)

简单来说初始化进程池时就要将所有的子进程创建出来,那创建完子进程,子进程应该做什么呢,父进程又该做什么呢?

这里创建子进程就是为了让子进程完成某个任务,所以创建子进程之后(记得关闭不用的文件描述符),就让子进程等待父进程发送信息;在子进程接受到信息之后再去完成任务。而创建完子进程之后,父进程关闭不用的文件描述符,然后就要在_cm中新增一个管道文件channel对象。

channelchannel_manage中,所以channel_manage就要通过新增channel对象的方法。

代码语言:javascript代码运行次数:0运行复制

//这里只显示新增方法和成员变量class channel_manage{public:    void _insert(int wfd, int pid)    {        _channels.emplace_back(wfd,pid);    }private:    std::vector _channels;};class channel_pool{public:    void work(int rfd){};//任务方法    void _init()    {        for(int i = 0;i<_processnum;i++)        {            int fd[2];            int n = pipe(fd);            if(n < 0)            {                std::cerr<<"pipe failed"<<std::endl;                exit(1);            }            //创建子进程            int id = fork();            if(id < 0)            {                std::cerr<<"fork failed"<<std::endl;                exit(1);            }            else if(id == 0)            {                //child                close(fd[1]);//关闭写端                _work(fd[0]);//等到父进程发送信息                close(fd[0]);                exit(1);            }            //parent            close(fd[0]);            //在_cm中新增channel对象            _cm._insert(fd[1],id);        }    }private:    channel_manage _cm;    int _processnum;};

3. 子进程接受信息

完成了上述操作,现在进程池被创建出来,也被初始化了。

这里子进程是直到管道文件的文件描述符的就是fd[0];所以子进程就要在fd[0]文件描述符对应的管道文件中读取数据,然后根据读取到的数据来执行不同的任务。

那父子之间发送什么样的信息呢?

这里就采用一个整数对应一个任务,让父进程发送一个整数给子进程。

子进程读取数据:

知了zKnown 知了zKnown

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手。

知了zKnown 65 查看详情 知了zKnown 读取数据失败就返回-1;写端退出就返回0;返回值大于0 :表示读取到的实际字节数。(当读取到的字节数不等于4,就表示不是按照int读取的,就指读取到一个位置信息)。代码语言:javascript代码运行次数:0运行复制

    void work(int rfd)    {        while (true)        {            int massage = 0;            int n = read(rfd, &massage, sizeof(massage));            if (n < 0)            {                std::cerr << "read failed" << std::endl;                exit(1);            }            else if (n == 0)            {                std::cout << "exit, because write exit" << std::endl;                break;            }            else if (n != 4)            {                std::cout << "unkonw massage : " << massage << std::endl;            }            // 读取成功,执行任务            std::cout << "receive massage : " << massage << std::endl;        }    }

4. 父进程发送信息

实现子进程接受信息,现在来看父进程发送信息;如何发送呢?

这里父进程发送信息无非就以下三个问题:

给哪一个进程发送信息?发送什么信息?如何发送信息?

选择一个进程发送信息

发送什么信息?

如何发送信息

代码语言:javascript代码运行次数:0运行复制

class channel{public:    bool _send(int taskcode)    {        int n = write(_wfd, &taskcode, sizeof(taskcode));        if (n < 0)        { // 写入失败            std::cerr << "write failed" << std::endl;            return false;        }        // 写入成功        return true;    }private:    int _wfd;    int _pid;};class channel_manage{public:    channel &select()    {        auto &ret = _channels[_next];        _next++;        _next %= _channels.size();        return ret;    }private:    std::vector _channels;    int _next = 0;};class channel_pool{public:    void send(int taskcode)    {        // 选择一个进程        auto &c = _cm._select();        // 任务码由上层调用决定        // 发送信息        c._send(taskcode);    }private:    channel_manage _cm;    int _processnum;};

到这里,进程池就可以大致的运行起来了,这里简单测试一下

代码语言:javascript代码运行次数:0运行复制

//test.cc#include "channelpool.hpp"int main(){    srand((int)time(nullptr));    channel_pool cp;    cp._init();    cp.Print(); // 输出进程池中的所有进程信息    while (1)    {        int taskcode = rand() % 5;        cp.send(taskcode);        std::cout << std::endl;        sleep(1);    }    return 0;}

深入了解linux系统—— 进程池

进程池也是能够正常运行,子进程也能够接受到父进程发送的信息。

5. 回收进程池资源

做完上述的内容,这里的进程池就大致可以运行起来;

但是现在还缺少一个步骤,那就是回收进程池的资源。

如何回收进程池的资源呢?

首先,要关闭父进程中所有的管道文件的文件描述符。其次就是父进程等待子进程退出,回收子进程。

_wfd文件描述符、_pid子进程pid都封装在channel中;

如何关闭管道文件,如何等待子进程退出,这都要channel来提供。

而我们想要通过进程池对象调用回收函数,那channel_manage也要提供对应的关闭文件和等待子进程退出的函数。

代码语言:javascript代码运行次数:0运行复制

class channel{public:    void _close()    {        close(_wfd);    }    void _wait()    {        wait(nullptr);    }private:    int _wfd;    int _pid;};class channel_manage{public:    void _close()    {        for (auto &channel : _channels)        {            channel._close();            std::cout << "关闭管道文件 : " << channel.getname() << std::endl;        }    }    void _wait()    {        for (auto &channel : _channels)        {            channel._wait();            std::cout << "等待子进程退出 : " << channel.getname() << std::endl;        }    }private:    std::vector _channels;    int _next = 0;};class channel_pool{public:    void _quit()    {        //关闭所有w端文件        _cm._close();        //回收子进程        _cm._wait();    }private:    channel_manage _cm;    int _processnum;};

这里就发送一次信息然后退出,测试一下:

代码语言:javascript代码运行次数:0运行复制

//test.cc#include "channelpool.hpp"int main(){    srand((int)time(nullptr));    channel_pool cp;    cp._init();    cp.Print(); // 输出进程池中的所有进程信息    int cnt = 1;    while (cnt--)    {        int taskcode = rand() % 5;        cp.send(taskcode);        std::cout << std::endl;    }    cp._quit();    sleep(10);    return 0;}

深入了解linux系统—— 进程池

四、隐藏的问题

在上述的代码中存在一个隐藏的问题:

现在来看如果这样回收进程池资源:

代码语言:javascript代码运行次数:0运行复制

 class channel{public:    void _close()    {        close(_wfd);    }    void _wait()    {        wait(nullptr);    }private:    int _wfd;    int _pid;};class channel_manage{public:    void _quit()    {        for (auto &channel : _channels)        {            channel._close();            std::cout << "关闭管道文件 : " << channel.getname() << std::endl;            channel._wait();            std::cout << "等待子进程退出 : " << channel.getname() << std::endl;        }    }private:    std::vector _channels;    int _next = 0;};class channel_pool{public:    void _quit()    {        //关闭所有w端文件        _cm._close();        //回收子进程        _cm._wait();    }private:    channel_manage _cm;    int _processnum;};

这样关闭一个写端,等待一个子进程退出。

深入了解linux系统—— 进程池

我们会发现,程序卡到了这里,这是为什么呢?

这样父进程在创建子进程时,这个子进程的文件描述符表中是存储前面创建的管道文件的w端;这样我们调用channel类的_close就只关闭了父进程的w端,在其他进程中还存在管道文件的w端。这样子进程就会阻塞到read出,等待w端关闭,而父进程就等待子进程退出,这样程序就卡在了这样。

深入了解linux系统—— 进程池

而第一个创建的子进程,文件描述符4指向自己的w端,然后被关闭了。第二个创建的子进程,4指向第一个子进程对应管道文件的w端。第三个创建的子进程,4指向第一个子进程管道文件的w端,5指向第二个子进程对应管道文件的w端。…

这样,在回收进程池的资源时,关闭父进程第一个子进程的w端,此时第二、第三…个子进程的文件描述符中都存在第一个子进程对应管道文件的w端。

解决方法:

在回收进程池资源时,从最后一个被创建的子进程开始回收。 因为一个子进程中只存在比自己创建的早的子进程的w端;所以最后一个被创创建的子进程的w端只有父进程存在。 在创建子进程时,关闭比该子进程创建早的子进程的w端。

对于第一种方法这里就不演示了,来看第二种方法

对于第二种方法可能存在疑问:子进程和父进程是同时执行的,那子进程不会把自己的w段关闭吗?那不就同一个文件描述符关闭2次了吗?

实现第二种方法也很简单,只需在创建子进程之后,让子进程调用一次channel_massage_close函数即可。

这里就不演示了。

到这里,本篇文章内容就结束了

以上就是深入了解linux系统—— 进程池的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/447320.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 21:26:28
下一篇 2025年11月7日 21:27:07

相关推荐

  • python中round啥意思

    Python 中的 round() 函数用于将数字四舍五入到指定的位数。功能包括:将数字四舍五入到小数点后指定位数。如未指定位数,则四舍五入到整数。 何谓 Python 中的 round Python 中的 round() 函数用于将数字四舍五入到指定的位数。 功能 将指定数字四舍五入到小数点后指定…

    2025年12月13日
    000
  • python开源什么意思

    Python 的开源特性允许其源代码免费共享、修改和分发。它带来诸多优势:透明度、可定制性、社区支持和免费使用。但开源也存在挑战:安全风险、代码质量问题和许可证限制。 Python 的开源本质 什么是开源? 开源软件是指其源代码可供公众免费使用、修改和分发的软件。这意味着任何人都可以访问、修改和重新…

    2025年12月13日
    000
  • python是什么意思怎样读

    Python 是一种高级、解释性的编程语言,具有高层性、易于学习、动态类型、跨平台等特点,广泛应用于 Web 开发、数据科学、机器学习和自动化等领域,读音为 “PAI-thon”。 Python 是什么 Python 是一种高级、解释性的编程语言,具有以下特点: 高层性:Py…

    2025年12月13日
    000
  • python中np是什么意思

    答案: NumPy 是 Python 中用于科学计算的库,主要功能包括处理多维数组、线性代数操作、傅里叶变换、随机数生成和图像处理。详细描述:多维数组和矩阵操作: 创建、操纵和处理多维数组和矩阵。线性代数: 执行矩阵乘法、求逆和求特征值等线性代数操作。傅里叶变换: 计算傅里叶变换和逆傅里叶变换。随机…

    2025年12月13日
    000
  • python中round是什么意思

    round 函数用于四舍五入浮点数,语法:round(number, ndigits=None)。根据 ndigits(默认 0)指定精度:浮点数小数位大于或等于 5 舍入到下一个整数,否则舍入到当前整数。例如,round(3.14) 为 3,round(3.14, 1) 为 3.1,round(-…

    2025年12月13日
    000
  • python四舍五入怎么设置

    四舍五入可以通过 round() 函数实现,接受数字和保留小数位数两个参数,默认舍入到整数;另外,math.ceil()、math.floor() 和 decimal.Decimal() 可分别实现向上舍入、向下舍入和更精确的舍入。 如何使用 Python 进行四舍五入 四舍五入是将数字舍入到最接近…

    2025年12月13日
    000
  • python项目怎么运行

    如何运行 Python 项目?安装 Python 解释器。创建项目目录。编写 Python 脚本(.py 文件)。使用命令 python main.py 运行脚本。使用 python -m pdb main.py 调试脚本。 如何运行 Python 项目 第一步:安装 Python 解释器 访问官方…

    2025年12月13日
    000
  • python怎么安装docx库

    可使用 pip 或 conda 安装 docx 库:使用 pip 打开命令提示符或终端并运行 pip install python-docx。使用 conda 打开 Anaconda 提示符并运行 conda install python-docx。手动下载 zip 文件、解压并运行 python …

    2025年12月13日
    000
  • python怎么导入jieba库

    Python 中导入 jieba 库的步骤:通过 pip 命令安装 jieba 库。在 Python 代码中使用 import jieba 语句导入库。 如何在 Python 中导入 jieba 库 jieba 是一个流行的 Python 中文分词库,它可以将中文文本分割成词语。要导入 jieba …

    2025年12月13日
    000
  • python怎么撤回

    如何在 Python 中撤回代码提交?撤回暂存区中的修改:使用 “git reset HEAD” 命令。撤回已提交的更改:a. 查看提交历史并找到要撤回的提交哈希值。b. 执行 “git reset –hard ” 命令。 如何用 Pyth…

    2025年12月13日
    000
  • python怎么快速注释

    Python 快速注释有四种方法:单行注释(# 符号)、多行注释(三个单引号或双引号符号)、注释装饰器(@dataclass)、自动注释工具(如 Google AutoDoc、Mypy、pyannotate)。最佳实践是为公共方法和类编写描述性的文档字符串,并使用 Markdown 格式化进行注释。…

    2025年12月13日
    000
  • python安装失败怎么解决

    Python 安装失败的解决方案:满足系统要求。检查网络连接。关闭防火墙或防病毒软件。以管理员身份运行安装程序。重新启动计算机。使用 pip 命令安装 Python。检查环境变量。查找安装日志。咨询官方支持。 Python 安装失败的解决方案 问题:Python 安装失败如何解决? 解决方案: Py…

    2025年12月13日
    000
  • python运行不了怎么办

    无法运行 Python 的原因包括:Python 未安装。Python 路径未添加至系统路径。脚本存在语法错误。Python 版本与脚本不兼容。所需库未安装。脚本与操作系统不兼容。环境变量未正确设置。 Python 无法运行的原因 Python 是广受欢迎的编程语言,但有时会出现无法运行的情况。以下…

    2025年12月13日
    000
  • python的idle怎么清屏

    使用 Ctrl + L 快捷键可以快速清屏 Python IDLE 的 Python Shell。其他清屏方法包括使用 Shell 命令、重置按钮或 Python 代码。 Python IDLE 清屏方法 简短回答 在 Python IDLE 中,使用快捷键 Ctrl + L 可以快速清屏。 详细说…

    2025年12月13日
    000
  • python怎么保留一位小数

    要使用 Python 保留一位小数,可以使用 round() 函数:number:要四舍五入的数字ndigits:保留的小数位数(正数保留小数位,负数四舍五入到最接近的 10 的 ndigits 次方,0 四舍五入到整数) 如何使用 Python 保留一位小数 要使用 Python 保留一位小数,可…

    2025年12月13日
    000
  • python怎么快速添加注释

    Python 代码中添加注释的最快方法是使用快捷键:Windows/Linux:Ctrl + Shift + /macOS:Cmd + Option + /其他注释方法还包括三引号字符串、行内注释和注释块。最佳实践包括使用描述性注释、避免琐碎的注释、使用文档字符串和保持注释的最新状态。 如何快速添加…

    2025年12月13日
    000
  • python怎么写脚本

    使用 Python 编写脚本涉及以下步骤:设置 Python 环境:安装解释器并设置 PATH。创建 Python 文件:保存文件扩展名为 .py。编写 Python 脚本:导入模块、定义函数、编写逻辑。执行 Python 脚本:在命令行中输入 python script.py。 Python 脚本…

    2025年12月13日
    000
  • python的版本怎么查看

    确定 Python 版本的方法:1. 打开命令行,输入 “python”,查看显示版本;2. 使用 “–version” 标志直接获取版本信息,输出格式为 “Python 版本号”。 如何查看 Python 版本 要查看 Python 版本,可以使用以下步骤: 1. 打开命令行 在 Wi…

    2025年12月13日
    000
  • python的input怎么用

    Python 中 input() 函数获取用户输入并返回字符串。用法如下:input([prompt]):prompt 为可选提示信息。验证输入:可以通过 try-except 块验证输入类型。处理异常:input() 可能引发异常,如类型不匹配,可通过 try-except 处理。退出输入:输入空…

    2025年12月13日
    000
  • python怎么执行脚本

    执行 Python 脚本的方法有四种:命令提示符或终端Python 解释器IDLEIDE(如 PyCharm) 如何用 Python 执行脚本 Python 是一种广泛使用的编程语言,它允许您通过执行脚本来自动化任务并创建程序。执行 Python 脚本有多种方法。 1. 命令提示符或终端 这是最简单…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信