【Linux】进程管理：从理论到实践（一）

详细介绍了linux进程的概念和理论实践（一）

Zfox_

3385人浏览 · 2024-09-25 13:11:18

Zfox_ · 2024-09-25 13:11:18 发布

🌈 个人主页：Zfox_
🔥 系列专栏：Linux

一： 🔥 进程的基本概念

在给进程下定义之前，我们先了解一下进程：

💦 我们在编写完代码并运行起来时，在我们的磁盘中会形成一个可执行文件，当我们双击这个可执行文件时（程序时），这个程序会加载到内存中，而这个时候我们不能把它叫做程序了，应该叫做进程。

💦 所以说，只要把程序（运行起来）加载到内存中，就称之为进程。
💦 进程的概念：程序的一个执行实例，正在执行的程序等。
💦 如果站在内核的角度来看：进程是分配系统资源的单位。

二： 🔥 描述进程-PCB

🍊 一个概念需要一个具体的结构体来进行描述的。进程中的信息就被放在了一个叫做进程控制块(PCB)的结构体中。

PCB：进程控制块（结构体）

当一个程序加载到内存中，操作系统要为刚刚加载到内存的程序创建一个结构体（PCB）,进程信息被放在这个结构体中（PCB）,可以理解为PCB是进程的属性的集合。

在Linux操作系统下的PCB是： task_struct
🍊 task_struct 是Linux内核的一种数据结构，它会被装载到 RAM(内存) 里并且包含着进程的信息,在进程执行时，任意时间内，进程对应的 PCB 都要包含以下内容：

标示符：描述本进程的唯一标示符，用来区别其他进程
状态：任务状态
优先级：相对于其他进程的优先级
程序计数器：程序中即将被执行的下一条指令的地址
内存指针：包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块指针
上下文数据：进程执行时处理器的寄存器中的数据
I/O状态信息：包括显示的I/O请求,分配给进程的I／O设备和被进程使用的- - - 文件列表
记账信息：可能包括处理器时间总和，使用的时钟数总和，时间限制，记账号等
其他信息：…

三： 🔥 查看进程

🥝 通过系统目录

🍊 第一种方式：在 /proc 这个目录下保存着所有进程的信息。
⚡ 注意：/proc不是磁盘级别的文件
在这里插入图片描述

🥝 通过ps命令

ps aux 	 # 查看系统中所有的进程信息
ps axj	 # 可以查看进程的父进程号

⚡ 查看对应进程信息

ps axj | head -1 && ps axj | grep myexe

在这里插入图片描述

四： 🔥 创建进程-fork() 📚

🍊 创建进程有两种创建方式：

1. 使用 ./ 运行某一个可执行程序，这种是最常见的方式
1. 使用系统调用接口创建进程，即使用fork()

当时用 fork() 函数之后，就在原来的进程中创建了一个子进程，在 fork() 之前的代码只被父进程执行，在 fork() 之后的代码有父子进程一起执行。

创建的子进程和父进程几乎一模一样，子进程和父进程的共享地址空间，子进程可以或者父进程中所有的文件，只有 PID 是父子进程最大的不同。

💢 下面是利用fork创建一个进程使用到的代码：

#include <iostream>    
#include <vector>    
#include <sys/types.h>    
#include <unistd.h>    
    
using namespace std;    
    
const int num = 10;    
    
void SubProcessRun()    
{    
    while(true)    
    {    
        cout << "T am sub process, pid: " << getpid() << " , ppid" << getppid() << endl;    
        sleep(1);    
    }    
}    
    
int main()    
{    
    vector<pid_t> allchild;    
    for(int i = 0; i < num; i++)    
    {    
        pid_t id = fork();    
        if(id == 0)    
        {    
            // 子进程    
            SubProcessRun();    
        }    
        allchild.push_back(id);    
    }    
    
    cout << "我的所有孩子是：";    
    for(auto child : allchild)    
    {    
        cout << child;    
    }    
    cout << endl;    
    
    while(true)    
    {    
        cout << "我是父进程，pid：" << getpid() << endl;    
        sleep(1);                                                                                                                                                                                                                                                                 
    }    
    return 0;    
}

以下是运行结果：
在这里插入图片描述

如果fork成功创建了一个进程，那么上面的代码就会输出
T am sub process, pid: 27894 , ppid27891
我的所有孩子是：27892 27893 27894 27895 27896 27897 27898 27899 27900 27901 

这里面有很多有意思的点：

fork函数调用一次，返回两次。

🎯 上面的代码是如何实现执行两个不同的分支语句的呢？其实是因为fork函数会返回两个返回值，一个是子进程会返回0，一个是父进程会返回子进程的PID。所以会同时进程两个分支语句中。

并发执行

🎯 父子进程是两个并发运行的独立程序。并发（同一个cpu执行），就是两个执行流在执行的时间上有重叠的部分。也就是说父子进程谁先被调度是不能确定的。

相同但是独立的地址空间

🎯 两个进程其实地址空间是一样的，但是它们都有自己私有的地址空间，所以父子进程的运行都是独立的，一个进程中的内存不会影响另一个进程中的内存。

共享文件

🎯 子进程继承了父进程所有打开的文件，所以父进程调用fork的时候，stdout文件呢是打开的，所以子进程中执行的内容也可以输出到屏幕上。

五： 🔥 进程状态

🥝 为了弄明白正在运行的进程是什么意思，我们需要知道进程的不同状态。一个进程可以有几个状态（在Linux内核里，进程有时候也叫做任务）。

💦 下面的状态在 kernel 源代码里定义

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};

R运行状态（running）： 并不意味着进程一定在运行中，它表明进程要么是在运行中要么在运行队列里。

🎯 模拟实现：

可以运行任意一个可运行的程序，即可出现R状态。

S睡眠状态（sleeping) : 意味着进程在等待事件完成（这里的睡眠有时候也叫做可中断睡眠（interruptible sleep））。

这种状态是一种浅度睡眠，此时的进程是在被阻塞的状态中，等待着条件的满足过后进程才可以运行。在这种状态下可以被信号激活，也可以被信号杀死。
模拟实现：
可以使用sleep() 系统调用接口使得一个进程睡眠
#include <stdio.h>
int main()
{
   while (1) 
   {
    	printf("S睡眠状态\n");
       sleep(100); // 睡眠100秒
   }
   return 0;
}

D磁盘休眠状态（Disk sleep） ：有时候也叫不可中断睡眠状态（uninterruptible sleep），在这个状态的进程通常会等待IO的结束。

🎯 模拟实现：
这种情况没法模拟，一般都是一个进程正在对IO这样的外设写入或者读取的时候，为了防止操作系统不小心杀掉这个进程，所以特地创建出一个状态保护这种进程。

T停止状态（stopped）： 可以通过发送 SIGSTOP 信号给进程来停止（T）进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。

🎯 模拟实现：
可以使用信号

kill -SIGSTOP PID 		// 停止进程
kill -SIGSONT PID 		// 继续进程

X死亡状态（dead）：这个状态只是一个返回状态，你不会在任务列表里看到这个状态。进程停止执行，进程不能投入运行。通常这种状态发生在接受到SIGSTOP、SIGTSTP、SIGTTIN、SIGOUT等信号的时候。

🎯 模拟实现：
可以使用 kill -9 PID即可杀死一个进程。

Z僵死状态
后面会详细讲解
孤儿进程：如果父进程比子进程先退出，那么此时子进程就叫做孤儿进程。而操作系统不会让这个子进程孤苦伶仃的运行在操作系统中，所以此时孤儿进程会被 init 进程（也就是1号进程，即所有进程的祖先）领养，从此以后孤儿进程的状态和最后的PCB空间释放都是由init进程负责了。

🎯 模拟实现：
模拟实现让父进程比子进程提前退出即可

#include <stdio.h>      
#include <unistd.h>    
#include <sys/type.h>
    
int main()    
{    
    pid_t pid = fork();    
    
    if (pid == 0) {    // 子进程一直执行
        while (1) {    
            printf("I am a child, pid=%d, ppid=%d\n", getpid(), getppid());    
            sleep(1);    
        }    
    } else {    
        int count = 3;    // 父进程执行3次
        while (count --) {    
            printf("I am a father, pid=%d, ppid=%d\n", getpid(), getppid());    
            sleep(1);
        }    
    }    

    return 0;    
}

🥝 进程状态查看

ps aux / ps axj 命令

# 每隔一秒显示进程的信息
while :; do ps axj | head -1 && ps axj | grep code | grep -v grep; sleep 1; done

在这里插入图片描述

父进程退出后，自己子进程被1号init进程收养。

僵尸进程

为什么会出现僵尸进程？

💦 前面说过进程的作用是为了给操作系统提供信息的，所以在进程调用结束之后，应该将该进程完成的任务情况汇报（eixt code）给操作系统，但是进程在执行完之后已经结束了，所以此时进程的状态就是僵尸状态。

僵尸进程的概念

💦僵尸进程：即进程已经结束了，但是父进程没有使用wait()系统调用，此时父进程不能读取到子进程退出返回的信息，此时就该进程就进入僵死状态。

僵尸进程的危害

💦 进程已经结束了，但是进程控制块PCB却还是没有被释放，这时就会浪费这一块资源空间。所以会导致操作系统的内存泄漏。

如何消灭僵尸进程？

💦 僵死状态需要父进程发出wait()系统调用终止进程，如果父进程不终止进程，那么此时要消灭僵尸进程只能通过找到僵尸进程的父进程，然后kill掉这个父进程，然后僵尸进程就会成为孤儿进程，此时由init进程领养这个进程然后杀死这个僵尸进程。

🎯 模拟实现：
模拟实现让子进程比父进程提前退出。

#include <stdio.h>      
#include <unistd.h>    
#include <sys/type.h>
    
int main()    
{    
    pid_t pid = fork();    
    
    if (pid == 0) {    
        int count = 3;    // 子进程执行3次
        while (count --) {    
            printf("I am a child, pid=%d, ppid=%d\n", getpid(), getppid());    
            sleep(1);    
        }    
    } else {    // 父进程一直执行
        while (1) {    
            printf("I am a father, pid=%d, ppid=%d\n", getpid(), getppid());    
            sleep(1);
        }    
    }    

    return 0;    
}

💦 使用shell脚本监控

# 每隔一秒显示进程的信息
while :; do ps axj | head -1 && ps axj | grep code | grep -v grep; sleep 1; done

在这里插入图片描述

如上图：子进程执行了3次之后，编程僵尸状态

🍊 进程状态转化

在这里插入图片描述

六： 🔥 共勉

以上就是我对 【Linux】进程管理 的理解，会立刻更新下一篇的，觉得这篇博客对你有帮助的，可以点赞收藏关注支持一波~😉
在这里插入图片描述

松山湖开发者村综合服务平台

助力广东及东莞地区开发者，代码托管、在线学习与竞赛、技术交流与分享、资源共享、职业发展，成为松山湖开发者首选的工作与学习平台

更多推荐

最新智能AI问答运营系统（SparkAi）一站式AIGC系统，GPT-4.0/GPT-4o多模态模型+联网搜索提问+AI绘画+管理后台，用户会员套餐

松山湖开发者村综合服务平台

通过shell脚本分析部署nginx网络服务（详细易懂）

松山湖开发者村综合服务平台

Docker用法详解

松山湖开发者村综合服务平台

所有评论(0)

查看更多评论

Zfox_

@weixin_50776420

已为社区贡献10条内容