前言:欢迎各位光临本博客,这里小编带你直接手撕**,文章并不复杂,愿诸君**耐其心性,忘却杂尘,道有所长!!!!

在这里插入图片描述


IF’Maxue个人主页

 🔥 个人专栏:
《C语言》
《C++深度学习》
《Linux》
《数据结构》
《数学建模》

⛺️生活是默默的坚持,毅力是永久的享受。不破不立!

Linux线程解析

一、进程与线程的核心区别

  • 进程 = 内核数据结构(如PCB) + 代码和数据(执行流)
  • 线程:进程内部的“执行分支”,是更轻量的执行流

内核视角的资源与调度:

  • 进程:系统资源分配的基本单位(占内存、文件描述符等)
  • 线程:CPU调度的基本单位(被CPU直接调度执行)

二、地址空间:线程共享的“窗口”

进程访问资源的核心是“地址空间”——它像一个“窗口”,通过这个窗口能看到进程拥有的所有资源(代码、数据、堆、栈等)。

创建进程时,系统会为它单独申请一套地址空间(窗口),包含所有资源;
而创建线程时,线程会共享进程的地址空间(同一个窗口):

image.png
(单进程的地址空间:一个窗口对应一个执行流)

image.png
(多线程共享地址空间:一个窗口对应多个执行流)

image.png
(多线程共享地址空间的结构:多个task_struct共用一套资源)

三、线程的本质:多执行流并行

  1. 资源分配的本质:划分虚拟地址
    地址空间里的虚拟地址,本质是“资源的代表”。比如代码区、数据区、堆区的虚拟地址范围,就是进程/线程能访问的资源范围。

  2. 多线程如何并行?
    多个线程(task_struct)共享同一地址空间,但可以分配不同的虚拟地址范围(比如执行不同函数),从而实现“同一进程内的并行执行”:

image.png
(多线程在同一地址空间内执行不同函数,实现并行)

  1. 函数与代码区的划分
    函数本质是“一段连续的虚拟地址”,线程执行不同函数,就是在代码区中选择不同的虚拟地址范围执行。

  2. 进程与线程的关系
    单进程可以看作“只有一个线程的特殊情况”:

image.png
(单线程进程是多线程进程的特例)

四、Linux为什么用进程模拟线程?

Linux的线程并非单独设计,而是通过“轻量级进程(LWP)”模拟实现——复用了进程的内核管理代码(如task_struct、调度逻辑)。

原因很简单:

  • 复用现有进程管理代码,无需重新设计线程管理模块,降低开发成本;
  • 保持内核的简洁与健壮性。

image.png
(Linux复用进程内核代码管理线程,成本更低)

五、其他平台的线程实现

不同操作系统的线程实现不同:

  • Windows:单独设计“线程控制块(TCB)”管理线程,内核中需单独维护线程的调度信息,实现更复杂;
  • 核心思想一致:线程是调度单位,共享进程资源,但具体实现细节因系统而异。

六、Linux线程的调度与称呼

  • 操作系统视角:线程和进程都是“执行流”,调度算法无需区分;
  • 硬件视角:Linux内核中无独立“TCB”,用户态线程通过“轻量级进程(LWP)”与内核交互,每个用户态线程对应一个LWP;
  • 内核用task_struct统一描述进程和LWP,每个线程有自己的入口函数,被CPU当作独立执行流调度:

image.png
(每个线程的task_struct对应独立执行流,共享进程资源)

七、资源划分:共享与独占

  • 进程:强调“独占”(独立地址空间、资源),仅通过通信机制共享部分数据;
  • 线程:强调“共享”(同一地址空间、代码、数据、文件描述符等),独占资源包括线程栈、寄存器状态、程序计数器(PC)、线程私有数据(TLS)。

形象说:进程像“独立的公司”,线程像“公司内的团队”——团队共享公司资源,各自执行不同任务,共同完成公司目标。

八、物理内存管理:4KB页框

硬件与系统对内存的管理,都以“4KB”为基本单位:

  • 磁盘文件、物理内存均按4KB块存储/管理,这个块称为“页框”或“页帧”;
  • 内核用struct page描述每个4KB页框:

image.png
struct page结构体:描述4KB页框的属性)

页框的地址计算

  • 早期内核中,struct page会被组织成数组(如struct page mem[1048576]),该大小对应4GB物理内存(1048576×4KB=4GB),数组下标即页框索引;
  • 页框起始物理地址 = 数组下标 × 4KB;
  • 具体物理地址 = 页框起始地址 + 页内偏移(0~4095):

image.png
(物理地址由页框起始地址和页内偏移组成)

申请物理内存的本质

就是修改struct page数组的状态(标记某页框为“已分配”),建立“进程/线程”与“页框”的对应关系。

九、虚拟地址与页表映射

程序访问的是“虚拟地址”,需通过“页表”转换为物理地址。

32位虚拟地址的划分(经典两级页表)

32位x86架构的经典两级页表中,虚拟地址被分为3部分:

  • 前10位:页目录索引;
  • 中10位:页表索引;
  • 后12位:页内偏移(4KB=2¹²,12位可覆盖0~4095的偏移范围)。

页表映射过程

  1. 用前10位查“页目录”,找到对应“页表”的物理地址;
  2. 用中10位查“页表”,找到目标“物理页框”的起始地址;
  3. 用后12位(页内偏移)定位到具体字节:

image.png
(页目录→页表→物理页框:虚拟地址到物理地址的转换)

附:简单线程创建示例(修正编译说明)

用C语言的pthread库创建线程(体现线程共享地址空间),编译时需链接pthread库(加-lpthread参数):

#include <stdio.h>
#include <pthread.h>

// 共享变量(线程共享同一地址空间,可直接访问)
int shared = 0;

// 线程1执行函数
void *thread1(void *arg) {
    shared++;
    printf("线程1:shared = %d\n", shared);
    return NULL;
}

// 线程2执行函数
void *thread2(void *arg) {
    shared++;
    printf("线程2:shared = %d\n", shared);
    return NULL;
}

int main() {
    pthread_t tid1, tid2;
    // 创建线程
    pthread_create(&tid1, NULL, thread1, NULL);
    pthread_create(&tid2, NULL, thread2, NULL);
    // 等待线程结束(避免主线程提前退出)
    pthread_join(tid1, NULL);
    pthread_join(tid2, NULL);
    // 主线程也能访问shared
    printf("主线程:shared = %d\n", shared);
    return 0;
}

编译命令:gcc -o thread_demo thread_demo.c -lpthread
输出(共享变量被两个线程修改,顺序可能因调度略有差异):

线程1:shared = 1
线程2:shared = 2
主线程:shared = 2

Logo

助力广东及东莞地区开发者,代码托管、在线学习与竞赛、技术交流与分享、资源共享、职业发展,成为松山湖开发者首选的工作与学习平台

更多推荐