Menu Close

15.2. 系统拓扑类型

在现代计算中,CPU 的概念有误导,因为大多数现代系统具有多个处理器。系统的拓扑是这些处理器互相连接并与其他系统资源的连接的方式。这可能会影响系统和应用程序性能,以及系统的调优注意事项。

以下是现代计算中使用的两种主要拓扑类型:

对称多进程(SMP)拓扑
SMP 拓扑允许所有处理器在相同时间内访问内存。但是,因为共享和相同的内存访问本质上会阻止所有 CPU 进行序列化内存访问,SMP 系统扩展限制通常被视为不可接受的。因此,所有现代服务器系统都是 NUMA 机器。
非统一内存访问(NUMA)拓扑

NUMA 拓扑是比 SMP 拓扑更久而开发的。在 NUMA 系统中,多个处理器通过插槽被物理分组。每个套接字都有一个专用的内存和处理器区域,它们对该内存进行本地访问,它们统称为节点。同一节点上的处理器对该节点的内存银行具有高速度访问,而对内存银行而非其节点上的内存银行而言较慢。

因此,访问非本地内存时会有一个性能损失。因此,具有 NUMA 拓扑的系统上性能敏感的应用程序应该访问与执行应用程序的处理器相同的内存,并应尽可能避免访问远程内存。

对于性能敏感的多线程应用程序,这些应用程序可能会被配置为在特定 NUMA 节点上执行,而不是特定处理器。这是否适当地取决于您的系统和应用程序的要求。如果多个应用程序线程访问同一缓存的数据,那么可将这些线程配置为在同一处理器上执行。但是,如果多个访问和缓存不同数据在同一处理器上执行的线程,每个线程可能会驱除由上一线程访问的缓存数据。这意味着,每个线程"misses"缓存,浪费执行时间从内存中获取数据并在缓存中替换。使用 perf 工具检查是否有过多的缓存未命中。

15.2.1. 显示系统拓扑

有许多命令可帮助了解系统拓扑。这个步骤描述了如何确定系统拓扑。

步骤

  • 显示系统拓扑概述:

    $ numactl --hardware
    available: 4 nodes (0-3)
    node 0 cpus: 0 4 8 12 16 20 24 28 32 36
    node 0 size: 65415 MB
    node 0 free: 43971 MB
    [...]
  • 要收集有关 CPU 架构的信息,如 CPU、线程、内核、插槽和 NUMA 节点的数量:

    $ lscpu
    Architecture:          x86_64
    CPU op-mode(s):        32-bit, 64-bit
    Byte Order:            Little Endian
    CPU(s):                40
    On-line CPU(s) list:   0-39
    Thread(s) per core:    1
    Core(s) per socket:    10
    Socket(s):             4
    NUMA node(s):          4
    Vendor ID:             GenuineIntel
    CPU family:            6
    Model:                 47
    Model name:            Intel(R) Xeon(R) CPU E7- 4870  @ 2.40GHz
    Stepping:              2
    CPU MHz:               2394.204
    BogoMIPS:              4787.85
    Virtualization:        VT-x
    L1d cache:             32K
    L1i cache:             32K
    L2 cache:              256K
    L3 cache:              30720K
    NUMA node0 CPU(s):     0,4,8,12,16,20,24,28,32,36
    NUMA node1 CPU(s):     2,6,10,14,18,22,26,30,34,38
    NUMA node2 CPU(s):     1,5,9,13,17,21,25,29,33,37
    NUMA node3 CPU(s):     3,7,11,15,19,23,27,31,35,39
  • 查看系统的图形表示:

    # dnf install hwloc-gui
    # lstopo

    图 15.1. lstopo 输出

    lstopo
  • 查看详细文本输出:

    # dnf install hwloc
    # lstopo-no-graphics
    Machine (15GB)
      Package L#0 + L3 L#0 (8192KB)
        L2 L#0 (256KB) + L1d L#0 (32KB) + L1i L#0 (32KB) + Core L#0
            PU L#0 (P#0)
            PU L#1 (P#4)
           HostBridge L#0
        PCI 8086:5917
            GPU L#0 "renderD128"
            GPU L#1 "controlD64"
            GPU L#2 "card0"
        PCIBridge
            PCI 8086:24fd
              Net L#3 "wlp61s0"
        PCIBridge
            PCI 8086:f1a6
        PCI 8086:15d7
            Net L#4 "enp0s31f6"

其他资源

  • numactl(8), lscpu(1), 和 lstopo(1) man pages