Linux系统下的性能分析命令

在 Linux 系统下，有许多用于性能分析和调试的命令和工具，可以帮助您识别系统瓶颈、优化性能以及调查问题。本文将介绍在性能分析过程中，可能使用到的一些命令。

以下是一些常用的性能分析命令和工具汇总：

用于实时监视系统中运行的进程和系统性能指标，如CPU使用率、内存使用率等。

1、top

top 命令是 Linux 系统下常用的性能分析工具，能够实时显示系统中各个进程的资源占用情况，如：CPU 使用率、内存使用率等。

1.1 语法


top [options]

常用选项：

-d 或 --delay: 指定刷新间隔，即 top 每隔多少秒更新一次，默认为 3 秒。
-n 或 --iterations: 指定刷新次数，即 top 更新数据的次数。
-u 或 --user: 仅显示指定用户的进程。
-p 或 --pid: 仅显示指定进程 ID 的信息。
-H：显示进程的层次关系，即显示线程。

1.2 示例

以下是一个 top 命令的示例输出：

 
top - 16:30:45 up 2 days,  5:37,  2 users,  load average: 0.15, 0.18, 0.20
Tasks: 186 total,   1 running, 185 sleeping,   0 stopped,   0 zombie
%Cpu(s):  1.5 us,  0.5 sy,  0.0 ni, 97.9 id,  0.0 wa,  0.0 hi,  0.1 si,  0.0 st
KiB Mem : 16327936 total,  9359124 free,  2368572 used,  4600256 buff/cache
KiB Swap:  2097148 total,  2097148 free,        0 used. 13755352 avail Mem 
 
   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
  2191 alice     20   0  169168  14164  10964 S   3.0  0.1   0:07.83 gnome-terminal-
  2811 bob       20   0 2067296 301100  78964 S   2.0  1.8  30:02.45 firefox
    1 root      20   0  191064   7780   4744 S   0.0  0.0   0:06.07 systemd
    ...

在上述示例中，每行输出信息分别为：

第一行：提供了系统的一般性信息。分别是系统当前时间、系统运行时间、当前登录用户数和负载平均值（load average，即：任务队列的平均长度，3个值分别表示1分钟、5分钟、15分钟到现在的平均值）。
第二行：任务（Tasks）信息。分别是总任务数，显示了正在运行（running）、睡眠（sleeping）、停止（stopped）和僵尸（``zombie）状态的进程数量。
第三行：CPU 统计信息。us 表示用户空间 CPU 占有率、sy 表示内核空间 CPU 占用率、ni 表示用户进程空间改变过优先级的进程 CPU 占有率、id 表示空闲 CPU 占用率、wa 表示等待输入输出的 CPU 时间百分比、hi 表示硬件中断请求、si 表示软件中断请求。
第四行：内存信息。分别为物理内存总量、已使用的物理内存、空闲物理内存、内核缓冲使用量。
第五行：交换区信息。分别为交换区总量、空闲交换区大小、缓冲交换区大小。
…：进程列表。每一行表示一个进程的信息，包括进程 ID、用户、CPU 使用率、内存使用率、进程状态等。

请注意，top 命令的输出会实时更新，您可以使用交互式命令来切换排序方式、改变显示内容等。例如，按下 M 可以按内存使用率排序进程，按下 P 可以按 CPU 使用率排序进程。要退出 top，您可以按下 q 键。

2、nmon

nmon 是一个用于实时监视系统性能的命令行工具，最初由 IBM 的 Nigel Griffiths 开发。它提供了一种简洁的方式来查看系统的CPU、内存、磁盘、网络等性能指标，以及进程级别的信息。

nmon 具有交互式界面，可以显示实时的性能数据，方便管理员和开发人员进行系统性能分析。

以下是 nmon 命令的一些常见用法和示例：

1. 基本使用：

使用以下命令启动 nmon：

nmon

这将启动 nmon 交互式界面，显示各种性能指标的实时数据。

2. 指定刷新频率：

您可以使用 -s 参数来指定刷新间隔，单位为秒。例如，以下命令将每隔2秒刷新一次数据：

nmon -s 2

3. 保存数据到文件：

您可以使用 -f 参数将 nmon 的输出保存到文件中，以便后续分析。例如，以下命令将数据保存到名为 nmon_output.nmon 的文件中：


nmon -f -c 10 -s 2 -T -m /path/to/nmon_output.nmon

在这个示例中，-c 10 表示 nmon 运行10个循环后自动退出，-T 表示在输出中包含时间戳。

4. 只显示特定项目：

如果您只对特定性能指标感兴趣，可以使用 -d 参数来指定要显示的项目。例如，以下命令只显示CPU和内存相关数据：

nmon -d cpu,mem

5. 远程监视：

您可以通过SSH在远程系统上运行 nmon，然后将性能数据传输到本地进行分析。例如，以下命令在远程系统上运行 nmon 并将数据传输到本地：


ssh user@remote_host "nmon -f -s 5 -c 10" > nmon_output.nmon

这些示例只是 nmon 的一小部分用法。nmon 还提供了许多其他选项和功能，可以根据您的需求进行调整和使用。要详细了解 nmon 的所有选项和功能，请查阅官方文档或运行 nmon 命令时使用 -h 参数查看帮助信息。

3、lsof

lsof（“List Open Files”）是一个用于列出在 Linux 系统上被进程打开的文件和网络连接的命令。它可以帮助您查看哪些进程正在访问哪些文件，以及网络连接的相关信息。

lsof 可以用于排查资源泄漏、寻找进程占用文件等问题。

3.1 语法

以下是一些常用的 lsof 命令选项及其说明：

-i: 列出网络连接。
-n: 不解析主机名和端口号。
-c <进程名>: 仅列出特定进程的信息。
-p <进程ID>: 列出指定进程的信息。
-u <用户名>: 列出属于特定用户的信息。
-t: 仅显示进程ID。
-F <格式>: 使用指定的格式输出。

3.2 示例

以下是一些示例，演示了如何使用 lsof 命令：

1. 列出所有打开的文件和网络连接：

lsof

2. 列出特定文件的打开者：

lsof /path/to/file

3. 列出特定端口的网络连接：


lsof -i :<port>

4. 列出某个用户打开的文件：


lsof -u <username>

5. 列出特定进程的打开文件：

lsof -p <pid>

6. 列出特定类型的文件（例如，TCP连接）：

lsof -i tcp

7. 列出所有网络连接，但不解析主机名和端口号：

lsof -ni

8. 以机器可读的格式输出信息：


lsof -F json

9. 列出所有正在使用某个设备的进程：

lsof /dev/sda1

请注意，lsof 命令提供了丰富的信息，包括文件描述符、文件类型、文件位置、打开方式、进程ID、用户等等。您可以根据需要使用不同的选项来过滤和查看所需的信息。使用 man lsof 命令可以查看完整的命令文档和详细说明。

4、pidstat

pidstat 是一个用于监视进程级别性能统计的命令行工具，它可以提供有关CPU使用率、内存使用率、IO活动等信息。它是 sysstat 套件的一部分，需要安装才能使用。

4.1 语法

以下是 pidstat 命令的常用选项：

-u: 显示CPU使用率和统计信息。
-r: 显示内存使用率和统计信息。
-d: 显示磁盘IO统计信息。
-t: 显示进程启动时间。
-p <PID>: 指定要监视的特定进程ID。
-h: 显示帮助信息。

4.2 示例

下面列举了一些示例。

1. 显示进程的CPU使用率和统计信息：

pidstat -u 1

这将每秒显示一次CPU使用率和统计信息，默认显示所有进程的数据。可以通过添加 -p <PID> 选项指定特定的进程。

2. 显示进程的内存使用率和统计信息：

pidstat -r 1

类似于上面的示例，这将每秒显示一次内存使用率和统计信息。

3. 显示进程的磁盘IO统计信息：

pidstat -d 1

这将每秒显示一次磁盘IO统计信息，包括读写速率、读写次数等。

4. 显示特定进程的CPU使用率和统计信息：


pidstat -u -p <PID> 1

这将每秒显示指定进程的CPU使用率和统计信息，其中 <PID> 是目标进程的进程ID。

5. 显示进程的启动时间：

pidstat -t

这将显示所有进程的启动时间。

pidstat 可以帮助您深入了解特定进程的性能行为，从而进行性能调优、问题排查等工作。请注意，具体选项和输出格式可能会因系统版本而异，您可以通过 man pidstat 查看完整的命令手册以获取更多信息。

5、vmstat

vmstat（Virtual Memory Statistics）是一个在 Linux 系统中常用的性能分析工具，它提供了关于系统虚拟内存、进程、CPU活动和IO的详细统计信息。通过使用 vmstat，您可以实时监控系统的性能，并且可以快速识别出潜在的瓶颈和问题。

5.1 语法

vmstat [options] [delay [count]]

options: 用于指定一些特定的输出选项。
delay: 两次输出之间的时间间隔（以秒为单位）。
count: 输出次数限制。

5.2 示例

vmstat 5 3

这个示例命令会每隔5秒输出一次统计数据，一共输出3次。

输出示例：

 
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs  us sy id wa st
 1  0      0 244304  67420 802252    0    0     0     4    3    4   1  1 97  1  0
 0  0      0 243968  67420 802256    0    0     0     0 1159 2292   1  1 98  0  0
 0  0      0 243636  67420 802256    0    0     0     0 1173 2261   1  1 98  0  0

在这个示例中，输出的各个列给出了不同的统计信息，包括进程状态、内存使用、交换空间使用、IO活动、系统活动以及CPU使用率等。通过观察这些数据，您可以了解系统的性能情况并识别潜在的问题。

vmstat 输出的列含义：

procs: 进程相关统计。 r: 正在运行的进程数、b: 等待运行的进程数。
memory: 内存相关统计。swpd: 虚拟内存使用量（以KB为单位）、free: 空闲内存（以KB为单位）、buff: 用作缓冲的内存（以KB为单位）、cache: 用作缓存的内存（以KB为单位）。
swap: 交换空间相关统计。si: 从磁盘读入交换区的数据量（以KB为单位）、so: 向磁盘写入交换区的数据量（以KB为单位）。
io: IO相关统计。bi: 每秒从块设备读入的块数量（如硬盘）（以块为单位）、bo: 每秒写入块设备的块数量（以块为单位）。
system: 系统相关统计。in: 每秒的中断数、cs: 每秒上下文切换数。
cpu: CPU使用情况统计。%us: 用户空间CPU使用率、%sy: 系统CPU使用率、%id: 空闲CPU百分比、%wa: 等待IO的CPU百分比、%st: 用于虚拟化的CPU时间百分比。

6、iostat

iostat 是一个在 Linux 系统中常用的命令，用于监视系统的磁盘和IO性能。它能够提供关于磁盘活动、IO延迟和吞吐量等信息，对于识别磁盘性能瓶颈和调优非常有帮助。

请注意，iostat 命令需要安装 sysstat 包才能使用。在大多数Linux发行版中，您可以使用包管理器来安装 sysstat 包。

6.1 语法

iostat [options] [interval] [count]

选项解释：

-c：显示CPU统计信息。
-d：显示磁盘统计信息。
-k：以千字节为单位显示数据。
-m：以兆字节为单位显示数据。
-x：显示扩展统计信息，包括更多的磁盘和分区信息。

6.2 示例

iostat 命令的输出包含了各个磁盘和分区的统计数据，以及系统的平均负载、CPU利用率、上下文切换等信息。以下是示例输出的一部分：

 
Linux 5.4.0-81-generic (hostname)   08/13/2023  _x86_64_    (8 CPU)
 
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           7.13    0.00    1.45    0.46    0.00   90.96
 
Device             tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               2.14        18.60        19.84     123759     132016
sdb               0.06         0.28         0.00       1863          0

在这个示例中，avg-cpu 部分显示了 CPU 利用率的统计信息，Device 部分显示了每个磁盘设备的统计数据，包括传输速率和总的读写字节数。您可以根据输出来评估系统的磁盘性能和负载情况。

1. 显示平均IO统计信息，每秒更新一次，共更新5次：

iostat

2. 显示详细的磁盘IO统计信息，每秒更新一次，共更新3次：

iostat -d 1 3

3. 以千字节为单位显示数据，显示CPU和磁盘统计信息，每秒更新一次，共更新4次：


iostat -k -c -d 1 4

4. 显示扩展的磁盘IO统计信息，每秒更新一次，共更新5次：

iostat -x 1 5

7、tcpdump

tcpdump 是一个在 Unix 系统上常用的网络抓包工具，用于捕获和分析网络数据包。它能够监听网络接口，捕获经过该接口的数据包，并以可读的格式显示数据包的内容。

tcpdump 支持多种过滤选项，以便只捕获感兴趣的数据包。

以下是一些常用的 tcpdump 命令选项以及示例说明：

1. 基本使用：

tcpdump

这将在默认网络接口上捕获所有的数据包。但是，通常情况下，您会希望使用其他选项来限制抓包的范围。

2. 指定网络接口：

tcpdump -i eth0

通过 -i 选项指定要捕获的网络接口，这里是 eth0。

3. 指定数据包数量：


tcpdump -c 10

使用 -c 选项可以指定捕获的数据包数量，这里捕获前 10 个数据包。

4. 捕获特定主机的数据包：

tcpdump host 192.168.1.100

使用 host 关键字可以捕获特定主机的所有数据包。

5. 捕获特定端口的数据包：

tcpdump port 80

使用 port 关键字可以捕获特定端口的数据包，这里是端口 80（HTTP）的数据包。

6. 组合多个过滤条件：

tcpdump host 192.168.1.100 and port 22

可以使用逻辑运算符 and 来组合多个过滤条件，这里捕获主机 192.168.1.100 上的端口 22（SSH）数据包。

7. 保存抓包结果到文件：

tcpdump -w capture.pcap

使用 -w 选项可以将抓包结果保存到文件中，文件格式为 pcap。

8. 读取保存的抓包文件：

tcpdump -r capture.pcap

使用 -r 选项可以读取保存的抓包文件并显示其内容。

9. 显示详细数据包信息：

tcpdump -v

使用 -v 选项可以显示详细的数据包信息。

10. 显示更详细的数据包信息：

tcpdump -vv

使用 -vv 选项可以显示更详细的数据包信息，包括解析的协议头。

这只是 tcpdump 的一些基本用法示例，该工具还支持许多其他选项和过滤条件，以满足各种网络抓包和分析的需求。请注意，由于抓包涉及到访问网络数据，通常需要以 root 或者具有适当权限的用户身份运行 tcpdump

	top - 16:30:45 up 2 days, 5:37, 2 users, load average: 0.15, 0.18, 0.20
	Tasks: 186 total, 1 running, 185 sleeping, 0 stopped, 0 zombie
	%Cpu(s): 1.5 us, 0.5 sy, 0.0 ni, 97.9 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 st
	KiB Mem : 16327936 total, 9359124 free, 2368572 used, 4600256 buff/cache
	KiB Swap: 2097148 total, 2097148 free, 0 used. 13755352 avail Mem

	PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
	2191 alice 20 0 169168 14164 10964 S 3.0 0.1 0:07.83 gnome-terminal-
	2811 bob 20 0 2067296 301100 78964 S 2.0 1.8 30:02.45 firefox
	1 root 20 0 191064 7780 4744 S 0.0 0.0 0:06.07 systemd
	...

	procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
	r b swpd free buff cache si so bi bo in cs us sy id wa st
	1 0 0 244304 67420 802252 0 0 0 4 3 4 1 1 97 1 0
	0 0 0 243968 67420 802256 0 0 0 0 1159 2292 1 1 98 0 0
	0 0 0 243636 67420 802256 0 0 0 0 1173 2261 1 1 98 0 0

	Linux 5.4.0-81-generic (hostname) 08/13/2023 _x86_64_ (8 CPU)

	avg-cpu: %user %nice %system %iowait %steal %idle
	7.13 0.00 1.45 0.46 0.00 90.96

	Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn
	sda 2.14 18.60 19.84 123759 132016
	sdb 0.06 0.28 0.00 1863 0