博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
linux查看设备使用状况,linux下查看硬件资源和网络资源的使用情况
阅读量:6376 次
发布时间:2019-06-23

本文共 4557 字,大约阅读时间需要 15 分钟。

本博文主要讲解Linux对硬件和软件资源的监控命令,包括:

查看cpu、内存、上下文、vm状态的vmstat、top(类似msgtask)和简单的free;

IO相关信息iostat -dx x y;

查看网络连接的netstat、网络IO流量概览的nload和每个套接字IO流量的iftop

1. vmstat和其他服务器资源管理命令

vmstat是virtual memory status的缩写,即虚拟内存状态。可以用来监控CUP、虚拟内存、IO等多个服务器指标。

1.1 基本使用方式

vm有两个参数:

vmstat x y

x、y为两个整数,前者表示采样的时间间隔数,后者表示采样次数——省略一个参数表示一直采样直至手动停止,省略两个参数表示查看机器启动以来的各指标平均值(==第一行打印系统启动以来的平均值==)。

1.2 参数解释

一次采样vmstat:

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

3 0 0 1502252 18464 261972 0 0 70 11 158 391 4 0 95 0 0

使用man vmstat可以查看vmstat参数说明和打印详解:

进程相关:

r:可运行的进程数目,包括running、或者等待时间片的进程;

b:处于阻塞状态(in uninterruptible sleep不可中断休眠)的进程数,通常指等待IO,比如磁盘、网络、输入。

内存相关:

swpd:使用的虚拟内存容量,单位字节;

free:空闲的内存容量;

buff:作为缓冲buffers的内存容量;

cache:作为操作系统缓存cache的内存容量;

inact/active(-a):活跃和不活跃的内存容量;

页面调度相关swap(以下参数每秒不要超过10):

si(swap in):每秒内存从磁盘写入的块数;

so(swap out):每秒内存写出到磁盘的块数;

IO相关:

bi(block in):每秒从块设备(磁盘和其他)获取的块数;

bo:每秒从块设备获取的块数。

主存和磁盘以块为单位传送数据。

系统相关:

in:The number of interrupts per second, including the clock;

cs(context swiches):每秒钟上下文切换的次数,cs次数太多是需要考虑调整程序线程数量;

cup相关:五种操作对CPU时间的占比

us(user time):cpu运行非内核代码的时间;

sy(system time):cpu运行内核代码的时间;

id(idle time):空闲时间,包括IO等待时间;

wa:等待IO的时间;

st:time stolen from a virtual machine.位置消耗时间。

1.3 分析思路(注意事项、未实战,纯猜想:

以上重点参数已经加粗:

如果b一直不为0可以考虑是否存在死锁。

r表示使用和等待cup资源的进程个数,如果超过了cpu核数很多,就可能频繁的引起上下文切换,表现为cs很大。

如果si、so很大、free很小,可能主存性能满足不了现在工作,导致频繁的磁盘IO甚至抖动。

1.4 实例解析

当上传文件并放入到本地磁盘时,bo突然很大:

156072576_1_20190309024802160.jpg

当使用vim将本地磁盘数据读入到内存中时,bi突然变大:

1.procs ---------2.memory--------- ---3.swap-------4.io---- -5.system--------6.cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 0 1458020 22500 295004 0 0 1388 0 186 456 4 1 93 2 0

当开启爬虫程序,需要从网络读取数据,并写入磁盘数据库时,各参数变化如下:

156072576_2_20190309024802332.jpg

从网络设备读取数据时bi变大;

当写入数据到数据库时bo变大;

开启了十几个线程因此需要频繁的上下文切换;

用户程序使用cup时间us经常在90%以;

等待IO时间占比wa也变得不稳定。

虽然没有换入换出si/so的例子,但是应当知道这是vmstat最终要的参数,当这两个参数太大时应该考虑优化程序的实现和升级内存容量。

1.5 cup密集型机器和IO密集型机器

cup密集型服务器vmstat的us输出通常是一个很高的值,即cup花费在非内核代码上的cup时间占比应该很高。

cup密集型服务器上下文切换次数警告阈值是10万/s(具体情况看机器?)。

IO密集型服务器cup会花费大量时间等待IO请求完成,则意味着很多任务处于非中断休眠状态(b列),并且wa数字也很高(等待IO时间)。

1.6 其他

top命令可以查看动态刷新的各个进程的cup和内存使用率,以及执行的命令和命令执行的用户和PID(进程ID),界面类似于windows的任务管理器:

156072576_3_20190309024802473.jpg

free命令,界面如下:

root@iZwz94idfw2r7h2hnepjZ:~# free

total used free shared buff/cache available

Mem: 2048212 587876 981736 5264 478600 1301432

Swap: 0 0 0

2.IO相关信息统计

2.1 iostat -dx a b

设备和分区的IO统计信息和cup统计信息。参数d x分别表示显示设备使用状态和输出更多信息。a和b分别表示采样时间间隔和采样次数,同vmstat,第一次输出也是系统启动以来的平均值:iostat -dx:爬虫程序启动后的变化值:

root@iZwz94iww8uynepjZ:~# iostat -dx 3

Linux 4.4.0-63-generic (iZwz94iww8uynepjZ) 05/04/2018 _x86_64_ (1 CPU)

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util

vda 0.00 0.00 0.00 0.33 0.00 5.33 32.00 0.00 0.00 0.00 0.00 0.00 0.00

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util

vda 0.00 7.33 0.00 1.33 0.00 37.33 56.00 0.00 0.00 0.00 0.00 0.00 0.00

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util

vda 0.00 4.00 0.00 10.00 0.00 57.33 11.47 0.01 0.80 0.00 0.80 0.80 0.80

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util

vda 0.00 28.52 0.00 87.25 0.00 1268.46 29.08 0.18 2.08 0.00 2.08 1.66 14.50

可以看到爬虫程序启动后因为要向数据库写入数据,相关指数明显变大;

r/s、w/s:每秒钟发送到设备的读写请求;

avgqu-sz:在设备队列中等待的请求数量;

await:磁盘排队上花费的毫秒数,包括读和写;

svctm:服务请求花费的毫秒数,不包括排队时间。

重要概念:请求服务并发数:

concurrency=(r/s+w/s)*(svctm/1000)

表示在采样周期内每秒设备处理的请求数。

3. 网络资源

3.1 netstat连接详情

Print network connections, routing tables, interface statistics, masquerade connections, and multicast membership

打印网络连接、路由表、接口统计、伪装连接和多播membership。

a、t、u表示罗列出所有的tcp和udp连接:

root@iZwz94i8afw2r7g62hnepjZ:~# netstat -at

Active Internet connections (servers and established)

Proto Recv-Q Send-Q Local Address Foreign Address State

tcp 0 0 localhost:32000 *:* LISTEN

tcp 0 0 *:http-alt *:* LISTEN

tcp 0 0 *:ssh *:* LISTEN

tcp 0 0 172.16.252.71:57346 211.151.27.128:http TIME_WAIT

tcp 0 0 172.16.252.71:57598 211.151.27.128:http TIME_WAIT

tcp 0 0 172.16.252.71:57306 211.151.27.128:http TIME_WAIT

tcp 0 0 172.16.252.71:39240 59.151.32.81:http TIME_WAIT

tcp 0 0 172.16.252.71:39274 59.151.32.81:http TIME_WAIT

tcp 0 0 172.16.252.71:39208 59.151.32.81:http TIME_WAIT

tcp 0 0 172.16.252.71:57480 211.151.27.128:http TIME_WAIT

tcp 0 0 172.16.252.71:39372 59.151.32.81:http TIME_WAIT

tcp 0 0 172.16.252.71:57450 211.151.27.128:http TIME_WAIT

tcp 0 0 172.16.252.71:57482 211.151.27.128:http TIME_WAIT

3.2 输入输出流量:nload、iftop

nload查看总体的输入输出流量,并且可以查看峰值、谷值和平均值,太简单,如图开启爬虫:

156072576_4_20190309024802863.jpg

iftop则可以查看每个套接字的输出输出流量:

156072576_5_2019030902480382.jpg

**以上提到的命令还可以用于数据库查询性能分析

转载地址:http://aqvqa.baihongyu.com/

你可能感兴趣的文章
Countly 19.02.1 发布,实时移动和 web 分析报告平台
查看>>
TCP连接中time_wait在开发中的影响-搜人以鱼不如授之以渔
查看>>
Oracle数据库机出新帮助不同规模企业迈向云端
查看>>
前端通信:ajax设计方案(六)--- 全局配置、请求格式拓展和优化、请求二进制类型、浏览器错误搜集以及npm打包发布...
查看>>
Android捕获监听Home键、最近任务列表键
查看>>
微服务分布式企业框架 Springmvc+mybatis+shiro+Dubbo+ZooKeeper+Redis+KafKa
查看>>
word2vec原理(三) 基于Negative Sampling的模型
查看>>
被《时代周刊》选为年度最佳发明,PS VR靠的竟然是价格
查看>>
通用唯一标识码UUID的介绍及使用。
查看>>
spring笔记--依赖注入之针对不同类型变量的几种注入方式
查看>>
Java爬虫——网易云热评爬取
查看>>
Ajax的简单学习
查看>>
无华为,不智慧:智慧城市建设为何少不了华为?
查看>>
高性能网络通信框架Netty-基础概念篇
查看>>
为npm配置taobao源
查看>>
orm框架(SQLAlchemy) 连接数据库和创建表
查看>>
OSPF多区域虚电路配置
查看>>
zookeeper初探三 java客户端连接
查看>>
管理邮件用户
查看>>
Python中的运算符、数据类型、字符串及列表操作举例
查看>>