当前位置: 首页 > news >正文

《服务器测试百日学习计划——Day1:Linux基础与硬件查看》


《服务器测试百日学习计划——Day1:Linux基础与硬件查看》

前言

大家好,我是JACK,服务器硬件测试工程师。从今天开始记录我的百日学习计划,把每天的学习内容整理成文章,既是自己的学习记录,也希望对同样在学习服务器测试的朋友有帮助。

Day1主要内容:Linux终端基础、查看服务器硬件、查看系统状态、查看系统日志、Python入门、拓展实验。


一、Linux终端基础

1. pwd — 查看当前路径

[root@bogon ~]# pwd/root

2. ls — 查看目录内容

[root@bogon ~]# lsanaconda-ks.cfg ascend dmesg.log sel.log stress_logs...# 查看详细信息(权限、用户、大小、时间)[root@bogon ~]# ls -l总用量1243456-rw-------.1root root70721211:52 anaconda-ks.cfg drwxr-x---.4root root409621216:37 ascend -rwxr-xr-x.1root root110430886621213:55 Ascend-cann-toolkit_8.5.0_linux-aarch64.run -rw-r--r--.1root root2781413617:52 dmesg.log -rw-r--r--.1root root284503617:55 sel.log

3. cd — 切换目录

[root@bogon ~]# cd /var/log/[root@bogon log]# pwd/var/log[root@bogon log]# cd ~ # 回到home目录[root@bogon ~]#

4. mkdir — 创建文件夹

[root@bogon ~]# mkdir server_lab[root@bogon ~]# cd server_lab/[root@bogon server_lab]#

5. touch — 创建文件

[root@bogon server_lab]# touch test.txt[root@bogon server_lab]# lstest.txt

6. cp — 复制文件

[root@bogon server_lab]# cp test.txt test2.txt[root@bogon server_lab]# lstest2.txt test.txt

7. rm — 删除文件

[root@bogon server_lab]# rm test2.txtrm:是否删除普通空文件'test2.txt'?y[root@bogon server_lab]# lstest.txt

Linux基础命令总结:

命令作用
pwd查看当前路径
ls查看目录内容
ls -l查看详细信息(权限、用户、大小、时间)
cd切换目录
mkdir创建目录
touch创建文件
cp复制文件
rm删除文件

二、查看服务器硬件

1. 查看CPU — lscpu

重点关注CPU(s)、Model name、Socket数、每核线程数:

[root@bogon server_lab]# lscpu架构: aarch64 CPU 运行模式:64-bit CPU:256在线 CPU 列表:0-255 厂商 ID: HiSilicon BIOS Model name: Kunpeng9207260Z 每个核的线程数:2每个座的核数:64座:2CPU 最大 MHz:2600.0000CPU 最小 MHz:400.0000NUMA 节点:4NUMA 节点0 CPU:0-63 NUMA 节点1 CPU:64-127 NUMA 节点2 CPU:128-191 NUMA 节点3 CPU:192-255 Caches: L1d:8MiB(128instances)L1i:8MiB(128instances)L2:160MiB(128instances)L3:224MiB(4instances)

💡解读:2颗CPU × 每颗64核 × 每核2线程 = 256逻辑CPU,双路鲲鹏920服务器,4个NUMA节点。

2. 查看内存 — free -h

[root@bogon server_lab]# free -htotal usedfreeshared buff/cache available Mem:2.0Ti 10Gi2.0Ti 28Mi 915Mi2.0Ti Swap:4.0Gi 0B4.0Gi

3. 查看磁盘 — lsblk

[root@bogon server_lab]# lsblkNAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS sda8:00446.6G0disk sdb8:160446.6G0disk sdc8:320446.6G0disk sdd8:480446.6G0disk sde8:640446.6G0disk sdf8:800447.1G0disk sdg8:960447.1G0disk sdh8:1120446.6G0disk sdi8:1280446.6G0disk sdj8:1440446.6G0disk nvme1n1259:002.9T0disk ├─nvme1n1p1 600M /boot/efi ├─nvme1n1p2 1G /boot └─nvme1n1p32.9T ├─openeuler-root 70G / ├─openeuler-swap 4G[SWAP]└─openeuler-home2.8T /home nvme0n1259:102.9T0disk

💡lsblk说明:列出系统中所有块设备,包括硬盘、分区、RAID等。如果NVMe SSD消失,可能是硬件故障、驱动问题或设备连接问题。

用nvme list查看NVMe硬盘详情:

[root@bogon ~]# nvme listNode SN Model Namespace Usage Format FW Rev /dev/nvme0n1 D77446D401J852 DERAP44YGM03T2US13.20TB /3.20TB512B D7Y05M1F /dev/nvme1n1 D77446D4017E52 DERAP44YGM03T2US13.20TB /3.20TB512B D7Y05M1F

用lsscsi查看所有SCSI/SAS/SATA/NVMe设备:

[root@bogon ~]# lsscsi[0:1:124:0]enclosu BROADCOM VirtualSES 03 -[0:3:104:0]disk BROADCOM MR9560-16i5.29/dev/sda[0:3:105:0]disk BROADCOM MR9560-16i5.29/dev/sdc[0:3:106:0]disk BROADCOM MR9560-16i5.29/dev/sdb[0:3:107:0]disk BROADCOM MR9560-16i5.29/dev/sdd[0:3:108:0]disk BROADCOM MR9560-16i5.29/dev/sde[0:3:109:0]disk BROADCOM MR9560-16i5.29/dev/sdh[0:3:110:0]disk BROADCOM MR9560-16i5.29/dev/sdi[0:3:111:0]disk BROADCOM MR9560-16i5.29/dev/sdj[1:0:0:0]disk ATA INTEL SSDSCKKB48 0100 /dev/sdg[2:0:0:0]disk ATA INTEL SSDSCKKB48 0100 /dev/sdf[N:0:0:1]disk DERAP44YGM03T2US__1 - /dev/nvme0n1[N:1:0:1]disk DERAP44YGM03T2US__1 - /dev/nvme1n1

存储架构拓扑:

CPU ├── PCIe → NVMe SSD (M.2) 3.2TB × 2 # NVMe通过PCIe x4直连CPU ├── SATA Controller → SATA SSD 480GB × 2 └── RAID Controller → SAS SSD 446GB × 8

NVMe消失四层排查法:

设备层 → lsblk # 系统是否识别 PCIe层 → lspci # PCIe总线是否识别 协议层 → lsmod | grep nvme # 驱动是否加载 日志层 → dmesg | grep nvme # 内核是否有报错

4. 查看PCIe设备 — lspci

lspci列出系统中所有PCIe设备,通过设备类型可以快速识别各硬件:

[root@bogon server_lab]# lspci# BMC管理芯片(远程控制、KVM、硬件监控、IPMI)02:00.0 VGA compatible controller: Huawei Hi171x[iBMC w/VGA support]# 网卡(4个口,支持10/25/50GbE RDMA)35:00.0 Ethernet controller: Huawei HNS GE/10GE/25GE/50GE RDMA Network Controller35:00.1 Ethernet controller: Huawei HNS GE/10GE/25GE/50GE RDMA Network Controller35:00.2 Ethernet controller: Huawei HNS GE/10GE/25GE/50GE RDMA Network Controller35:00.3 Ethernet controller: Huawei HNS GE/10GE/25GE/50GE RDMA Network Controller# NVMe(NVMe = PCIe协议存储设备,通过PCIe x4连接CPU)81:00.0 Non-Volatile memory controller: DERA Storage Device151582:00.0 Non-Volatile memory controller: DERA Storage Device1515# RAID卡83:00.0 RAID bus controller: Broadcom/LSI MegaRAID 12GSAS/PCIe Secure SAS39xx# NPU加速卡 × 808:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 0c:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d80242:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d80246:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d80296:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 ab:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 c1:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802 d6:00.0 Processing accelerators: Huawei Technologies Co., Ltd. Device d802

常见PCIe设备类型对照:

设备类型说明
Ethernet controller网卡
Non-Volatile memory controllerNVMe硬盘
Processing acceleratorsGPU/NPU加速卡
RAID bus controllerRAID卡
VGA compatible controller显卡/BMC管理芯片

💡PCI bridge = PCIe Root Port,CPU通过Root Port连接各PCIe设备:CPU → Root Port → PCIe Device,一个Root Port可以连接NVMe、NIC、GPU、RAID等设备。

本台服务器硬件汇总:

硬件规格
CPU鲲鹏920 × 2,共256逻辑核
内存2TB
NVMe SSD3.2TB × 2(M.2接口)
SAS HDD446GB × 8(RAID卡管理)
SATA SSD480GB × 2
RDMA NIC4口(10/25/50GbE)
RAID卡Broadcom MegaRAID
NPU华为加速卡 × 8
BMC华为iBMC

三、查看系统状态

1. top — 查看系统进程

[root@bogon server_lab]# toptop-12:09:39 up2days,21:05,1user, load average:8.00,8.00,8.00Tasks:2701total,1running,2700sleeping %Cpu(s):0.0us,0.0sy,0.0ni,100.0id,0.0wa MiB Mem:2062458total,2056736free,10918used,918buff/cache MiB Swap:4096total,4096free,0used PIDUSERPR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND6950root2008262854361832S2.00.053:42.46 irqbalance15836root2003056881603016R1.30.00:00.25top

💡解读:id=100%说明CPU完全空闲;load average=8对256核CPU完全正常;按q退出top。


四、查看系统日志 — dmesg

# 查看最早的内核启动日志[root@bogon server_lab]# dmesg | head[0.000000]Booting Linux on physical CPU 0x0300000000[0x480fd020][0.000000]Linux version5.10.0-216.0.0.115.oe2203sp4.aarch64[0.000000]efi: EFI v2.70 by EDK II[0.000000]ACPI: RSDP 0x000000005FFE0018 000024(v02 HISI)# 查看最新的内核日志[root@bogon server_lab]# dmesg | tail[3605.501349]usb1-1: New USB device found,idVendor=12d1[3605.518927]usb1-1: Product: Keyboard/Mouse KVM2.0[3605.565264]input: Keyboard/Mouse KVM2.0as /devices/...

五、Python3入门

服务器测试中Python非常有用,可以用来写自动化脚本:

[root@bogon server_lab]# python3Python3.9.9(main, Dec272025,20:20:19)[GCC10.3.1]on linux Type"help","copyright","credits"or"license"formoreinformation.>>>print("Hello Server Engineer")Hello Server Engineer>>>exit()[root@bogon server_lab]#

六、拓展实验

1. 查看PCIe拓扑结构 — lspci -tv

[root@bogon server_lab]# lspci -tv-+-[0000:00]- +-[0000:01]-+-00.0-[02]----00.0 Huawei Hi171x[iBMC+VGA]# BMC管理芯片|+-01.0-[03]----00.0 iBMA Virtual Network Adapter +-[0000:07]----00.0-[08]----00.0 Huawei Device d802# NPU+-[0000:0b]----00.0-[0c]----00.0 Huawei Device d802# NPU+-[0000:34]-+-00.0-[35]-+-00.0 HNS RDMA Network Controller# 网卡||+-00.1 HNS RDMA Network Controller||+-00.2 HNS RDMA Network Controller||\-00.3 HNS RDMA Network Controller# 4个网口+-[0000:41]----00.0-[42]----00.0 Huawei Device d802# NPU+-[0000:45]----00.0-[46]----00.0 Huawei Device d802# NPU+-[0000:80]-+-00.0-[81]----00.0 DERA Storage Device1515# NVMe|+-02.0-[82]----00.0 DERA Storage Device1515# NVMe|\-04.0-[83]----00.0 Broadcom MegaRAID# RAID卡+-[0000:95]----00.0-[96]----00.0 Huawei Device d802# NPU+-[0000:aa]----00.0-[ab]----00.0 Huawei Device d802# NPU+-[0000:c0]----00.0-[c1]----00.0 Huawei Device d802# NPU\-[0000:d5]----00.0-[d6]----00.0 Huawei Device d802# NPU

完整PCIe拓扑图:

CPU ├── PCIe Root Port 01 │ ├── BMC + VGA(远程控制、KVM、IPMI) │ └── Virtual NIC ├── PCIe Root Port 34 │ └── RDMA NIC(4个网口,支持10/25/50GbE) ├── PCIe Root Port 80 │ ├── NVMe SSD 3.2TB(M.2) │ ├── NVMe SSD 3.2TB(M.2) │ └── RAID Controller ├── PCIe Root Port 30/32/70/72 │ └── SAS Controller × 4 └── PCIe Root Port 41/45/95/AA/C0/D5 └── NPU加速卡 × 8

2. watch — 每秒刷新执行命令

watch的作用:每隔指定时间执行一次命令,常用来监控CPU、网络、IO:

# 每1秒查看一次CPU逻辑核心数[root@bogon server_lab]# watch -n 1 "cat /proc/cpuinfo | grep processor | wc -l"Every1.0s:cat/proc/cpuinfo|grepprocessor|wc-lbogon: Mon Mar912:28:122026256# Ctrl+C退出

3. 查看内存详细信息 — /proc/meminfo

[root@bogon server_lab]# cat /proc/meminfo | headMemTotal:2111956928kB MemFree:2106097672kB MemAvailable:2100777804kB# 2111956928 / 1024 / 1024 ≈ 2TB内存Buffers:78820kB Cached:610068kB SwapCached:0kB Active:462952kB Inactive:368536kB

4. 查看磁盘详情组合命令

# 只显示磁盘不显示分区[root@bogon ~]# lsblk -dNAME MAJ:MIN RM SIZE RO TYPE sda8:00446.6G0disk sdb8:160446.6G0disk sdc8:320446.6G0disk sdd8:480446.6G0disk sde8:640446.6G0disk sdf8:800447.1G0disk sdg8:960447.1G0disk sdh8:1120446.6G0disk sdi8:1280446.6G0disk sdj8:1440446.6G0disk nvme0n1259:002.9T0disk nvme1n1259:102.9T0disk

Day1总结

今天主要学习了:

  • Linux基础命令(pwd、ls、cd、mkdir、touch、cp、rm)
  • 查看服务器硬件(lscpu、free、lsblk、lsblk -d、nvme list、lsscsi、lspci、lspci -tv)
  • 查看系统状态(top)
  • 查看系统日志(dmesg)
  • Python3基础入门
  • 拓展实验(lspci -tv拓扑、watch、/proc/meminfo、lsblk -d)

核心收获:

  • lspci能看到所有PCIe设备,NVMe是PCIe设备所以也在里面
  • NVMe消失排查四层法:设备层→PCIe层→协议层→日志层
  • PCIe拓扑通过lspci -tv可以清晰看到CPU→Root Port→设备的完整连接关系
  • watch命令可以实时监控任何命令的输出,非常实用

明天继续!如果这篇文章对你有帮助,欢迎点赞、收藏、关注,百日学习计划持续更新,不迷路!

欢迎关注JACK的服务器笔记


http://www.jsqmd.com/news/462833/

相关文章:

  • Android开发避坑指南:ActivityResultLauncher封装与意外kill处理实战
  • 2026年汕头儿童玩具车品牌推荐,源头玩具车厂家威盛达靠谱吗 - 工业推荐榜
  • 安川机器人系统升级避坑指南:为什么你的升级总是失败?这些细节要注意
  • #第八届立创电赛# 基于立创EDA与瑞萨MCU的DIY多功能电子时钟项目全解析
  • TDengine超级表设计全解析:从数据建模到批量插入的最佳实践
  • 招 7000 人!
  • 避坑指南:微信小程序订阅消息的三种状态(accept/reject/ban)及应对策略
  • 若依框架分页功能完整指南:从PageInfo到TableDataInfo的正确使用姿势
  • 腾讯优图Youtu-VL-4B-Instruct部署实战:从安装到应用,搞定图像推理任务
  • VSCode资源管理器优化:利用files.exclude高效隐藏配置文件
  • 量子计算中的张量积:从线性代数到量子比特对的实战解析
  • C++27并行计算新范式(执行策略v2.0正式落地):ISO WG21核心提案深度解密
  • 为什么你的macOS远程登录总失败?深入理解Full Disk Access权限机制
  • 从IDEA到生产:Spring Boot多环境启动参数配置全链路解析
  • DownKyi:B站视频下载全攻略——零基础掌握8K资源高效获取与管理技巧
  • 等保2.0测评避坑实录:一位安全工程师的12个常见扣分项修复方案
  • 三菱FX3U PLC编程避坑指南:从M8000到SM402的实战解析
  • 【ubuntu】——手动编译安装gflagsglog的完整指南
  • 通过Termius实现iOS设备远程控制Windows 11的SSH连接指南
  • CANoe V12.0环境变量被弃用?系统变量配置全攻略(附避坑指南)
  • WSL2内核与模块版本冲突的终极修复指南
  • 2026年陶瓷喷涂供应商推荐,山东安徽地区哪家比较靠谱? - 工业品牌热点
  • 【星火计划】基于ESP32-S3双主控的人脸指纹考勤机:硬件设计、多模块集成与网络化应用全解析
  • Obsidian+Pandoc高效导出Word文档:图片路径优化与样式定制实战
  • Vue3实战:无缝集成钉钉扫码登录与企业级应用
  • 240101-3招解决MacOS图像捕捉无法删除iPhone照片的难题
  • 手把手教你用F12快速启动菜单:戴尔笔记本U盘启动避坑指南
  • 深入解析PCIe Gen3物理层:128b/130b编码与信号均衡技术
  • XUnity AutoTranslator技术解析与实战指南:突破Unity游戏语言壁垒的解决方案
  • 2026年黑龙江口碑好的变速箱维修服务公司推荐,专业维修企业全解析 - mypinpai