掌握IPMI远程管理:ipmitool命令详解

一、核心概念与连接方式

IPMI (Intelligent Platform Management Interface) 是一套开放的硬件管理接口规范。ipmitool 是常用的命令行工具,用于与支持 IPMI 的 BMC (Baseboard Management Controller) 进行交互。

远程连接格式(最常用)

1
ipmitool -I lanplus -H <BMC_IP> -U <用户名> -P <密码> <命令>
  • -I lanplus:指定接口类型(推荐 IPMI v2.0)
  • -H <BMC_IP>:BMC IP 地址
  • -U <用户名>:登录用户名
  • -P <密码>:登录密码

使用密钥文件(安全推荐)

1
2
3
echo 'your_password' > /root/bmc_pass
chmod 600 /root/bmc_pass
ipmitool -I lanplus -H <BMC_IP> -U <用户名> -f /root/bmc_pass <命令>

二、系统信息与硬件监控

1. 系统信息查询

查看 BMC 基本信息:

1
ipmitool mc info
  • 显示固件版本、IPMI 规范版本、制造商 ID 等

获取底盘状态:

1
ipmitool chassis status
  • 电源状态、功率利用率、重启计数等

2. 传感器监控

查看所有传感器数据:

1
ipmitool sensor
  • 最常用命令,显示温度、风扇速度、电压等硬件传感器实时数据

3. 系统事件日志 (SEL)

列出所有事件:

1
ipmitool sel elist
  • 查看硬件故障、电源事件、传感器警报等系统事件(诊断必备

查看 SEL 状态信息:

1
ipmitool sel info
  • 条目数量、可用空间、溢出状态等

清除 SEL 日志:

1
ipmitool sel clear
  • 重要提醒:此操作不可逆,谨慎使用!

三、电源控制

查看电源状态:

1
ipmitool chassis power status
  • 检查服务器当前状态(开机、关机、重启等)

电源操作命令:

1
2
3
4
5
ipmitool chassis power on      # 开机
ipmitool chassis power off # 强制关机(类似拔电源线,**可能导致数据丢失**)
ipmitool chassis power soft # 软关机(通知操作系统正常关闭)
ipmitool chassis power cycle # 电源循环(关机再开机)
ipmitool chassis power reset # 热重启(不切断电源)

四、远程控制台 (SOL)

启动串行控制台会话:

1
ipmitool -I lanplus -H <BMC_IP> -U <用户名> -P <密码> sol activate
  • 即使服务器无操作系统或系统崩溃,也能访问文本控制台
  • 使用 Ctrl+] 退出 SOL 会话

五、网络与用户管理

查看网络配置:

1
ipmitool lan print 1
  • 显示 LAN 通道 1 的 IP 地址、MAC 地址、网关等信息

设置静态 IP(示例):

1
2
3
4
ipmitool lan set 1 ipsrc static
ipmitool lan set 1 ipaddr 192.168.1.101
ipmitool lan set 1 netmask 255.255.255.0
ipmitool lan set 1 defgw ipaddr 192.168.1.1

查看用户列表:

1
ipmitool user list 1
  • 显示 BMC 用户列表及权限信息

六、故障排除与实用脚本

1. 连接测试

1
2
3
# 测试IPMI连接
ping <BMC_IP>
nmap -p 623 <BMC_IP>

2. 实用脚本

1
2
3
4
5
6
7
8
9
# 批量重启服务器
#!/bin/bash
SERVERS=("192.168.1.100" "192.168.1.101")
USER="admin"
PASS="password"

for server in "${SERVERS[@]}"; do
ipmitool -I lanplus -H $server -U $USER -P $PASS chassis power cycle
done

3. 辅助工具

1
2
3
dmidecode -t memory   # 内存信息
dmidecode -t system # 系统信息
lscpu # CPU信息

提示: 生产环境配置监控告警,及时发现问题。