Dell T5820通过FlexBay安装NVMe
Dell Precision T5820 工作站 前面板有用于安装存储的FlexBay,分为2个FlaxBay,每个FlaxBay后部安装了一块背板,其安装的背板类型决定了是使用U.2接口硬盘还是SATA硬盘。
Dell T5820主板CPU旁边有 PCIe 0 和 PCIe 1 两个接口,该接口通过SFF-8654接口转接U.2,为 FlexBay 1 提供了数据通讯功能:
主板CPU旁边的 PCIe 0 和 PCIe 1 接口
FlexBay 1安装了U.2接口,数据线连接到主板CPU旁的 PCIe 0 和 PCIe 1 接口
不过,通过Flex Bay安装 NVMe存储 需要使用Dell专用的 NVMe Flexbay : 如果你购买的是4个SATA接口的T5820,那么需要购买官方套装: Flexbay的M.2模块(575-BBSH)和HDD FlexBay转为PCIe SSD FlexBay套件(750-ABDF)
Flexbay的M.2模块(575-BBSH)
HDD FlexBay转PCIe SSD FlexBay套件(750-ABDF)
安装有点小复杂,需要参考 如何为 Precision 5820 和 7820 塔式机切换 NVMe
优点
通过前面板安装 NVMe存储 非常方便和整洁
缺点
需要另外购买
NVMe Flexbay转接盒,目前价格大约125元/个每个安装位置只能安装 1块NVMe ,占用了非常宝贵的PCIe接口,这样消耗了2个PCIe接口只能安装2块NVMe。如果为了支持更多的GPU,例如低功耗 NVIDIA Tesla A2 GPU运算卡 ,我可能会将这2个PCIe接口用于 Dell T5820板载SFF-8654连接Tesla A2
实践
我最终在淘宝上购买了2个 NVMe Flexbay 转接盒,花费了250元,安装比较顺利,Dell为这个NVMe Flexbay设计了抽取盒子,只需要3个外部螺丝就能够固定住NVMe盘(内部不需要螺丝,直接卡住)
不过,我注意到一旦安装了 NVMe Flexbay ,主机的风扇转速明显提高,能够感觉到风噪比没有安装NVMe之前大了不少。我安装了 lm_sensors(Linux监控传感器) 和 nvme-cli用户工具 来检查验证
sudo apt install lm-sensors nvme-cli
然后执行 sensors 命令,可以看到系统传感器报告风扇转速和温度:
sensors 命令观察主机温度和风扇转速dell_smm-isa-0000
Adapter: ISA adapter
fan1: 1079 RPM (min = 0 RPM, max = 4050 RPM)
fan2: 688 RPM (min = 0 RPM, max = 3000 RPM)
fan3: 656 RPM (min = 0 RPM, max = 4100 RPM)
fan4: 1055 RPM (min = 0 RPM, max = 4100 RPM)
temp1: +30.0°C
temp2: +28.0°C
temp5: +25.0°C
temp7: +24.0°C
temp8: +29.0°C
nvme-pci-0100
Adapter: PCI adapter
Composite: +32.9°C (low = -0.1°C, high = +71.8°C)
(crit = +89.8°C)
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +30.0°C (high = +91.0°C, crit = +101.0°C)
Core 0: +29.0°C (high = +91.0°C, crit = +101.0°C)
Core 2: +28.0°C (high = +91.0°C, crit = +101.0°C)
Core 3: +29.0°C (high = +91.0°C, crit = +101.0°C)
Core 4: +28.0°C (high = +91.0°C, crit = +101.0°C)
nvme-pci-0200
Adapter: PCI adapter
Composite: +32.9°C (low = -0.1°C, high = +77.8°C)
(crit = +89.8°C)
可以看到感受到风扇噪音主要是因为fan1和fan4转速提到到>1000rpm,当系统风扇转速低于1000时几乎感觉不到声音。
T5820 的 FlexBay 如果安装了 U.2 NVMe 硬盘,主板会认为该区域出现了高发热组件。相比传统的 SATA/SAS 硬盘,NVMe 硬盘在满载时控制器温度可以轻松突破 70°C。为了防止 PCIe 控制器过热导致系统崩溃,BIOS 会强制提升 前置进风扇(Front Intake Fan) 的阶梯转速。
不过,目前我使用的消费级 铠侠KIOXIA EXCERIA G2 NVMe SSD存储 待机时温度很低
另外一个检查nvme温度的方法是使用 nvme-cli用户工具 :
nvme-cli 检查 smart-logsudo nvme smart-log /dev/nvme0
输出类似:
nvme-cli 检查 smart-logSmart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning : 0
temperature : 33 °C (306 K)
available_spare : 100%
available_spare_threshold : 5%
percentage_used : 0%
endurance group critical warning summary: 0
Data Units Read : 984340 (503.98 GB)
Data Units Written : 1127849 (577.46 GB)
host_read_commands : 4741677
host_write_commands : 7632558
controller_busy_time : 15
power_cycles : 70
power_on_hours : 2504
unsafe_shutdowns : 22
media_errors : 0
num_err_log_entries : 137
Warning Temperature Time : 0
Critical Composite Temperature Time : 0
Thermal Management T1 Trans Count : 0
Thermal Management T2 Trans Count : 0
Thermal Management T1 Total Time : 0
Thermal Management T2 Total Time : 0