CPU p-state¶
P-state
是CPU频率和操作点电压的结合。
处理器性能和主频是直接相关的。增加主频可以增加处理器性。反之,即哪个低主频则降低性能。如果将主频减半,计算任务就会降低一半速度。不过,如果降低主频,但是增加CPU使用率并且降低idle时间百分比,则会影响电池使用时间。
引入 P-state
的两个主要原因是:
降低尖峰时热能负载
降低能耗
Linux内核的能耗和性能平衡¶
idle的不同级别¶
runtime idle
suspended
off
激活电源管理¶
CPU激活电源管理(cpufreq) - P-states 或 DVFS
设备激活电源管理 - 一些设备支持PCIe ASPM
GPU则自我管理
选择正确的p-state¶
调节器(Governors)反映了用户策略决定:
intel_pstate
只支持powersave
和performance
策略,其他驱动支持更多策略( ACPI cpufreq )intel_pstate
是一个调节器,并且hw驱动是一个整体,所以传统上这个governor是和hw驱动隔离的。
intel_pstate
“performance” 策略总是选择最高的p-state
完全不考虑节能
intel_pstate
“powersave” 策略尝试平衡性能和节能intel_pstate
驱动监视使用率并能够决定何时增加或减少p-state
。这个方式和其他governors类似。
p-state
划分¶
P0 - P1
是 turbo范围P1 - Pn
是 保证范围(操作系统可见的状态)Pn - LFM
是 温度控制范围
P-state的硬件协作¶
共享相同电压域的CPU核心对一个
p-state
投票每个CPU核心的最高
p-state
赢得投票APERF/MPERF必须用于查看哪个
p-state
被批准
acpi_cpufreq
已经被废弃(Intel处理器不建议使用 ACPI cpufreq (OS control mode),而是采用CPU硬件电源管理
P-state的操作系统限制¶
能力/使用率不足以决定何时伸缩
采样率可能导致不正确的使用计算
伸缩性的收益不明确
硬件P-state(HWP)¶
Intel Speed Shift Technology (HWP)
最有效的主频是运行时计算(Pe) - 基于系统和负载
EPP表示Energy Performance Perference(能源执行性能优先) - 将决定如何强化算法(Pa) - 基于系统,负载,OS
算法将在Pa和Pe之间操作
HWP
即 Hardware P-State
Linux实现¶
intel_pstate
驱动检查CPU flag默认所有白名单CPU都激活
只支持自动模式
没有EPP输出
Min和Max pstate是通过min和max perf_pct sysfs文件获取
参考¶
Intel CPUs: P-state, C-state, Turbo Boost, CPU frequency, etc.
Balancing Power and Performance in the Linux Kernel Intel开源中心提供的有关能耗和性能平衡的介绍文档
cpu-freq/intel-pstate.txt 内核
intel_pstate
驱动说明,也是 Balancing Power and Performance in the Linux Kernel 的一个完整阐述What exactly is a P-state Intel developer’s Manual: Chapter14 - power and thermal management