ExpressCard eGPU

备注

待实践

我的古老的 ThinkPad X220笔记本具备一个非常有意思的接口 ExpressCard 54 :

ExpressCard 走的也是 PCIe 2.0 x1，性能与内部 MiniPCIe 相同: 5Gbps
业界有非常成熟的 EXP GDC (ExpressCard 版) 转接座，在淘宝上购买 EXP GDC笔记本外置外接PCI-E独立显卡BEAST系列Expresscard接口 只需要不到 RMB 250
- 外接 Nvidia Tesla P4 GPU运算卡 (75W 功耗，8GB GDDR5 显存，单槽半高)物理接口是 PCIe 3.0 x16，而 X220 的 ExpressCard 仅提供 PCIe 2.0 x1: 带宽从理论上的 15.75 GB/s 缩减到了约 500 MB/s
- ExpressCard 接口本身不供电。你必须通过转接座外接一个 12V DC 电源（如戴尔 DA-2 8PIN 电源或普通 PC 电源）

WDDM 与 TCC 模式

备注

本段尚未实践，后续计划在在ThinkPad X220笔记本上运行FreeBSD 实践通过 ExpressCard 连接 Nvidia Tesla P4 GPU运算卡，目前仅整理记录一些可能的操作步骤

Tesla 系列卡与 GeForce 系列最大的区别在于它没有显示输出接口:

模式问题：P4 默认通常工作在 TCC 模式（计算模式），用于 CUDA 计算
FreeBSD 现状：在 FreeBSD 下，NVIDIA 驱动对 TCC 模式支持较好: 适合跑 AI 模型（如 ollama / ref:lama.cpp ）或进行视频转码（ ffmpeg ）
sway - i3兼容Wayland compositor 桌面加速: 因为 P4 没有输出接口，它必须通过 DMA-BUF 将渲染好的帧传回 Intel 核显进行显示（类似 Optimus 技术）。在 FreeBSD 的 Wayland 环境下，这种跨显卡渲染的配置极其复杂
内核模块加载：确保 /boot/loader.conf 加载了必要的模块

内核模块

nvidia-modeset_load="YES"
nvidia_load="YES"

PCIe 资源分配： X220 年代久远，BIOS 的 PCI Bus 资源池很小。外接 8GB 显存的卡可能会触发 "Error 12"（资源分配不足），可能需要调整 hw.pci.honor_msi_blacklist 或相关内核参数，甚至需要刷 “高级版 BIOS” 来开启 "4GB Decoding"（不确定 X220 官方 BIOS 是否支持）
驱动安装: FreeBSD NVIDIA驱动
机器学习环境需要探索 FreeBSD 15环境bhyve中实现NVIDIA GPU passthrough 和在FreeBSD Linux Jail中运行NVIDIA Cuda / 在FreeBSD环境Rocky Linux Jail中运行NVIDIA Cuda

AI 推理:

模型加载阶段（一次性）： 8GB 的模型通过 PCIe 2.0 x1 传输。
- PCIe 2.0 x1 实际有效带宽约为 400-500 MB/s。
- 传输一个 6GB 的模型（量化版）大约需要 12-15 秒。这在开发环境下完全可以接受。

推理阶段（计算密集型）：一旦模型驻留在 Nvidia Tesla P4 GPU运算卡的 8GB 显存中，计算过程主要发生在 GPU 核心与显存之间。

P4 显存带宽高达 192 GB/s，这才是决定生成速度的关键。

只有少量的 Token（文本）数据通过 PCIe 总线传回给 CPU。

EXP GDC Beast (ExpressCard 版本)：这是目前最稳定的 X220 转接方案
- 淘宝上能够找到 ExpressCard 34 和 ThinkPad X220笔记本的 ExpressCard 54 连接金手指部分（Connector）宽度是完全一样的（都是 34mm 宽），不过需要在插卡后配套使用一个 34mm 转 54mm 的塑料稳定支架(其实就是一个卡在 34mm 卡侧边的塑料片，填补那 20mm 的空隙)
- 插拔注意：X220 的插槽是弹出式的（按一下弹出来）。插入 34mm 卡时，对准插槽右侧的导轨插入（通常靠右对齐），确保金手指完全吃进接口
外置电源：Tesla P4 峰值功耗约 75W，使用一个 120W 以上的 DC 电源适配器

FreeBSD 下的 NVIDIA 驱动支持 CUDA: