NVIDIA Multi-Instance GPU(MIG) 架构

NVIDIA多实例GPU(Multi-Instance GPU, MIG)技术扩展了 NVIDIA H100, NVIDIA A100 Tensor Core GPU 和 A30 Tensore Core GPU的性能和价值:

  • MIG可以将 单个GPU 划分为多达 7个实例

    • 每个实例完全隔离: 具有独立的高带宽内存、缓存和计算核心

    • 支持从最小到最大的每个工作负载

    • 确保服务质量保证(guaranteed quality of service (QoS))为独立每个用户提供计算加速

  • 优化GPU使用率

    • MIG提供了不同实例大小的灵活性: 可以为每个工作负载配置合适大小的GPU实例,最终优化利用率并最大化数据中心投资

  • 运行并发工作负载

    • MIG 使 推理、训练和高性能计算(HPC) 工作负载能够在具有确定性延迟和吞吐量的 单个GPU同时运行

NVIDIA MIG技术和 NVIDIA Virtual GPU (vGPU) 辨析

参考