🖥️

GPU (图形处理器)

Graphics Processing Unit
基础设施
硬件算力

GPU(图形处理器)原本为游戏和图形渲染设计,但因为其大规模并行计算能力恰好契合深度学习的矩阵运算需求,成为了AI计算的核心硬件。

为什么AI需要GPU

  • AI模型的核心运算是矩阵乘法(大量独立的乘加运算)
  • GPU有数千个计算核心,可以同时处理这些运算(并行计算)
  • CPU只有几个到几十个核心,串行处理速度远远不够

主流AI GPU

  • NVIDIA H100/H200:数据中心主力,单卡80GB显存
  • NVIDIA B200:2025年最新旗舰,性能是H100的2.5倍
  • NVIDIA RTX 4090:消费级最强,24GB显存,适合个人开发者
  • NVIDIA A100:上代数据中心主力,仍广泛使用
  • Apple M系列:统一内存架构,适合推理和本地运行小模型
  • 华为昇腾、寒武纪:国产AI芯片

显存的重要性

显存(VRAM)大小直接决定了能运行的模型规模。70B参数的模型需要约140GB显存(FP16),一张H100只有80GB,所以需要多卡并行或量化压缩。

2026年趋势

NVIDIA继续保持垄断地位,但AMD MI300X、Intel Gaudi 3等竞品开始获得份额。"推理"(而非训练)正在成为GPU需求的主要驱动力。