GPU(图形处理器)原本为游戏和图形渲染设计,但因为其大规模并行计算能力恰好契合深度学习的矩阵运算需求,成为了AI计算的核心硬件。
为什么AI需要GPU
- AI模型的核心运算是矩阵乘法(大量独立的乘加运算)
- GPU有数千个计算核心,可以同时处理这些运算(并行计算)
- CPU只有几个到几十个核心,串行处理速度远远不够
主流AI GPU
- NVIDIA H100/H200:数据中心主力,单卡80GB显存
- NVIDIA B200:2025年最新旗舰,性能是H100的2.5倍
- NVIDIA RTX 4090:消费级最强,24GB显存,适合个人开发者
- NVIDIA A100:上代数据中心主力,仍广泛使用
- Apple M系列:统一内存架构,适合推理和本地运行小模型
- 华为昇腾、寒武纪:国产AI芯片
显存的重要性
显存(VRAM)大小直接决定了能运行的模型规模。70B参数的模型需要约140GB显存(FP16),一张H100只有80GB,所以需要多卡并行或量化压缩。
2026年趋势
NVIDIA继续保持垄断地位,但AMD MI300X、Intel Gaudi 3等竞品开始获得份额。"推理"(而非训练)正在成为GPU需求的主要驱动力。