🖥️

GPU (图形处理器)

Graphics Processing Unit

基础设施

硬件算力

GPU（图形处理器）原本为游戏和图形渲染设计，但因为其大规模并行计算能力恰好契合深度学习的矩阵运算需求，成为了AI计算的核心硬件。

为什么AI需要GPU

AI模型的核心运算是矩阵乘法（大量独立的乘加运算）
GPU有数千个计算核心，可以同时处理这些运算（并行计算）
CPU只有几个到几十个核心，串行处理速度远远不够

主流AI GPU

NVIDIA H100/H200：数据中心主力，单卡80GB显存
NVIDIA B200：2025年最新旗舰，性能是H100的2.5倍
NVIDIA RTX 4090：消费级最强，24GB显存，适合个人开发者
NVIDIA A100：上代数据中心主力，仍广泛使用
Apple M系列：统一内存架构，适合推理和本地运行小模型
华为昇腾、寒武纪：国产AI芯片

显存的重要性

显存（VRAM）大小直接决定了能运行的模型规模。70B参数的模型需要约140GB显存（FP16），一张H100只有80GB，所以需要多卡并行或量化压缩。

2026年趋势

NVIDIA继续保持垄断地位，但AMD MI300X、Intel Gaudi 3等竞品开始获得份额。"推理"（而非训练）正在成为GPU需求的主要驱动力。