NPU(Neural Processing Unit,神经网络处理器)是专门为AI推理优化的处理器。与GPU不同,NPU专注于低功耗、高效率地运行已经训练好的AI模型。
NPU vs GPU vs CPU
- CPU:通用计算,能跑AI但效率极低
- GPU:并行计算之王,适合训练和云端推理,但功耗高
- NPU:专为AI推理设计,功耗极低,适合端侧设备
为什么需要NPU
- 隐私:数据不出设备,本地处理
- 延迟:无需网络往返,毫秒级响应
- 成本:不消耗云端API费用
- 离线:无网络也能使用AI功能
主流产品
- Apple Neural Engine:iPhone/iPad/Mac内置,16核,2026年达45 TOPS
- Qualcomm Hexagon NPU:骁龙芯片内置,2026年旗舰达60+ TOPS
- Intel NPU:酷睿Ultra内置,用于AI PC
- AMD Ryzen AI:集成在Ryzen AI 300系列
- 华为昇腾:端侧NPU,麒麟芯片内置
TOPS(算力单位)
- 1 TOPS = 每秒1万亿次运算
- 手机NPU:30-60 TOPS
- AI PC NPU:40-100 TOPS
- 云端GPU:1000+ TOPS
应用场景
- 实时语音转文字、实时翻译
- 相机AI增强(夜景、人像虚化)
- 本地运行7B-13B参数的小模型
- Windows Recall、Apple Intelligence等系统级AI功能