💎

NPU (神经网络处理器)

Neural Processing Unit
基础设施
硬件端侧AI

NPU(Neural Processing Unit,神经网络处理器)是专门为AI推理优化的处理器。与GPU不同,NPU专注于低功耗、高效率地运行已经训练好的AI模型。

NPU vs GPU vs CPU

  • CPU:通用计算,能跑AI但效率极低
  • GPU:并行计算之王,适合训练和云端推理,但功耗高
  • NPU:专为AI推理设计,功耗极低,适合端侧设备

为什么需要NPU

  • 隐私:数据不出设备,本地处理
  • 延迟:无需网络往返,毫秒级响应
  • 成本:不消耗云端API费用
  • 离线:无网络也能使用AI功能

主流产品

  • Apple Neural Engine:iPhone/iPad/Mac内置,16核,2026年达45 TOPS
  • Qualcomm Hexagon NPU:骁龙芯片内置,2026年旗舰达60+ TOPS
  • Intel NPU:酷睿Ultra内置,用于AI PC
  • AMD Ryzen AI:集成在Ryzen AI 300系列
  • 华为昇腾:端侧NPU,麒麟芯片内置

TOPS(算力单位)

  • 1 TOPS = 每秒1万亿次运算
  • 手机NPU:30-60 TOPS
  • AI PC NPU:40-100 TOPS
  • 云端GPU:1000+ TOPS

应用场景

  • 实时语音转文字、实时翻译
  • 相机AI增强(夜景、人像虚化)
  • 本地运行7B-13B参数的小模型
  • Windows Recall、Apple Intelligence等系统级AI功能