💎

NPU (神经网络处理器)

Neural Processing Unit

基础设施

硬件端侧AI

NPU（Neural Processing Unit，神经网络处理器）是专门为AI推理优化的处理器。与GPU不同，NPU专注于低功耗、高效率地运行已经训练好的AI模型。

NPU vs GPU vs CPU

CPU：通用计算，能跑AI但效率极低
GPU：并行计算之王，适合训练和云端推理，但功耗高
NPU：专为AI推理设计，功耗极低，适合端侧设备

为什么需要NPU

隐私：数据不出设备，本地处理
延迟：无需网络往返，毫秒级响应
成本：不消耗云端API费用
离线：无网络也能使用AI功能

主流产品

Apple Neural Engine：iPhone/iPad/Mac内置，16核，2026年达45 TOPS
Qualcomm Hexagon NPU：骁龙芯片内置，2026年旗舰达60+ TOPS
Intel NPU：酷睿Ultra内置，用于AI PC
AMD Ryzen AI：集成在Ryzen AI 300系列
华为昇腾：端侧NPU，麒麟芯片内置

TOPS（算力单位）

1 TOPS = 每秒1万亿次运算
手机NPU：30-60 TOPS
AI PC NPU：40-100 TOPS
云端GPU：1000+ TOPS

应用场景

实时语音转文字、实时翻译
相机AI增强（夜景、人像虚化）
本地运行7B-13B参数的小模型
Windows Recall、Apple Intelligence等系统级AI功能