🗄️

向量数据库 (Vector Database)

Vector Database
基础设施
数据库RAG

向量数据库是AI时代的新型数据库。传统数据库查"精确匹配",向量数据库查"语义相似"。

为什么需要向量数据库

  • AI将一切转为向量(Embedding)后,需要高效存储和检索这些向量
  • "找最相似的100个文档"这种查询,传统数据库无法高效完成
  • 向量数据库使用ANN(近似最近邻)算法,在亿级向量中毫秒级检索

核心概念

  • 向量索引:ANN算法的数据结构(HNSW、IVF、PQ等)
  • 相似度度量:余弦相似度、欧氏距离、内积
  • 元数据过滤:先过滤条件再向量搜索(如"只搜2026年的文档")

主流产品

  • Pinecone:云原生,最易上手,按量付费
  • Milvus(Zilliz):开源高性能,适合大规模部署
  • Weaviate:开源,内置向量化和混合搜索
  • Chroma:轻量级开源,适合原型和小项目
  • Qdrant:Rust编写,性能优秀
  • pgvector:PostgreSQL插件,无需额外部署
  • Elasticsearch:传统搜索引擎 + 向量搜索

选择建议

  • 小项目/原型 → Chroma或pgvector
  • 中等规模/生产 → Pinecone(省心)或Qdrant(性价比)
  • 大规模/企业 → Milvus
  • 已有Elasticsearch → 直接加向量搜索插件