🗄️

向量数据库 (Vector Database)

Vector Database

基础设施

数据库RAG

向量数据库是AI时代的新型数据库。传统数据库查"精确匹配"，向量数据库查"语义相似"。

为什么需要向量数据库

AI将一切转为向量（Embedding）后，需要高效存储和检索这些向量
"找最相似的100个文档"这种查询，传统数据库无法高效完成
向量数据库使用ANN（近似最近邻）算法，在亿级向量中毫秒级检索

核心概念

向量索引：ANN算法的数据结构（HNSW、IVF、PQ等）
相似度度量：余弦相似度、欧氏距离、内积
元数据过滤：先过滤条件再向量搜索（如"只搜2026年的文档"）

主流产品

Pinecone：云原生，最易上手，按量付费
Milvus（Zilliz）：开源高性能，适合大规模部署
Weaviate：开源，内置向量化和混合搜索
Chroma：轻量级开源，适合原型和小项目
Qdrant：Rust编写，性能优秀
pgvector：PostgreSQL插件，无需额外部署
Elasticsearch：传统搜索引擎 + 向量搜索

选择建议

小项目/原型 → Chroma或pgvector
中等规模/生产 → Pinecone（省心）或Qdrant（性价比）
大规模/企业 → Milvus
已有Elasticsearch → 直接加向量搜索插件