向量数据库是AI时代的新型数据库。传统数据库查"精确匹配",向量数据库查"语义相似"。
为什么需要向量数据库
- AI将一切转为向量(Embedding)后,需要高效存储和检索这些向量
- "找最相似的100个文档"这种查询,传统数据库无法高效完成
- 向量数据库使用ANN(近似最近邻)算法,在亿级向量中毫秒级检索
核心概念
- 向量索引:ANN算法的数据结构(HNSW、IVF、PQ等)
- 相似度度量:余弦相似度、欧氏距离、内积
- 元数据过滤:先过滤条件再向量搜索(如"只搜2026年的文档")
主流产品
- Pinecone:云原生,最易上手,按量付费
- Milvus(Zilliz):开源高性能,适合大规模部署
- Weaviate:开源,内置向量化和混合搜索
- Chroma:轻量级开源,适合原型和小项目
- Qdrant:Rust编写,性能优秀
- pgvector:PostgreSQL插件,无需额外部署
- Elasticsearch:传统搜索引擎 + 向量搜索
选择建议
- 小项目/原型 → Chroma或pgvector
- 中等规模/生产 → Pinecone(省心)或Qdrant(性价比)
- 大规模/企业 → Milvus
- 已有Elasticsearch → 直接加向量搜索插件