当你想让大模型"记住"你的私有数据时,向量数据库就是那个关键拼图。
为什么需要它
大模型的知识是训练时固定的,它不知道你公司的内部文档、最新的产品手册。RAG(检索增强生成)通过在提问时检索相关文档片段,补充给模型作为上下文。
而检索的核心就是语义搜索——不是关键词匹配,而是理解"意思相近"。这就需要向量数据库。
主流选择
| 数据库 | 特点 |
|---|---|
| Milvus | 开源,性能强,适合大规模 |
| Pinecone | 全托管,上手快 |
| Chroma | 轻量,适合原型开发 |
选哪个取决于你的场景。原型阶段用 Chroma,生产环境考虑 Milvus 或 Pinecone。