向量检索 - 片场手记

向量检索（Vector Search）是一种基于语义相似度的搜索技术，通过将文本、图片等数据转换为高维向量（Embedding），并在向量空间中计算相似度，从而找到与查询内容最相关的信息。相比传统的关键词匹配，向量检索能更好地理解语义，解决一词多义、多词一义等问题。

Dify 是一个开源的 LLM 应用开发平台，其向量检索功能主要用于构建 RAG（检索增强生成）流程，典型应用包括：

文本向量化
- 使用预训练的嵌入模型（如 OpenAI 的 text-embedding-ada-002、Hugging Face 的模型等），将文本转换为向量。
- Dify 支持多种嵌入模型，用户可灵活选择或自定义。
构建向量数据库
- 将文档切分为片段（chunks），生成向量后存储到向量数据库（如 Milvus、Pinecone、Weaviate 等）。
- Diy 提供与主流向量数据库的集成，简化数据索引流程。
相似性检索
- 用户输入查询时，先将查询文本转换为向量，再从向量数据库中检索出最相似的 Top-K 结果。
- 支持多种相似度计算方式（余弦相似度、欧氏距离等）。
RAG 增强生成
- 将检索到的相关文本作为上下文输入大模型（如 GPT-4、Claude 等），生成更精准、可靠的回答。