⏳
DIN: AI Agent Blockchain
中文
中文
  • 关于 DIN
    • ⏳ DIN 概述
    • 🛣️ 我们的历程
  • DIN 操作与介绍
    • 💡 市场与趋势分析
      • 当前数据趋势和市场概述
      • 当前AI趋势和市场概览
      • 市场中存在的差距和机会
    • 🏠 DIN 架构
      • 🔢 数据层:一切为了数据
        • AI 数据流
        • 数据收集
        • 数据验证
        • 数据向量化
        • 奖励机制
      • 服务层:AI 代理工具包
        • LLMOps
        • RAG(检索增强生成)
          • 混合搜索
          • 重排序
          • 检索
        • 注释回复
      • 应用层-生态及产品
        • Analytix
        • xData
        • Reiki
  • DIN如何工作
    • ⛓️DIN区块链
      • 主网
      • 测试网
    • 🏦DIN基金会
      • 团队和顾问钱包
      • 做市&流动性钱包
      • 社区钱包
      • 投资人钱包
      • 生态钱包
    • 💰 代币经济学与应用
      • 代币分配
      • 空投
      • 合约
      • 生态系统内代币的使用案例
  • 如何参与
    • 🧲xData 介绍
    • ⚙️Chipper Node 介绍
      • 如何运行 Chipper 节点
      • xDIN农场
      • 节点委托
        • 撤销委托
        • 成为受托人
      • 节点统计
      • 相关智能合约地址
  • 🤑赚取$DIN
  • 💹质押$DIN
  • 🌉购买$DIN
  • ROADMAP
    • 🎆 2025 Forward
由 GitBook 提供支持
在本页

这有帮助吗?

  1. DIN 操作与介绍
  2. 🏠 DIN 架构
  3. 服务层:AI 代理工具包
  4. RAG(检索增强生成)

混合搜索

在大多数文本搜索场景中,确保最相关的结果出现在候选列表中是至关重要的。向量搜索和关键词搜索各自在搜索领域中具有自身的优势。混合搜索结合了这两种技术的优点,同时弥补了它们各自的不足。

在混合搜索中,向量索引和关键词索引会预先建立在数据库中。在用户输入查询时,系统会使用这两种搜索方法查找文档中最相关的文本。

“混合搜索”没有明确的定义;本文将其例举为向量搜索和关键词搜索的组合。然而,这个术语也可以应用于其他搜索算法的组合。例如,我们可以将用于检索实体关系的知识图谱技术与向量搜索相结合。

不同的搜索系统各自在文本(段落、句子、单词)中发现各种微妙联系方面表现出色,包括精确关系、语义关系、主题关系、结构关系、实体关系、时间关系和事件关系。可以肯定地说,没有单一的搜索模式适用于所有场景。通过整合多种搜索系统,混合搜索实现了各种搜索技术之间的互补性。

向量搜索

  • 定义:向量搜索涉及生成查询嵌入,然后搜索在向量表示上与这些嵌入最匹配的文本块。

  • TopK:此设置用于过滤与用户查询最相似的文本块。系统还会根据所选模型的上下文窗口大小动态调整块的数量。此设置的默认值为 3。

  • 得分阈值:此设置用于建立文本块选择的相似性阈值。这意味着只有超过设定得分的文本块才会被检索。默认情况下,此设置处于关闭状态,这意味着系统不会过滤检索文本块的相似性值。当激活时,默认值设为 0.5。

  • 重排序模型:在“模型提供者”页面配置重排序模型的 API 密钥后,可以在搜索设置中启用“重排序模型”。系统随后会对经过语义搜索检索到的文档结果进行语义重排序,以优化这些结果的顺序。一旦设置了重排序模型,TopK 和得分阈值设置仅在重排序步骤中有效。

全文搜索

  • 定义:全文搜索涉及索引文档中的所有单词,使用户能够查询任意术语并检索包含这些术语的文本块。

  • TopK:此设置用于选择与用户查询在相似性上最匹配的文本块。系统还会根据所选模型的上下文窗口大小动态调整块的数量。默认值设置为 3。

  • 重排序模型:在“模型提供者”页面配置重排序模型的 API 密钥后,可以在搜索设置中激活“重排序模型”。系统随后会对通过全文搜索检索到的文档结果进行语义重排序,以优化这些结果的顺序。一旦配置了重排序模型,TopK 和任何得分阈值设置将仅在重排序步骤中有效。

混合搜索

混合搜索通过同时执行全文搜索和向量搜索来运行。然后,它应用重排序步骤,从两种搜索结果中选择与用户查询最匹配的最佳结果。要有效使用此功能,需要配置重排序模型 API。

  • TopK:此设置用于过滤与用户查询最相似的文本块。系统会根据所使用模型的上下文窗口大小动态调整块的数量。默认值设置为 3。

  • 重排序模型:在“模型供应商”页面配置重排序模型的 API 密钥后,可以在搜索设置中启用“重排序模型”。系统将对通过混合搜索检索到的文档结果进行语义重排序,从而优化这些结果的顺序。一旦设置了重排序模型,TopK 和任何得分阈值设置仅适用于重排序步骤。

创建知识时设置搜索模式

要在创建知识库时设置搜索模式,请导航到“知识 -> 创建知识”页面。在那里,您可以在检索设置部分配置不同的搜索模式。

在提示工程中修改搜索模式

您可以通过导航到“提示工程 -> 上下文 -> 选择知识 -> 设置”页面,在应用创建过程中修改搜索模式。这允许在提示安排阶段对不同搜索模式进行调整。

上一页RAG(检索增强生成)下一页重排序

最后更新于2个月前

这有帮助吗?