HyDE:用 LLM 生成假设性文档做检索
读完 LLM2Vec-Gen 后再翻它的 reference,绕不开 HyDE(Precise Zero-Shot Dense Retrieval without Relevance Labels,2022)。LLM2Vec-Gen 的训练目标本质上是把 HyDE 的两步流程内化进 encoder,而 HyDE 的核心思路是:zero-shot 场景下与其让无监督 encoder 直接建模 query 和 document 的相关性,不如先让 LLM 根据 query 生成一段"假设性回答",再用 encoder 编码这段假答案去检索。