Promptriever是什么

Promptriever 是約翰斯·霍普金斯大學和Samaya AI聯合推出的新型檢索模型,能像語言模型一樣接受自然語言提示,用直觀的方式響應用戶的搜索需求。Promptriever 基于 MS MARCO 數據集的指令訓練集進行訓練,在標準檢索任務上表現出色,能更有效地遵循詳細指令,提高對查詢的魯棒性和檢索性能。Promptriever展示了將大型語言模型的提示技術與信息檢索相結合的潛力。

Promptriever  信息檢索模型,支持自然語言提示響應用戶搜索需求 第1張Promptriever的主要功能接受自然語言提示:能理解并響應自然語言形式的提示,讓用戶用更自然的方式表達搜索需求。動態調整相關性:根據用戶的具體指令動態調整搜索結果的相關性,例如,根據用戶對搜索結果的具體要求(如時間范圍、特定屬性)過濾和排序文檔。提高檢索魯棒性:基于理解和處理自然語言中的細微差別,增強模型對于不同查詢表達的魯棒性。提升檢索性能:基于提示進行超參數搜索,改善檢索結果的質量。Promptriever的技術原理雙編碼器架構:基于雙編碼器(bi-encoder)架構,用大型語言模型(如 LLaMA-2 7B)作為其背后的支持模型。指令訓練數據集:從 MS MARCO 數據集中篩選和發布新的指令級訓練集,在訓練中包含定義查詢相關性的自然語言指令。指令生成:用語言模型生成更具體的指令,指令能添加額外的要求或明確排除某些類型的文檔。指令負例挖掘:基于生成和過濾(query, passage)對,創建出在加入特定指令后相關性降低的負例,迫使模型學習如何根據指令調整相關性判斷。零樣本提示技術:基于零樣本提示技術進行超參數搜索,類似于語言模型的提示,改善檢索性能。Promptriever的項目地址GitHub倉庫:https://github.com/orionw/promptrieverarXiv技術論文:https://arxiv.org/pdf/2409.11136Promptriever的應用場景搜索引擎優化:提供更精準的搜索結果,基于理解用戶的自然語言查詢和指令,改善搜索體驗。智能助手和聊天機器人:理解和執行用戶的復雜指令,提供更個性化和上下文相關的回答。企業內部搜索:在企業知識庫中快速準確地檢索特定信息,提高工作效率。學術研究和文獻檢索:根據研究者的詳細查詢指令,檢索特定的學術論文和文獻資料。電子商務:根據用戶的購物需求和偏好,提供定制化的搜索結果和產品推薦。