快訊!我的新書登上天瓏網路書店11月份暢銷榜第一名啦!看過的都說讚!歡迎大家前往訂購!
>>>> AI 職場超神助手:ChatGPT 與生成式 AI 一鍵搞定工作難題 <<<<

Retrieval Interleaved Generation (RIG)

什麼是RIG

RIG 是一種「檢索-生成交錯」的方法,強調在查詢的每一輪檢索和生成之間交替進行。例如,模型會先檢索資料來生成部分答案,再基於這個生成的內容進行下一輪檢索。這樣交替進行,逐步補充答案。

RIG 常用於需要多步驟推理的情境,模型可以通過分階段檢索、補充和生成,動態構建出全面的答案。

這種方法有助於模型在多輪次中漸進式地加深對複雜問題的理解,尤其適合多跳問題(multi-hop questions),即那些需要逐步從不同的資訊片段中推理出最終答案的問題。

參考資料:https://medium.com/@sahin.samia/retrieval-interleaved-generation-rig-using-llm-what-is-it-and-how-it-works-aa8be0e27bbc

RIG 的特點

RIG 沒有固定的結構,它更像是一種逐步探索的策略,不依賴任何預先分層或社群索引,而是即時根據每輪生成的結果來進行下一輪檢索。這讓 RIG 更加靈活,但在處理大型資料集時可能會相對較慢。其資訊生成過程是動態的,每次生成部分答案後再進行新一輪檢索和生成,因此不依賴於預先準備的摘要,而是根據查詢需要來即時擴充答案。

  1. 交錯的檢索與生成
    • 工作流程:RIG 採用「檢索-生成交替」的方法,將檢索和生成過程交替進行。每次檢索之後會產生一部分答案,然後基於這部分答案的內容來進行下一輪的檢索,如此循環進行。
    • 優勢:這種交錯的方式允許系統逐步構建出複雜問題的答案,尤其適合多跳推理或需要多階段補充資訊的查詢。
  2. 動態反應查詢需求
    • 查詢適應性:因為 RIG 在生成答案的同時持續檢索,讓系統能夠根據用戶查詢的上下文動態更新資訊,這對於需要逐步探索或回答不斷變化的問題尤其有用。
    • 分階段深入:RIG 可以隨著每一步的檢索生成,深入挖掘與查詢相關的資訊,使得答案在細節上越來越精確。
  3. 適用場景
    • RIG 適合處理需要多步推理的查詢,特別是在問題本身需要一系列資料支持才能回答時。由於每次生成答案之後都會進行新一輪檢索,因此非常適合需要補充性資訊或需要確認前一輪答案的情境。

Retrieval Interleaved Generation (RIG)範例查詢

用戶提出一個多步驟的問題:

「阿基米德是如何影響現代物理學的?」

這個問題相對複雜,因為它不僅涉及阿基米德的生平,還包括他的貢獻如何影響後來的物理學理論,需要多步驟推理來構建答案。

RIG 運作流程

  1. 初始檢索
    • 系統首先檢索與「阿基米德的生平」和「阿基米德的科學貢獻」相關的資訊,可能返回阿基米德在浮力原理、杠杆定律等方面的研究成果。
    • 基於這些資訊,系統生成初步答案,說明了阿基米德在物理學的基本貢獻。
  2. 第一輪生成後的檢索
    • 系統發現初步答案中提到阿基米德的浮力原理與力學理論,但用戶的問題涉及「現代物理學的影響」。
    • 系統根據這部分生成的答案,進一步檢索「浮力原理和杠杆原理如何被後代科學家採用或影響」,找到後來的物理學家(如伽利略、牛頓)如何受阿基米德影響的資料。
    • 系統基於這些新檢索的內容,生成更深入的答案,例如「阿基米德的浮力原理影響了伽利略對於物質運動的理解,而他的杠杆理論則是牛頓力學的基礎之一」。
  3. 第二輪生成後的進一步檢索
    • 針對剛剛生成的內容,系統可能發現「現代物理學」的範疇還包括熱力學、流體力學等,這些學科或許也受到阿基米德研究的啟發。
    • 系統進行下一輪檢索,探索阿基米德的理論在流體力學中的應用,並找到現代科學家如何利用這些理論進一步發展出來的資料。
    • 最後生成完整的答案,涵蓋阿基米德的研究如何一步步影響了現代物理學的各個分支,並點出具體的學科和科學家。

最終答案示例

「阿基米德對現代物理學的影響主要體現在他的浮力原理和杠杆原理。浮力原理為伽利略對於運動的研究提供了基礎,而杠杆理論則是牛頓力學的重要基石。此外,阿基米德的研究還在流體力學方面影響了後來的科學家,進一步推動了流體動力學的發展。」


17年資歷女工程師,專精於動畫、影像辨識以及即時串流程式開發。經常組織活動,邀請優秀的女性分享她們的技術專長,並在眾多場合分享自己的技術知識,也活躍於非營利組織,辦理活動來支持特殊兒及其家庭。期待用技術改變世界。

如果你認同我或想支持我的努力,歡迎請我喝一杯咖啡!讓我更有動力分享知識!