檢索增強生成 (RAG)

簡介

檢索增強生成 (RAG) 是 SeaChat 中一個進階功能，增強了知識檢索和 AI 助理互動的準確性。通過提供您調整查詢模式、選擇檢索方法和定義知識庫檢索數量的能力，優化了 AI 助理的性能。

SeaChat 中的 RAG 設置

檢索查詢模式

無論您需要全面的上下文、專注的互動，還是快速、精確的回應，SeaChat 靈活的查詢模式確保了優化的聊天體驗，以滿足您的偏好。

以下是客戶與停車場 FAQ AI 助理之間的示例對話，知識庫中包含數百個停車場的資料：

👨 (上一用戶提問)：西雅圖太空針塔附近有停車場嗎？

🤖️ (AI助理機器人回應)：是的，您可以停在位於 123rd Ave NE 的 ABC 停車場。該停車場有 50 個車位。停車費每小時 $10 起，全天最多 $60。

👨 (當前用戶提問)：我會在那附近工作，可以每月租一個停車位嗎？

前一用戶提問 → 機器人回應 → 當前用戶提問

通過結合對話的前三輪提供全面的上下文。在這種情況下，完整的對話（上一用戶提問 + 機器人回應 + 當前用戶提問）將用於查詢知識庫並生成機器人對當前用戶提問的下一個回應。

上一用戶提問 → 當前用戶提問

更加關注用戶的請求，不受機器人回應的影響。它包括最近兩個用戶輸入（上一用戶提問和當前用戶提問）來查詢知識庫並生成機器人對下一個回應。

當前用戶提問

只考慮用戶的最新提問，即當前用戶提問，用於生成機器人的下一個回應。這對於一次性對話或用戶頻繁切換主題的情況非常理想。然而，在多輪對話中討論相同主題時，它可能會忽略重要的上下文。

檢索方法

您可以通過選擇不同的知識庫檢索方法來優化知識庫檢索：

Keyword Search (關鍵字檢索)

根據用戶提供的關鍵字來匹配知識庫，以提供相關結果。當您有唯一標識符如產品名稱、地點、ID 等時，這種方法效果很好，但在用戶沒有說出精確的關鍵字時（例如使用同義詞或不同語言）可能會錯過。

Vector Search (向量檢索)

利用文本嵌入的能力來增強相關資料的檢索。向量檢索可以跨語言工作，即使沒有匹配的關鍵字也能檢索到相似的文檔。然而，對於稀有標識符如產品名稱、地點或 ID 可能會有困難。

Hybrid Search (混合檢索)

結合關鍵字檢索和向量檢索方法，優化資料檢索。

知識庫擷取計數

此欄位允許您指定要檢索的知識庫文件(片段)數量，以確保有效的資料檢索。理想的數量是很彈性的，取決於令牌限制和文檔類型。

知識庫擷取計數的考慮因素

參考知識庫文件(文件片段)太少

您可能會錯過關鍵資料，導致 GPT 的回應不完整或不準確。

參考知識庫文件(文件片段)太多

重要資料可能會被不相關的細節淹沒，使 GPT 更難提供準確的回應。

上下文限制

每次請求的上下文是有限制的。如果檢索到的文檔超過此限制，SeaChat 將使用在限制內能夠適應的文檔。

通過調整知識庫檢索數量，您可以優化資料深度和資源使用之間的平衡，確保準確且高效的回應。

知識庫搜索優化

SeaChat 現在提供一個名為知識庫搜索優化的進階功能，讓您能夠進一步提升檢索資訊的質量。此功能使 AI 能夠在生成回應前對初步搜索結果進行二次分析。

配置知識庫搜索優化

您可以在AI Agent 資訊的進階設定頁面中啟用此功能：

SeaChat 中的知識庫搜索優化設置

可選的知識庫優化指令

對於大多數用例來說，只需啟用此功能而無需任何附加說明就足夠了。系統將使用預設的優化策略自動優化搜尋結果。自訂指令是可選的，但可以顯著提高特定場景的效能。

為了更精確地控制 LLM 如何優化搜索結果，您可以在文本欄位中提供自定義指令。這些指令指導 AI：

如何評估文檔相關性
優先處理哪些類型的資訊
如何處理模糊查詢
針對您特定知識領域的特殊考慮

指令示例

以下是一些有效的優化指令示例：

“當用戶詢問產品規格時，優先考慮包含特定產品代碼的文檔。”
“對於停車相關查詢，專注於包含與用戶提及區域匹配的位置資訊的文檔。”
“處理技術支援問題時，優先考慮最新文檔而非舊版本。”
“對於多部分問題，確保包含能夠解答查詢所有部分的文檔。”
“總結對話歷史記錄時，如果可以從討論中推斷出分支名稱，請包括分支名稱，確保它反映用戶在上次查詢中想要的分支，即使沒有明確提及。”
“在識別相關文章時，排除那些與摘要中提到的分支不同的分支相關的文章，前提是摘要指定了分支名稱。”

知識庫搜索優化的好處

啟用此功能可以顯著提升您的 AI 助理性能：

提供更準確和相關的回應
減少複雜知識庫中的資訊過載
更有效地處理模糊查詢
提升對用戶問題的上下文理解
提供更簡潔和專注的答案

通過微調您的知識庫搜索優化設置，您可以創建一個更智能、更靈敏的 AI 助理，更好地理解和解決用戶的特定需求。

📌 範例 1：透過知識庫搜尋優化功能處理多分店資訊

想像你經營一間擁有五家分店的餐廳。在你的知識庫中，你使用試算表記錄了每家分店的菜單、服務細節、營業時間與優惠資訊。當使用者詢問特定分店的問題時，你會希望 AI 智能助理能回應出正確、對應該分店的資訊。

要提升 AI 助理對使用者問題的理解與回應品質，有兩個有效的方法可以強化知識庫的處理方式：

1. 在知識庫內容中標示分店名稱

在你的 Excel 試算表中，為每一列或每一格的內容加上該資訊所屬的分店名稱。

範例試算表：包含分店標籤的多分店知識庫

這樣可以幫助 AI 助理在閱讀知識庫內容時正確理解該資訊屬於哪一家分店，進一步提升回應的準確性與相關性。

2. 上傳試算表

透過 上傳試算表 卡片將此試算表上傳到您的知識庫。選擇此選項將表格中的每一行上傳為單獨的知識庫文件。

3. 使用知識庫搜尋優化功能過濾不相關資料

啟用知識庫搜尋優化功能，並加入自訂的優化指令，例如：從使用者的問題中擷取分店名稱。排除與該分店無關的文章或資料列。

有了這些指令，即使初步的知識庫搜尋結果涵蓋了多家分店，AI 助理也能自動篩選出與使用者查詢分店相關的內容，提供更精準、聚焦且有幫助的回應。

這樣的作法特別適用於：

內容交錯重疊的大型知識庫
擁有多個據點的企業或品牌
回答分店資訊需具高度準確性的場景

透過良好的知識庫結構（標示分店名稱）與搜尋優化邏輯結合，你可以打造一個更聰明、更貼近需求的 AI 助理。

📌 範例 2：使用知識庫搜尋優化管理產品資訊

假設您管理一個擁有數千種產品的電子商務平台。您的知識庫包含了多個試算表，記錄著詳細的產品資訊，包括規格、價格、庫存狀態和客戶回饋。當客戶詢問特定產品時，您希望 AI 助理能提供準確的產品專屬資訊。

1. 在知識庫條目中加入產品名稱

在試算表的每個儲存格中，加入產品名稱以清楚識別資訊：

範例試算表：附有產品專屬標籤的產品知識庫

這種結構化的試算表確保當 AI 助理處理知識庫時，能準確地將資訊與特定產品關聯起來。

2. 上傳試算表

透過 上傳試算表 卡片將此試算表上傳到您的知識庫。選擇此選項將表格中的每一行上傳為單獨的知識庫文件。

3. 設定知識庫搜尋優化指令

啟用知識庫搜尋優化功能，並加入以下具體指令：

從用戶的查詢中提取產品名稱。
優先考慮完全匹配的結果，其次才考慮產品變體或相關型號。
除非用戶特別要求比較功能，否則排除其他產品的資訊。

透過這些指令，您的 AI 助理可以：

識別正在討論的特定產品
專注於相關的產品細節
僅在適當時機包含相關產品資訊
在多次查詢中保持對同一產品的上下文理解

這種方法特別適用於：

擁有大量相似商品的產品目錄
需要精確產品資訊的技術支援場景
產品比較和推薦查詢
處理客戶對產品規格和可用性的詢問

透過實施這種結構，您的 AI 助理能夠有效地瀏覽大量產品資訊，並為客戶查詢提供準確且具有上下文關聯的回應。

檢索增強生成 (RAG)

簡介 #

檢索查詢模式 #

前一用戶提問 → 機器人回應 → 當前用戶提問 #

上一用戶提問 → 當前用戶提問 #

當前用戶提問 #

檢索方法 #

Keyword Search (關鍵字檢索) #

Vector Search (向量檢索) #

Hybrid Search (混合檢索) #

知識庫擷取計數 #

知識庫擷取計數的考慮因素 #

知識庫搜索優化 #

配置知識庫搜索優化 #

可選的知識庫優化指令 #

指令示例 #

知識庫搜索優化的好處 #

📌 範例 1：透過知識庫搜尋優化功能處理多分店資訊 #

📌 範例 2：使用知識庫搜尋優化管理產品資訊 #

簡介