檢索增強生成如何改變知識管理（第 1 部分）

2025年3月9日

1. 簡介

每個公司都有無數的文件——產品指南、員工資訊、合約、內部政策等等。在分散的文件中快速找到答案既費時又低效。

想像一下由大型語言模型驅動的代理，您可以用簡單易懂的語言進行查閱，並立即從您的內部文檔中提取準確的答案。它可以提高生產力、降低成本並簡化繁瑣的流程。

為了實際展示這一點，我們為一家名為Insurellm的虛構保險公司建立了一個原型。透過模擬真實場景（從保單到索賠文件），我們的檢索增強聊天機器人可以快速、準確地處理各種查詢。

用戶痛點：
員工很難在數千份文件中找到他們需要的資訊。有時他們需要查看公司政策，或者可能需要產品和服務詳細資訊。即使他們找到了正確的文檔，它並不總是最新的，並且搜尋它會花費很長時間。
目標：
建立一個快速、準確的聊天機器人，可以根據公司最新的內部文件回答問題。

使用者互動：
- 我們與 Gradio 建立了一個網路介面，以便測試人員只需用自然語言輸入問題即可。
回饋:
- 聊天機器人可以立即提供有關產品和合約的答案，非常方便。根據數據，它可以為內部員工和外部用戶提供服務。但是，每當文件更新時，我們都需要重新運行向量化以確保系統獲取最新的資訊。

RAG（檢索增強生成）意味著在生成任何文字回應之前，系統會從向量資料庫中檢索與使用者查詢最相關的文字區塊，然後將這些文字區塊提供給 LLM。這使得最終的答案更加紮實和準確。

2.為什麼要使用LangChain內存？
這會保存對話歷史記錄，從而允許模型參考先前的問答以獲得更準確、更符合情境的回應。

3. 色度向量資料庫
一個儲存文字嵌入的開源向量資料庫，可以實現快速、可靠的文檔檢索。

4.可視化（t-SNE + Plotly）
提供了一種清晰的方法來了解高維嵌入如何分佈以及不同文件類型如何聚類。

整個過程如下：使用者輸入問題→系統查詢 Chroma 向量資料庫以尋找最相關的文字→LLM 讀取該文字並產生答案→使用者看到結果。

在這個研究計畫中，我們關注日常工作者的需求，旨在減少搜尋時間並提高人們獲取資訊的速度。透過使用 RAG、向量化和對話記憶模組，我們建立了檢索增強聊天機器人的原型。該系統可用於客戶支援、內部知識管理等，同時不斷擴大文件覆蓋範圍並改進模型。它可以幫助企業削減知識管理成本並提高服務品質和客戶體驗。