RagFlow深度文檔理解的新境界

RAGFlow的核心優勢在於其強大的深度文檔理解能力。通過結合先進的自然語言處理技術和大型語言模型，RAGFlow能夠深入解析各種複雜格式的文檔，包括PDF、Word和PowerPoint等。這種深度理解使得AI系統能夠更準確地回答用戶查詢，大大提升了問答系統的性能。

特性介紹

基於深度文檔理解，我們的系統能夠從各類複雜格式的非結構化資料中提取真知灼見，在無限上下文的場景下快速完成大海撈針測試。通過模板的文字切片技術，不僅智能而且可控可解釋，提供多種範本選擇並可視化調整。系統支援多種文件類型，包括Word、PPT、Excel、TXT、圖片、PDF、影印件等，全面優化的RAG工作流程能夠滿足從個人應用到超大型企業的需求，並提供易用的API，方便整合各類企業系統，最大程度降低幻覺風險，確保答案有理有據。

系統架構

畫面介紹

以下為登入畫面

模型設定介紹

在這邊設定要使用的模型的Token或者連線至本地端的Ollama，在這邊要注意的是，如果你的Ragflow是用docker起的，那麼就一定也要把ollama起在docker裡面，彼此才連線的到，不然就是要透過公開網址

知識庫設定介紹

接著可以來新增知識庫

在設定知識庫的解析方式時，設定正確的選項非常重要，如果你上傳的文件屬於純文字PDF，則要記得把layout recognize關掉

以下為純文字檔案卻打開layout recognize的解析狀況

沒有打開則可以正常解析全部的純文字內容

如果要解析的是圖檔、POWERPOINT這種需要先解析layout的，則應打開layout recognize，以下為需要打開layout recognize的一個範例，這個PDF的檔案皆為圖像，是使用OCR去判斷上面的文字的

聊天功能介紹

這邊有點類似GPT Plus的功能，可以設定很多不同的聊天助理，並且可以附註搜尋到的檔案的文本，也可以針對每一個聊天助理設定要搜尋的知識庫

圖功能介紹

我們可以在這邊客製化聊天的流程，做更進一步的機器人的進階設定，預設有下面這些不同的流程

可設定的元件包括知識檢索、生成回答、人機交互、問題分類、靜態訊息、是否相關、問題最佳化，並且可以直接運行來測試

每一個元件都可以設定使用的模型和相關提示

預設的客服的流程，有點可怕，如果知識庫裡面沒有相關的文件，就會無限迴圈耶:D

文件管理介紹

從這邊可以看到我們上傳的所有文件的檔案夾