Machine Learning

Machine Learning, Technology Research

使用Dify開發Agent聊天機器人

Claire Chang

Oct 16, 2024

什麼是Agent 參考資料：https://docs.dify.ai/zh-hans/guides/application-orchestrate/agent 智能助手（Agent Assistant），利用大語言模型的推理能力，能夠自主對複雜的人類任務進行目標規劃、任務拆解、工具調用、過程迭代，並在沒有人工干預的情況下完成任務。在Dify創建Agent 我們可以在Studio > Agent創建一個具備Agent功能的機器人在認識Agent之前，要先了解工具是什麼在工作流的地方，我們可以呼叫外部的API，在那邊，呼叫的動作是我們自己在工作流程中設定如何呼叫，但是如果流程不是固定的，而會隨著使用者的回應而改變，那麼工作流就會不堪用，就要改使用Agent，由大語言模型來幫忙判斷何時該呼叫那些外部API或那些功能在Dify裡面已經有很多預設的工具，但是很多時候如果不符合需求，我們就會需要設定自己的工具在Dify自己創建工具首先就是要寫一個API，關於API的格式，我在我的前一篇文章有分享過那要如何把這個寫好的API給Dify使用呢?這時候就要大推下面這個網址 https://chatgpt.com/g/g-TYEliDU6A-actionsgpt 基本上我就把我的API的程式碼整個貼給他，叫他幫我產生一個YAML檔案，噹噹噹~就完成啦!連解釋都大致正確喔! 在這邊創建自己的工具，然後回到剛剛在Studio > Agnet創建的機器人，在工具部分增加自己的工具，LLM會根據你在YAML裡面寫的工具說明(英文)和參數說明，自動產生相對應的資料去呼叫函數，非常的聰明!但也因為這樣，工具說明和參數說明一定要認真寫，千萬不要亂寫，會影響到呼叫的成功率

Continue Reading…: 使用Dify開發Agent聊天機器人
Machine Learning, Technology Research

Steve Comparison of LLMs

Claire Chang

Oct 15, 2024

About the author 這篇文章是由我的實習生Steve Wang所撰寫 More about Steve Wang: https://renickbell.net/students/steve-wang/doku.php?id=start Introduction Here the author performs a comparison of different LLM AI models. The goal is…

Continue Reading…: Steve Comparison of LLMs
Machine Learning, Technology Research

了解LLM的函數調用function calling

Claire Chang

Oct 10, 2024

什麼是Function calling 官方介紹文檔：https://platform.openai.com/docs/actions/introduction 中文介紹文檔：https://openai.xiniushu.com/docs/plugins/getting-started Function calling是一種技術，允許LLM根據對話內容自主選擇並調用預定義的函數。這些函數可以用來執行各種任務，例如查詢實時數據、執行計算、生成圖像等。函數調用是建立 LLM 驅動的聊天機器人或代理(agents)的重要能力，這些聊天機器人或代理需要檢索 LLM 的上下文或通過將自然語言轉換為 API 調用來與外部工具互動。功能調用使開發者能夠創建： Function Calling可以做到那些事情如何實現function calling 假如我們現在想要詢問某個地點的天氣，一般的LLM無法做到這件事情，因為訓練的數據集不會包括現在的即時數據。解決這個問題的方法是將LLM與外部工具結合。利用模型的Function Calling能力來確定要調用的外部函數及其參數，然後讓它返回最終的回應。假設一位用戶向模型提出以下問題：台北市今天的天氣如何要實現function calling，需要在LLM的接口中註冊函數，並將這些函數的描述和使用說明一同發送給模型。模型會根據上下文智能地選擇並調用適當的函數。以下是一個簡單的實現示例：這個範例會使用一個公共API：Weather.gov，要獲取預報，有兩個步驟：首先，ChatGPT…

Continue Reading…: 了解LLM的函數調用function calling
Machine Learning, Technology Research

在本機執行Breeze-7B-Instruct-v1_0

Claire Chang

Oct 3, 2024

甚麼是Breeze-7B-Instruct-v1_0 huggingface頁面：https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v1_0 線上DEMO: https://huggingface.co/spaces/MediaTek-Research/Demo-MR-Breeze-7B 聯發科的Breeze系列有好幾種不同的模型，在使用的時候要注意其微調順序首先就是Breeze-7B-Base 是 Breeze-7B 系列的基礎模型。而Breeze-7B-Instruct 源自基礎模型 Breeze-7B-Base，使得最終模型可以直接用於常見任務。 Ollama library上的breeze模型總是使用簡體中文回答我有嘗試使用Ollama在Library上面尋找別人訓練好的Library，但不太確定為什麼總是回答簡體中文，而無法好好使用繁體中文回應 https://ollama.com/search?q=breeze 我有嘗試過markliou/breeze-7b、ycchen/breeze-7b-instruct-v1_0、jcai/breeze-7b-32k-instruct-v1_0 其中markliou/breeze-7b是回繁體中文沒錯但總是沒在理我問什麼，而剩的都用簡體中文後來發現是問的問題的關係，以jcai/breeze-7b-instruct-v1_0為例，如果問的問題是台灣專屬的，那麼就會以繁體中文回覆，畢竟原本是以Mistral-7B-v0.1為基礎，如果後面的微調沒有微調到的資料，就仍會有簡體中文的出現，如果詢問台北有哪些地方好玩，則會都使用繁體中文自己將Hugging Face上的檔案匯入Ollama 所以我嘗試使用下面的Makefile，並將https://huggingface.co/MediaTek-Research/Breeze-7B-Base-v1_0的檔案放置至同資料夾內然後用中間有出了一些錯誤 panic: runtime error: index…

Continue Reading…: 在本機執行Breeze-7B-Instruct-v1_0
Machine Learning, Technology Research

在Ollama中載入自己建立的模型

Claire Chang

Oct 2, 2024

參考資料官方教學：https://github.com/ollama/ollama/blob/main/docs/import.md 網路教學：https://www.youtube.com/watch?v=fnvZJU5Fj3Q 基於已有的模型導入 Safetensors 權重首先就是建立一個Modelfile.txt 例如假如我是用https://ollama.com/markliou/breeze-7b這個做為基礎模型，然後自己建立的LORA微調檔案在data資料夾底下，則Modelfile.txt的內容如下：現在從創建 Modelfile 的目錄運行 ollama create，可以使用-f來指定Modelfile路徑，如果不指定就會在你cmd當前資料夾尋找：可以使用參數 –quantize來運行不同的量化級別如果你是下載別人的LoRA，而別人的LoRA用的是.bin檔案，則可以使用transformers庫來做轉換，轉成.safetensors 直接導入GGUF的模型 Ollama的From所導入的模型應為GGUF格式，可以透過像 llama.cpp 這樣的工具來將模型轉換為 ggml 或 gguf 格式。安裝llama.cpp 接著將下載的 .safetensors 模型放置於適當位置，然後開始轉換…

Continue Reading…: 在Ollama中載入自己建立的模型
Machine Learning, Technology Research

專門為繁體中文優化過的開源模型

Claire Chang

Oct 2, 2024

聯發科的Breeze-7B 模型介紹 HuggingFace網址: https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v1_0 DEMO網址: https://huggingface.co/spaces/MediaTek-Research/Demo-MR-Breeze-7B 聯發科的Breeze-7B模型是一個專為繁體中文和英文雙語環境設計的大型語言模型。由聯發科研究團隊開發的一個開源大型語言模型，基於Mistral-7B進行改進和優化。該模型擁有70億個參數，專門針對繁體中文和英文的語言處理進行了優化。 Breeze-7B主要特點模型比較模型名稱參數量開發者授權功能調用指令跟隨 Breeze-7B-Instruct-v1_0 7B MediaTek Research Apache 2.0 ❌ ✅ Breeze-7B-FC-v1_0 7B…

Continue Reading…: 專門為繁體中文優化過的開源模型
Machine Learning, Technology Research

介紹 OpenAI o1-preview

Claire Chang

Sep 15, 2024

官網介紹o1-preview 介紹 OpenAI o1-preview：https://openai.com/index/introducing-openai-o1-preview 首次瞭解：探索 GitHub Copilot 中的 OpenAI o1：https://github.blog/news-insights/product-news/openai-o1-in-github-copilot/ 在2024/9/12，OpenAI推出了o1-preview的模型，這個模型的最大特色就是具備有先進推理能力，可解決難題。測試顯示o1-preview在程式碼分析和優化方面效果良好。該模型能思考挑戰並能夠將複雜任務分解為步驟，這可以優化程式碼以解決性能問題，加速開發工作流程。透過這樣的思考流程，ChatGPT可以完成更複雜的程式撰寫任務，過去，我們仍會需要透過人的思考將任務拆細後一步一步請ChatGPT幫忙完成，再由工程師將任務功能組合起來，而現在o1-preview則自己就能夠具備有將複雜任務拆細的能力。從下圖可看見，ChatGPT的程式撰寫能力瞬間從11分進步到89分(圖片來源: https://openai.com/index/learning-to-reason-with-llms/) o1-preview 模型的新功能總覽隨著 o1-preview 模型的推出，這個模型在性能、功能和未來更新方向上展現了許多新亮點。 o1-preview 模型功能實測先說結論，真的非常的強，不論是產生程式、理解程式、修改程式，都和過去是完全不同等級的狀況！非常的厲害。這是我今天使用o1-preview 來製作一個HTML的俄羅斯方塊的對話紀錄，可以看到ChatGPT完美的完成任務，真的是沒有BUG的完整的遊戲，而且修改的動作也都非常的完美，真的可以靠指令達到我的許多要求。我覺得這樣的程度的模型是真的會影響到許多工程師的未來性。對話紀錄在此：https://chatgpt.com/share/66e6bcf1-4254-8005-a573-a250e1b51702…

Continue Reading…: 介紹 OpenAI o1-preview
Machine Learning, Technology Research

Coze：快速產生專屬於你的聊天機器人

Claire Chang

Sep 7, 2024

Coze是甚麼 Coze是ByteDance出來的一個AI聊天機器人開發平台，讓你不會寫程式也能建立自己的AI聊天機器人，在這個平台可以用拖拉的方式來完成創建、設定、發布、管理專屬於你的聊天機器人功能，並與多種平台如Line、Slack、Telegram等整合。這平台支持各種AI應用，像是客服、資訊助手或是其他智能工具。官方網站：https://www.coze.com/home Coze的主要優勢其主要優勢如下：可以直接詢問機器人如何使用Coze 在登入之後，Home這邊會有一個Coze的專屬客服機器人，透過詢問機器人問題，可以請機器人幫我們搜尋教學文檔。創建步驟詳細圖文教學最主要要創建自己的客服機器人我們可以按下左側的Personal進入創建介面： Coze的個人區域允許用戶管理他們的機器人、插件、工作流程、知識庫，以及其他個人化設定。這個區域有幾個主要標籤：例如透過以下Workflows創建範例就可以建立一個可以回覆我的相關背景資訊的客服機器人：上圖的工作流程包括了幾個主要的步驟和節點，來處理和回答用戶的輸入。整個工作流程通過這些互相連接的節點來自動化處理用戶輸入，生成並提供相關的回答。這種設計允許機器人以高效且靈活的方式回應用戶，並可以根據需要輕鬆地修改或擴展其功能。這樣的對話機器人可以直接經由簡單設定發佈到Coze Bot Store、Cici、Discord、Telegram、Messenger、LINE、Instagram、Slack、Lark和WhatsApp多種平台。下面為一個使用範例： Coze要如何收費? Coze提供多種收費方案，根據不同用戶的需求，從免費到高級的付費方案都有。收費方案大約有以下幾種：各個方案都提供不同的AI模型使用權限，例如GPT-3.5、Gemini 1.5 Flash、Claude 3 Haiku等，並根據模型的收取不同的信息額度。例如，使用GPT-40 mini會消耗比GPT-3.5更多的額度。…

Continue Reading…: Coze：快速產生專屬於你的聊天機器人
Machine Learning, StableDiffusion

ControlNet: 放大您的圖像控制能力

Claire Chang

Aug 19, 2024

探索ControlNet如何革新Stable Diffusion的圖像生成過程。學習姿勢控制、線稿生成、深度圖應用等技術,掌握AI圖像創作的新境界。深入了解ControlNet在Stable Diffusion中的應用,掌握AI圖像生成的精確控制技巧。本文詳細介紹ControlNet模型類型、使用方法與調參技巧。

Continue Reading…: ControlNet: 放大您的圖像控制能力
Machine Learning, StableDiffusion

ControlNet使用的錯誤排解

Claire Chang

Aug 18, 2024

無法載入ControlNet 錯誤訊息如下: *** Error loading script: face_manipulation_extras.pyTraceback (most recent call last):File “C:\Users\clairechang\stable-diffusion-webui-master\modules\scripts.py”, line 515, in load_scriptsscript_module = script_loading.load_module(scriptfile.path)File “C:\Users\clairechang\stable-diffusion-webui-master\modules\script_loading.py”, line 13, in load_modulemodule_spec.loader.exec_module(module)File “”, line…

Continue Reading…: ControlNet使用的錯誤排解