-
AI技術於3D模型領域的應用
Continue Reading…: AI技術於3D模型領域的應用Meshy – 線上圖片轉3D模型fbx檔案 網站: https://www.meshy.ai/ Meshy 是您的 3D 生成式 AI 工具箱,用於輕鬆從文本或圖像創建 3D 資產,從而加速您的 3D 工作流程。使用 Meshy,您可以在幾分鐘內創建高品質的紋理和 3D 模型。 Meshy的功能 Meshy是一個創新的 3D 模型生成平台,提供以下強大的功能 文字轉紋理 (Text-to-Texture): 圖片轉紋理 (Image-to-Texture): 文字轉 3D 模型 (Text-to-3D): 圖片轉 3D 模型 (Image-to-3D): 探索社區資源 社區資源: https://docs.meshy.ai/web-app-interface#explore-community-resources 嘗試使用圖片產生3D模型 操作網址: https://www.meshy.ai/workspace/image-to-3d…
-
Stable Diffusion常用操作介面
Continue Reading…: Stable Diffusion常用操作介面Easy Diffusion 下載位置: https://easydiffusion.github.io/ 特色: 優點: 缺點: 相較於其他工具,客製化選項可能較少。 ComfyUI 下載位置: https://github.com/comfyanonymous/ComfyUI 特色: 優點: 缺點: Stable Diffusion web UI 下載位置: https://github.com/AUTOMATIC1111/stable-diffusion-webui 特色: 優點: 缺點: 相較於本地端軟體,速度可能較慢。 安裝指南 最終我選擇Stable Diffusion web UI,因為教學文章最多
-
Jōtai 介紹
Continue Reading…: Jōtai 介紹什麼是 Jōtai? Jōtai 是一個輕量級、易於使用的 JavaScript 狀態管理庫,特別設計來與 React 無縫整合。它提供了一種簡單而直觀的方式來管理應用程式中的狀態,並讓這些狀態在不同的組件之間共享。 Jōtai 的核心概念 Jōtai 的優勢 安裝Jōtai 基本用法 從同一元件讀取和寫入 當原子在同一元件中同時讀取和寫入時,為簡單起見,請使用組合 useAtom 鉤子。 從單獨的元件讀取和寫入 當僅讀取或寫入原子值時,可使用 useAtomValue 和 useSetAtom hooks 。
-
Dify:開源大語言模型應用開發平台
Continue Reading…: Dify:開源大語言模型應用開發平台探索Dify:一個強大的開源大語言模型應用開發平台。本文深入介紹Dify的核心功能,包括對話式AI設計、提示詞工程、知識庫管理和API集成等。了解如何利用Dify快速構建和部署自定義AI應用,適合開發者和企業用戶打造個性化LLM解決方案。
-
RagFlow深度文檔理解的新境界
Continue Reading…: RagFlow深度文檔理解的新境界探索RAGFlow:一款革命性的開源檢索增強生成(RAG)引擎。本文深入介紹RAGFlow的核心功能,包括深度文檔理解、多路召回查詢和知識庫管理。了解如何利用RAGFlow結合大型語言模型,提升AI問答系統的準確性和可靠性,適合開發者和企業用戶優化知識管理和資訊檢索流程。
-
RAGFlow: 檢索增強生成的開源引擎
Continue Reading…: RAGFlow: 檢索增強生成的開源引擎探索RAGFlow:一個革命性的開源檢索增強生成(RAG)引擎。本文深入介紹RAGFlow的核心功能,包括深度文檔理解、知識庫管理和大型語言模型集成。了解如何利用RAGFlow提升AI應用的問答能力,實現更精準的資訊檢索和生成。適合開發者和企業用戶打造先進的自然語言處理解決方案。
-
開源RAG網頁套件研究
Continue Reading…: 開源RAG網頁套件研究open-webui Github位置: https://github.com/open-webui/open-webui 工具介紹 Open WebUI 是一種可擴展、功能豐富且使用者友好的自託管 WebUI,旨在完全離線運行。它支援各種LLM運行器,包括 Ollama 和 OpenAI 相容的 API。有關更多資訊,請查看: https://docs.openwebui.com/ 主要功能 Hollama Github位置: https://github.com/fmaclen/hollama 線上DEMO: https://hollama.fernando.is 用於與 Ollama 伺服器通訊的最小 Web UI。 主要功能 LoLLMs Webui LoLLMs Webui是一個基於Web的用戶介面,用來運行和管理大型語言模型(Large Language Models,簡稱LLMs)。它提供了一個友好的界面,讓使用者能夠輕鬆地與各種大型語言模型互動,進行文本生成、對話、翻譯等操作。這個Webui通常用於研究和開發人員,需要處理自然語言處理任務的專業人員,或任何對語言模型有興趣的人。 lollms v6 支持文本生成,例如自動寫詩,並允許用戶在「遊樂場」應用中測試不同的文本完成任務。此外,用戶可以進行討論和創建自定義預設以應對特定任務。 主要功能 BionicGPT Github頁面: https://github.com/bionic-gpt/bionic-gpt BionicGPT…
-
EchoMimic – 人物圖片轉影片的開源模型
Continue Reading…: EchoMimic – 人物圖片轉影片的開源模型介紹EchoMimic EchoMimic 是一款開源 AI 工具,可以將人物圖片轉換為逼真的說話視頻。它採用了創新的肖像圖像動畫技術,能夠通過組合音頻信號和面部關鍵點來生成生動自然的視頻。 EchoMimic 的工作原理 例如這樣的圖片 加上這樣的音檔 可以合成這樣的影片 安裝教學 事前作業 接著下載EchoMimic 專案,並創建新的CONDA環境,安裝所需函式庫 接著到這邊下載FFMPEG: https://www.gyan.dev/ffmpeg/builds/ 此為一個範例的下載網址: https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z 接著將ffmpeg的exe的路徑加入環境變數的path當中,如果能夠在CMD裡面輸入ffmpeg看到以下回覆代表安裝成功 接著下載預訓練權重 然後修改configs/prompts裡面的yaml檔案 接著執行 python 就可以看見執行的狀態如下圖,最終產生的檔案會位於output資料夾下
-
文字轉語音的開源套件ChatTTS
Continue Reading…: 文字轉語音的開源套件ChatTTSChatTTS介紹 chatTTS 是一個開源的文本轉語音(Text-to-Speech, TTS)項目,旨在將文字內容轉換為接近人類真實聲音的語音輸出。該項目在GitHub上迅速獲得了大量關注,因其語音合成效果非常逼真,甚至超越了一些商用TTS服務。chatTTS使用了大量的語音數據進行訓練,目前提供的模型已能夠生成語氣、停頓和節奏都極其自然的語音,並且支持多種語言和音色的合成。該項目允許用戶在本地或雲端(如Colab)環境中運行,並提供了易於使用的整合包和腳本,方便用戶快速上手。 官方網站 Github項目地址: https://github.com/2noise/ChatTTS/tree/main 直接可使用的易用版本ChatTTS_colab: https://github.com/6drf21e/ChatTTS_colab 模型的優勢 ChatTTS安裝 Clone Repo 安裝相關套件 啟動 ChatTTS_colab下載 這個套件真的可以讓人很容易地使用ChatTTS,從官方Github的下載連結下載、解壓縮後,直接便可以使用 點選運行就可以跑出網頁操作介面了 以下為網頁介面的樣子,可使用音色抽卡功能挑選滿意的音色,並且下載該語音模型檔案 另外有Refine Text的功能,這個功能可以透過大語言模型,自動為所輸入的文字加上停頓或笑聲,或者我們也可以自己手動加上這個(使用特別的標籤[uv_break]或[uv_laugh]) 也可以透過文本來產生多個人的對話,用::來分隔”腳色”和”對話內容”,例如: 旁白::在一個風和日麗的下午,小紅帽準備去森林裡看望他的奶奶 接著按下步驟1提取腳色,右邊的腳色種子就會根據文本的腳色來出現在表格當中,接著我們可以填入預選好的種子編號以及相關語速、笑聲等設定,就可以將整段對話產生為一個音檔 此為開啟伺服器的python視窗,我們可以看到伺服器正在產生影片 模型產生的音檔試聽 也有整理過的音色評比網站,登入後可直接線上試聽不同的音色 https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker
-
適用於雲端的物件存儲系統 – Minio
Continue Reading…: 適用於雲端的物件存儲系統 – MinioMinio介紹 MinIO 是一個開源的分佈式物件儲存服務器,針對需要大規模數據基礎架構的用戶設計。它支持與 S3 API 的完全兼容,並以私有雲為目標從頭開始建立。MinIO 在全球範圍內擁有廣泛的用戶和開發者社群,並且在 GitHub 上有超過 16,000 個星標,以及在 Docker 上超過 2.19 億次的下載。 核心功能 部署教學 1. 下載和安裝 首先,訪問 MinIO 的 GitHub 頁面 下載最新的 MinIO 二進制文件。選擇適合您操作系統的版本進行下載並解壓。 2. 啟動 MinIO 服務器 在命令行中導航到 MinIO 二進制文件的位置,運行以下命令來啟動 MinIO 伺服器: 這裡 D:\ 是您想要 MinIO…
Search
About Me
17年資歷女工程師,專精於動畫、影像辨識以及即時串流程式開發。經常組織活動,邀請優秀的女性分享她們的技術專長,並在眾多場合分享自己的技術知識,也活躍於非營利組織,辦理活動來支持特殊兒及其家庭。期待用技術改變世界。
如果你認同我或想支持我的努力,歡迎請我喝一杯咖啡!讓我更有動力分享知識!