-
尋找pretrain model的好地方
Continue Reading…: 尋找pretrain model的好地方https://paperswithcode.com/sota “SOTA” 是 “State-of-the-Art” 的縮寫,意為 “最先進技術”。在計算機科學和人工智能領域,SOTA模型指的是當前被認為是在某個特定任務或領域內表現最優秀的模型或方法。這些模型通常代表了當前領域內的最高水平,並在諸如自然語言處理、計算機視覺、語音識別等各種任務中發揮著重要作用。
-
如何把docker image推到AKS
Continue Reading…: 如何把docker image推到AKS請參考此說明: https://docs.docker.com/cloud/aci-integration/ 首先請登入Azure 會跳出瀏覽器登入Azure的帳號和docker做連接 接著創立aci的context 使用docker context ls可以檢視現在有哪些context 接著這樣就可以把image部屬上AKS了 推送自建的container https://learn.microsoft.com/zh-tw/training/modules/intro-to-containers/7-exercise-deploy-docker-image-to-container-instance 1.建立容器 2. 改名並推送上去
-
Swift初探
Continue Reading…: Swift初探條件編譯 這是 Swift 的條件編譯(Conditional Compilation)的一個示例,它允許你根據特定的條件選擇性地編譯代碼。在這段代碼中,它確定代碼是在 iOS 模擬器中運行還是在實際的 iOS 裝置上運行。 判斷變數是否存在 Swift的空值會是nil 什麼 是 Protocol 與 Delegate 1. Protocol 在 Swift 中,協議(Protocol)定義了一套規範或合約,但不提供具體的實現。任何型別(如 class、struct 或 enum)都可以遵循(implement)這些協議,並為協議中的要求提供具體的實現。 例如,我們可以定義一個表示可序列化對象的 Serializable 協議: 然後,我們可以讓某個 struct 或 class 遵循這個協議: 2. Delegate Delegate 是一種設計模式,允許一個物件將某些決策或功能外包給另一個物件。在 Swift 中,Delegate 通常是通過協議來實現的。這意味著當一個類想要成為另一個類的代理時,它必須遵循一個特定的協議。 例如,假設我們有一個…
-
常見的Computer Vision Tasks
Continue Reading…: 常見的Computer Vision Tasks下面是四種常見的計算機視覺任務的簡要介紹: 分類(Classification) 分類任務是將輸入圖像分為不同的類別或類別之一。例如,給定一張圖像,分類任務的目標是確定圖像中顯示的對像是什麼,比如貓、狗、汽車、飛機等。這通常涉及訓練一個分類器,以便它能夠識別圖像中的特定特徵並將其歸類到正確的類別中。 語義分割(Semantic Segmentation) 語義分割任務是為圖像中的每個像素分配一個類別標籤,從而實現像素級別的分類。與分類任務不同,語義分割不僅關注對象的類型,還考慮了對象的位置和邊界。這在許多應用中很有用,比如圖像分割、醫學圖像分析等。 語義分割是一種計算機視覺任務,旨在將圖像中的每個像素分配給預定義的語義類別。在語義分割中,每個像素都被標記為屬於某個特定的類別,如人、車、樹等。語義分割遵循像素級別的分類,因此通常使用像素級別的掩碼(即”masks”)來表示圖像中每個類別的區域。這些分割掩碼是二進製圖像,其中每個像素要嘛屬於某個類別,要嘛不屬於。 有名模型: U-Net 和實例分割最大的不同是他的輸入會是兩張圖片,一張為原圖,一張為掩碼的圖 目標檢測(Object Detection) 目標檢測任務涉及在圖像中識別並定位多個不同類別的對象。相比於分類任務,目標檢測不僅需要標識對象的類別,還需要確定它們的位置和邊界框。常見的目標檢測算法可以提供每個檢測到的對象的邊界框和類別信息。具代表性的演算法包括Faster R-CNN, YOLO, SSD等 這篇文章介紹了許多我們常用的物件偵測模型: https://zhuanlan.zhihu.com/p/38709522 實例分割(Instance Segmentation) 實例分割任務結合了目標檢測和語義分割的概念,不僅要對每個對象進行分類,還需要在像素級別區分出每個對象的邊界。實例分割旨在識別圖像中的每個獨立實例並為每個實例分配獨特的標籤,從而在一個圖像中區分出不同的對象。 例如: COCO SegmentationCOCO(Common Objects in Context)是一個廣泛使用的圖像識別和分割數據集,其中包含了多種物體類別的圖像以及每個圖像中物體的分割標註。 COCO Segmentation 數據集中的分割信息通常是用多邊形輪廓來表示物體的形狀。這種分割方法在標註上更靈活,可以準確地表示物體的複雜形狀,但同時也需要更多的標註工作。
-
使用ffmpeg濾鏡功能做影片合成
Continue Reading…: 使用ffmpeg濾鏡功能做影片合成下載ffmpeg https://ffmpeg.org/download.html 推一個時鐘文字的影片 ffmpeg的指令如下 使用虛擬鏡頭來推流 極低延遲播放串流 把虛擬鏡頭和某個線上串流做綠幕合成 更多詳細設置串流的方式 `-r` 轉成多少 fps `-y` (global) Overwrite output files without asking. `-i` 輸入檔案 `-c:v` video codec `-profile:v` video profile, streaming 用 baseline `-level:v` video level, streaming 用 3.1 `-preset:v` 編碼速度 streaming 用 ultrafast…
-
conda無法安裝套件,缺少OpenSSL解決方案
Continue Reading…: conda無法安裝套件,缺少OpenSSL解決方案錯誤訊息 Collecting package metadata (current_repodata.json): failed CondaSSLError: OpenSSL appears to be unavailable on this machine. OpenSSL is required to download and install packages. Exception: HTTPSConnectionPool(host=’conda.anaconda.org’, port=443): Max retries exceeded with url: /conda-forge/win-64/current_repodata.json (Caused by SSLError(“Can’t connect to HTTPS URL because…
-
資料增強好工具 – Albumentations
Continue Reading…: 資料增強好工具 – Albumentations官方資訊 GITHUB: https://github.com/albumentations-team/albumentations 官方文檔: https://albumentations.ai/docs/getting_started/transforms_and_targets/ 官方範例: https://github.com/albumentations-team/albumentations_examples/blob/master/notebooks/pytorch_semantic_segmentation.ipynb Albumentations介紹 Albumentations 是一個流行的計算機視覺數據增強庫,專門設計用於圖像分類、目標檢測、分割等任務。它提供了豐富的圖像增強技術,可以幫助您在訓練深度學習模型時提升模型的性能和魯棒性。 Albumentations 支持多種常用的深度學習框架,如PyTorch和TensorFlow。 以下是 Albumentations 的一些特點和功能: 使用範例 以下是一個使用 Albumentations 的簡單示例,演示如何將一些常見的增強操作應用於圖像數據: https://github.com/albumentations-team/albumentations_examples/blob/master/notebooks/pytorch_semantic_segmentation.ipynb
-
把標記轉成YOLO格式 – JSON2YOLO
Continue Reading…: 把標記轉成YOLO格式 – JSON2YOLOJSON2YOLO介紹 官方網站: https://github.com/ultralytics/JSON2YOLO JSON2YOLO 是一個用於將JSON格式標註數據轉換為YOLO格式標註數據的工具。 YOLO(You Only Look Once)是一種流行的目標檢測算法,它能夠在單次前向傳遞中同時預測圖像中的多個目標邊界框和類別。 在計算機視覺中,標註數據用於告知模型在圖像中的哪些位置存在目標以及目標的類別。 JSON和YOLO是兩種常用的標註數據格式,其中JSON通常用於描述目標的邊界框和類別,而YOLO格式則將目標的邊界框和類別信息結合在一起,以便更有效地訓練目標檢測模型。 JSON2YOLO 工具的主要目的是簡化將JSON格式標註數據轉換為YOLO格式標註數據的過程。通常,這種轉換涉及將目標的邊界框坐標映射到YOLO格式的網格單元,並將類別信息進行編碼。這使得標註數據能夠更好地適應YOLO模型的訓練和預測需求。 何時會需要做格式轉換 當我們使用別人的資料集,很有可能別人並不是使用YOLO格式去輸出資料集的,如果我們想要使用YOLO做訓練,勢必就得做標註資料的轉換,針對YOLO的狀況,就會需要使用這個轉換工具來將其他格式轉為YOLO標記格式 或者像是roboflow支持的輸出格式並不包含YOLO semgemt,所以也會需要先下載一般JSON格式的標記,再使用這個工具來做轉換 如何使用 接著再呼叫JSON2YOLO-master>python general_json2yolo.py 轉換好的資料就會出現在new_dir
-
好用的線上標記工具-Roboflow
Continue Reading…: 好用的線上標記工具-RoboflowRoboflow介紹 官網: https://roboflow.com/ 文檔: https://docs.roboflow.com/ Roboflow 是一個用於計算機視覺項目的平台,它旨在幫助開發人員和團隊更輕鬆地構建、訓練和部署計算機視覺模型。 Roboflow 提供了一系列工具和功能,使您能夠有效地處理圖像數據、訓練機器學習模型,並將這些模型集成到您的應用程序中。以下是 Roboflow 的一些主要特點和功能: 可讓團隊於線上共同標記圖片 這個功能是我覺得Roboflow大勝labelImg的原因,當團隊有很多人要負責標記時,這個工具可以非常方便的檢視、確認、共同標記。 可匯入現有的資料集及標記 Roboflow可以直接匯入以標記好的檔案,可以在線上去觀察以標記的資料的標記樣態,這些都是labelImg沒有辦法做到的,我們可以直接把含有標記和圖片的資料夾拉近網頁裡面,他會問你是否資料夾內的檔案全部放入,選擇Upload 就會可以看到已經標記好的狀況,我覺得這個功能在使用別人標記的圖檔時非常重要,才可以知道別人是如何去標記圖片的 線上做資料增強 Roboflow 提供了豐富的在線數據增強工具,用於處理圖像數據,改善數據集的多樣性,提高模型的泛化能力。數據增強是在保持圖像語義信息的前提下,通過應用各種變換和處理來生成多樣性的圖像,從而增加模型對於不同場景的適應能力。以下是 Roboflow 在線數據增強工具的一些功能和特點: 按Generate可以做圖像預處理並選擇資料增強的方法,不過這邊圖片要輸出的若太多,就會要升級方案,免費方案沒辦法輸出破千張 線上建模 選擇Deploy頁籤,可以線上建模,並可以看到在測試資料及上的偵測狀況,我覺得最酷的是這一切都完全使用點、按就可以達成,完全no code
-
YOLOv8模型訓練:深入解析性能指標與優化策略
Continue Reading…: YOLOv8模型訓練:深入解析性能指標與優化策略深入探討YOLOv8模型的訓練過程和性能評估。本文詳細解釋了如何使用預訓練模型進行遷移學習,分析了IoU、mAP等關鍵指標的含義,並通過Tensorboard可視化訓練結果。適合想要深入了解物件偵測模型訓練和評估的AI開發者和研究人員。
Search
About Me
17年資歷女工程師,專精於動畫、影像辨識以及即時串流程式開發。經常組織活動,邀請優秀的女性分享她們的技術專長,並在眾多場合分享自己的技術知識,也活躍於非營利組織,辦理活動來支持特殊兒及其家庭。期待用技術改變世界。
如果你認同我或想支持我的努力,歡迎請我喝一杯咖啡!讓我更有動力分享知識!