快訊!我的新書今天開始可以在天瓏網路書店預購啦!歡迎大家前往訂購!

 >>>> AI 職場超神助手:ChatGPT 與生成式 AI 一鍵搞定工作難題 <<<<

  • ,

    AI大師論壇:人工智慧如何形塑人類未來

    YOUTUBE連結: https://www.youtube.com/watch?v=k7aFffQn5vU 本篇文章所有圖片皆來自於永齡基金會 YouTube 講者介紹 吳恩達(1976-,英文名:Andrew Ng),華裔美國人,是斯坦福大學計算機科學系和電子工程系副教授,人工智能實驗室主任。吳恩達是人工智能和機器學習領域國際上最權威的學者之一。吳恩達也是在線教育平台Coursera的聯合創始人(with Daphne Koller),DeepLearning.AI創始人。 他的其他分享 AI 大神吳恩達降臨──告訴你如何成為創新者 【ChatGPT 之父來台】Sam Altman、吳恩達重磅開講!談 AI 將如何顛覆世界 現在AI應用的狀況 兩個重要的概念 大模型的時代 從2010-2020,進入了GPU加速的大模型的時代。這是因為GPU的支持,讓模型可以學習更多的資料,這也讓生成式AI有機會發展起來 AI的革命 – 生成式AI的發展 CHATGPT利用不停地去預測下一個字來完成文字的生成,可以產生非常長的回應文字。吳恩達認為這樣的生成式模型會很大的改變現有的模型生態 生成式AI如何改變建模的過程 以前的監督式學習需要拿到label資料->建模->部屬現在則只需要指定prompt->部屬 吳恩達在現場分享,不同的 AI 分屬不同領域,包含生成式 AI、監督式學習等。他指出,過去 10 年是生成式 AI 的 10 年,如今生成式 AI 僅處於早期的成功階段,未來潛力仍大,如果要達到真正的通用,至少還要 30,甚至…

    Continue Reading…: AI大師論壇:人工智慧如何形塑人類未來

  • ,

    使用現有模型標記新圖片

    Auto Labeling 因為在標記時常會花費很多的時間和力氣,現在市面上有許多auto labeling的工具,例如前一陣子meta有發表一個模型,還引起注目叫做SAM: https://segment-anything.com/ 以下為一個簡單的使用範例 成果如下: Roboflow的智慧圈選工具 在Roboflow也有類似的智慧圈選工具,可以自動為我們圈選目標的形狀,使用方式如下 使用現有模型標記YOLO格式label 但是若我們想要使用既有的模型訓練一些新的圖片,在新的圖片,若要標記一些常見的物品,如汽車、人、機車等…。這些東西因為在YOLO這種模型,預設的偵測狀況就很不錯了,有的時候為了要讓標記更快速,可以使用現有模型把預測的結果轉為標記檔案,再匯入Roboflow等標記軟體檢視標記狀況並修正錯誤的標記,會可以使標記工作更輕鬆。 預測結果轉標記程式碼 這邊是預測的result的相關文件: https://docs.ultralytics.com/reference/engine/results/#ultralytics.engine.results.Results.tojson 我真的覺得yolov8做的很用心的點,在於他的說明超級清楚,尤其是在程式碼本身上面,我們可以單單藉由下面程式碼印出詳細返回的物件結構,然後就可以了解該如何取得我們所需的物件資訊 從API我們可以得知,若我們使用的是yolo-seg,則吐回的座標資訊可參考這個返回值 完整預測結果轉標記的程式範例 設定folder_path到images的資料夾,label會放到相對應的labels資料夾下 把YOLO格式轉為COCO格式 請參考此專案: https://github.com/Taeyoung96/Yolo-to-COCO-format-converter/tree/master

    Continue Reading…: 使用現有模型標記新圖片

  • ,

    尋找pretrain model的好地方

    https://paperswithcode.com/sota “SOTA” 是 “State-of-the-Art” 的縮寫,意為 “最先進技術”。在計算機科學和人工智能領域,SOTA模型指的是當前被認為是在某個特定任務或領域內表現最優秀的模型或方法。這些模型通常代表了當前領域內的最高水平,並在諸如自然語言處理、計算機視覺、語音識別等各種任務中發揮著重要作用。

    Continue Reading…: 尋找pretrain model的好地方

  • ,

    如何把docker image推到AKS

    請參考此說明: https://docs.docker.com/cloud/aci-integration/ 首先請登入Azure 會跳出瀏覽器登入Azure的帳號和docker做連接 接著創立aci的context 使用docker context ls可以檢視現在有哪些context 接著這樣就可以把image部屬上AKS了 推送自建的container https://learn.microsoft.com/zh-tw/training/modules/intro-to-containers/7-exercise-deploy-docker-image-to-container-instance 1.建立容器 2. 改名並推送上去

    Continue Reading…: 如何把docker image推到AKS

  • ,

    Swift初探

    條件編譯 這是 Swift 的條件編譯(Conditional Compilation)的一個示例,它允許你根據特定的條件選擇性地編譯代碼。在這段代碼中,它確定代碼是在 iOS 模擬器中運行還是在實際的 iOS 裝置上運行。 判斷變數是否存在 Swift的空值會是nil 什麼 是 Protocol 與 Delegate 1. Protocol 在 Swift 中,協議(Protocol)定義了一套規範或合約,但不提供具體的實現。任何型別(如 class、struct 或 enum)都可以遵循(implement)這些協議,並為協議中的要求提供具體的實現。 例如,我們可以定義一個表示可序列化對象的 Serializable 協議: 然後,我們可以讓某個 struct 或 class 遵循這個協議: 2. Delegate Delegate 是一種設計模式,允許一個物件將某些決策或功能外包給另一個物件。在 Swift 中,Delegate 通常是通過協議來實現的。這意味著當一個類想要成為另一個類的代理時,它必須遵循一個特定的協議。 例如,假設我們有一個…

    Continue Reading…: Swift初探

  • ,

    常見的Computer Vision Tasks

    下面是四種常見的計算機視覺任務的簡要介紹: 分類(Classification) 分類任務是將輸入圖像分為不同的類別或類別之一。例如,給定一張圖像,分類任務的目標是確定圖像中顯示的對像是什麼,比如貓、狗、汽車、飛機等。這通常涉及訓練一個分類器,以便它能夠識別圖像中的特定特徵並將其歸類到正確的類別中。 語義分割(Semantic Segmentation) 語義分割任務是為圖像中的每個像素分配一個類別標籤,從而實現像素級別的分類。與分類任務不同,語義分割不僅關注對象的類型,還考慮了對象的位置和邊界。這在許多應用中很有用,比如圖像分割、醫學圖像分析等。 語義分割是一種計算機視覺任務,旨在將圖像中的每個像素分配給預定義的語義類別。在語義分割中,每個像素都被標記為屬於某個特定的類別,如人、車、樹等。語義分割遵循像素級別的分類,因此通常使用像素級別的掩碼(即”masks”)來表示圖像中每個類別的區域。這些分割掩碼是二進製圖像,其中每個像素要嘛屬於某個類別,要嘛不屬於。 有名模型: U-Net  和實例分割最大的不同是他的輸入會是兩張圖片,一張為原圖,一張為掩碼的圖 目標檢測(Object Detection) 目標檢測任務涉及在圖像中識別並定位多個不同類別的對象。相比於分類任務,目標檢測不僅需要標識對象的類別,還需要確定它們的位置和邊界框。常見的目標檢測算法可以提供每個檢測到的對象的邊界框和類別信息。具代表性的演算法包括Faster R-CNN, YOLO, SSD等 這篇文章介紹了許多我們常用的物件偵測模型: https://zhuanlan.zhihu.com/p/38709522 實例分割(Instance Segmentation) 實例分割任務結合了目標檢測和語義分割的概念,不僅要對每個對象進行分類,還需要在像素級別區分出每個對象的邊界。實例分割旨在識別圖像中的每個獨立實例並為每個實例分配獨特的標籤,從而在一個圖像中區分出不同的對象。 例如: COCO SegmentationCOCO(Common Objects in Context)是一個廣泛使用的圖像識別和分割數據集,其中包含了多種物體類別的圖像以及每個圖像中物體的分割標註。 COCO Segmentation 數據集中的分割信息通常是用多邊形輪廓來表示物體的形狀。這種分割方法在標註上更靈活,可以準確地表示物體的複雜形狀,但同時也需要更多的標註工作。

    Continue Reading…: 常見的Computer Vision Tasks

  • 使用ffmpeg濾鏡功能做影片合成

    下載ffmpeg https://ffmpeg.org/download.html 推一個時鐘文字的影片 ffmpeg的指令如下 使用虛擬鏡頭來推流 極低延遲播放串流 把虛擬鏡頭和某個線上串流做綠幕合成 更多詳細設置串流的方式 `-r` 轉成多少 fps `-y` (global) Overwrite output files without asking. `-i` 輸入檔案 `-c:v` video codec `-profile:v` video profile, streaming 用 baseline `-level:v` video level, streaming 用 3.1 `-preset:v` 編碼速度 streaming 用 ultrafast…

    Continue Reading…: 使用ffmpeg濾鏡功能做影片合成

  • ,

    conda無法安裝套件,缺少OpenSSL解決方案

    錯誤訊息 Collecting package metadata (current_repodata.json): failed CondaSSLError: OpenSSL appears to be unavailable on this machine. OpenSSL is required to download and install packages. Exception: HTTPSConnectionPool(host=’conda.anaconda.org’, port=443): Max retries exceeded with url: /conda-forge/win-64/current_repodata.json (Caused by SSLError(“Can’t connect to HTTPS URL because…

    Continue Reading…: conda無法安裝套件,缺少OpenSSL解決方案

  • , ,

    資料增強好工具 – Albumentations

    官方資訊 GITHUB: https://github.com/albumentations-team/albumentations 官方文檔: https://albumentations.ai/docs/getting_started/transforms_and_targets/ 官方範例: https://github.com/albumentations-team/albumentations_examples/blob/master/notebooks/pytorch_semantic_segmentation.ipynb Albumentations介紹 Albumentations 是一個流行的計算機視覺數據增強庫,專門設計用於圖像分類、目標檢測、分割等任務。它提供了豐富的圖像增強技術,可以幫助您在訓練深度學習模型時提升模型的性能和魯棒性。 Albumentations 支持多種常用的深度學習框架,如PyTorch和TensorFlow。 以下是 Albumentations 的一些特點和功能: 使用範例 以下是一個使用 Albumentations 的簡單示例,演示如何將一些常見的增強操作應用於圖像數據: https://github.com/albumentations-team/albumentations_examples/blob/master/notebooks/pytorch_semantic_segmentation.ipynb

    Continue Reading…: 資料增強好工具 – Albumentations

  • ,

    把標記轉成YOLO格式 – JSON2YOLO

    JSON2YOLO介紹 官方網站: https://github.com/ultralytics/JSON2YOLO JSON2YOLO 是一個用於將JSON格式標註數據轉換為YOLO格式標註數據的工具。 YOLO(You Only Look Once)是一種流行的目標檢測算法,它能夠在單次前向傳遞中同時預測圖像中的多個目標邊界框和類別。 在計算機視覺中,標註數據用於告知模型在圖像中的哪些位置存在目標以及目標的類別。 JSON和YOLO是兩種常用的標註數據格式,其中JSON通常用於描述目標的邊界框和類別,而YOLO格式則將目標的邊界框和類別信息結合在一起,以便更有效地訓練目標檢測模型。 JSON2YOLO 工具的主要目的是簡化將JSON格式標註數據轉換為YOLO格式標註數據的過程。通常,這種轉換涉及將目標的邊界框坐標映射到YOLO格式的網格單元,並將類別信息進行編碼。這使得標註數據能夠更好地適應YOLO模型的訓練和預測需求。 何時會需要做格式轉換 當我們使用別人的資料集,很有可能別人並不是使用YOLO格式去輸出資料集的,如果我們想要使用YOLO做訓練,勢必就得做標註資料的轉換,針對YOLO的狀況,就會需要使用這個轉換工具來將其他格式轉為YOLO標記格式 或者像是roboflow支持的輸出格式並不包含YOLO semgemt,所以也會需要先下載一般JSON格式的標記,再使用這個工具來做轉換 如何使用 接著再呼叫JSON2YOLO-master>python general_json2yolo.py 轉換好的資料就會出現在new_dir

    Continue Reading…: 把標記轉成YOLO格式 – JSON2YOLO


17年資歷女工程師,專精於動畫、影像辨識以及即時串流程式開發。經常組織活動,邀請優秀的女性分享她們的技術專長,並在眾多場合分享自己的技術知識,也活躍於非營利組織,辦理活動來支持特殊兒及其家庭。期待用技術改變世界。

如果你認同我或想支持我的努力,歡迎請我喝一杯咖啡!讓我更有動力分享知識!