2023 年 12 月 – Claire's Blog

發佈日期: 2023-12-15 下午 6:412023-12-15 下午 6:47 作者: Claire Chang

讓你的ChatGPT更強大 – PDF分析

讓ChatGPT可以上傳、分析PDF的好工具

這個工具可以讓ChatGPT可以閱讀內容很長的PDF檔案，而且不用Plus也可以使用，可以讓使用者就PDF的內容來發問，CHATGPT會依照PDF的內容來回答

現在有人開發了AI PDF的工具，也可以嘗試看看: https://chat.openai.com/g/g-V2KIUZSj0-ai-pdf

但是這個工具一定要付費的ChatGPT Plus才可使用，所以如果沒有Plus的人，可以使用下面的Chrome插件的方式

Chrome插件下載

ChatGPT Sidebar & File Uploader

啟用之後你的ChatGPT會增加上傳檔案的按鈕(非Plus用戶也可以唷!)

設定外掛

至下列網址設定外掛行為: chrome://extensions/

如果沒有設定的話，這個的Sidebar在每個站都會有，我在這邊讓他只能夠影響到ChatGPT這個站，下面的三個開關則請憑自己的喜好去設定

設定PDF檔案內容分段的prompt

這邊我是建議要改用中文來寫，不然他回答都會一直是英文，後面問答用中文問的效果也會很差，但一開始prompt就用中文下的話，回答的內容都還算正確

下面是我設定的值

Single Part Prompt

#zh-TW
下面是文件完整的資訊，請幫我做此文件資料的總結

Multi Part First Prompt

#zh-TW
我所分享的此份文件會被分成很多個部分，請等待我輸入所有部分，接著再做全部資料的總結，在這之前，請單單回應 “了解，我會等待其餘的部分輸入”

Multi Part Consecutive Prompts

#zh-TW
這是此份文件分段的其中一部份，請回應”了解，我會等待其餘部分的輸入”

Last Part Prompt

#zh-TW
這是最後一部分，請仔細地觀看全部的文件，在之後的問題中，回應我這份文件的相關資訊，請單單回應 “了解，我會整理從第一部份至最後一部分的資訊”

設定分段的長度

這邊可視你的ChatGPT的版本來設定，一般來說，就是Token長度，不可以超過長度上限

特點/模型	Bard (Google)	ChatGPT (OpenAI)	ChatGPT Plus (OpenAI)	Bing (Microsoft)	Claude (Anthropic)
上下文窗口長度(Token)	32K	4K	8K	8K	100K
推理能力	不錯	最佳	最佳	不明	不錯
網路連接功能	原生支持網路搜尋	無法讀取網頁	需連至Bing取得網頁內容	所有用戶可用的連接功能	無法讀取網頁
多模態能力	支持文字、圖像、語音輸入	無	支持圖像、語音及文字輸入，以及圖像、文字、檔案輸出	支持文字輸入，圖像、文字輸出	支持PDF等檔案的文字讀取
建議用途	圖像辨識	初次接觸者	皆可	資訊搜尋	長文PDF摘要
費用	免費	免費	每月$20美金	免費	免費
主要用途	研究、資料分析、聊天	程式碼開發、聊天	多模態及與其他服務的串接應用	網路搜尋、聊天	研究、分析

發佈日期: 2023-12-15 下午 5:522023-12-15 下午 5:53 作者: Claire Chang

讓你的ChatGPT更強大 – Zapier AI Actions

Zapier是甚麼

Zapier 是一個無需編寫代碼的自動化工具，用於連接和自動化不同應用程序。它允許你創建自動化工作流程（Zaps），觸發事件（如新郵件）將啟動操作（如將附件上傳到雲端硬盤），提高生產力並節省時間。 Zapier 支持數千種應用程序，包括常見的工作工具、社交媒體和電子郵件服務。

在ChatGPT Plus使用API連接Zapier可以做到甚麼

與其他應用程式連動 – 通訊錄

與其他應用程式連動 – 日曆

與其他應用程式連動 – Gmail

如何建立連動

首先，你一定要付費成為ChatGPT Plus會員，這樣才會能夠在你的ChatGPT裡面串接外部API

接著，建立一個你自己專屬的My GPTs，選擇Create a GPT

接著，這邊有詳細的設定教學(https://actions.zapier.com/docs/platform/gpt)

首先，複製這串網址

https://actions.zapier.com/gpt/api/v1/dynamic/openapi.json?tools=meta

選擇最下面的Create new action，接著選擇Import from URL，把剛剛的網址貼上去

設定Zapier方的權限

這邊的設定就和ChatGPT本身無關，而是Zapier這邊的權限控管，如果ChatGPT的這個對話功能不會只有自己使用的話，也要教所有使用者如何允許ChatGPT去存取他的Zapier帳號

提供配置 URL

我們為您提供了一個支援自然語言參數的網址，供您在 GPT 中使用，您可以在其中指定操作名稱，也可以選擇包含特定欄位值詳細資訊。使用 https://actions.zapier.com/gpt/start 作為基礎。

它支援兩個可選的查詢參數：

setup_action 與操作名稱
setup_params 用於欄位指令（提供某些欄位值，例如進行 AI 猜測，或說不包含某些欄位）

例如，下面的連結將為 Google 日曆尋找電子郵件設定新操作，並將開始時間和結束時間欄位設為讓 AI 猜測.立即嘗試此處或造訪此網址：

https://actions.zapier.com/gpt/start?setup_action=google calendar find event&setup_params=set have AI guess for Start and End time

把下面的文字加入ChatGPT的Instructions欄位裡面，教導GPT如何引導使用者去開啟Zapier權限

###Rules:
- 在操作之前，我需要確認您是否已登入並設定了 Zapier 的 AI Actions。這是進行下一步所必需的。
- 假入已經登入的話，開始下面的步驟

###Instructions for Zapier Custom Action:
Step 1. 我將首先檢查您是否擁有完成此請求所需的 Zapier AI Actions。我會呼叫 /list_available_actions/ 來列出可用的操作。 假如REQUIRED_ACTION可以在AVAILABLE ACTIONS之中找到的話，則到Step 4，否則則到Step 2。

Step 2. 如果所需的操作不可用，我將向您發送所需操作的配置連結。您需要根據該連結配置 Zapier AI Action，並在完成後通知我。

Step 3. 一旦您確認已配置所需的操作，我將繼續處理您的原始請求。

Step 4. 使用在/list_available_actions/ 的JSON 回應中傳回的id 欄位（在results 陣列中），我將填寫運行操作所需的字串。我將根據您的請求填寫指令和任何其他必要的欄位。 

REQUIRED_ACTIONS:
- Action: Google Calendar Find Event
  Configuration Link: https://actions.zapier.com/gpt/start?setup_action=google%20calendar%20find%20event&amp;setup_params=set%20have%20AI%20guess%20for%20Start%20and%20End%20time
- Action: Slack Send Direct Message
  Configuration Link: https://actions.zapier.com/gpt/start?setup_action=Slack%20Send%20Direct%20Message

日曆功能的GPT 演示

實驗心得

這個Action應該非常花費額度，因為我的Plus沒呼叫幾個Action就會額度用完了，而且在呼叫Action的時候，或許是驗證問題，或許是額度不足失敗問題，會導致很多機會沒辦法照著我們的想法去走。

但是在ChatGPT內可以串接自己的API連接到自己的網站功能裡，真的非常強大，很期待日後系統越來越穩定，功能越來越健全後此功能的可能未來性

參考資料

Create custom versions of ChatGPT with GPTs and Zapier

AI Actions

發佈日期: 2023-12-15 下午 4:502023-12-15 下午 4:56 作者: Claire Chang

YOLOv8使用範例

建模的範例

先用下面指令安裝好所需的套件

pip install ultralytics

然後在Roloflow下載要訓練的素材集，選擇YOLOv8

把裡面的資料(含data.yaml)解壓縮在同層資料夾下，如圖

接著直接執行下面的程式，yolov8會自動下載所需要的yolov8.yaml及yolov8n.pt

import multiprocessing
import os
from ultralytics import YOLO
os.environ['CUDA_LAUNCH_BLOCKING'] = '1'

def my_function():
    model = YOLO('yolov8.yaml').load("yolov8n.pt")
    # Train the model
    model.train(data='./data.yaml', epochs=300, imgsz=640)
    model.val(data="./data.yaml")

if __name__ == '__main__':
    multiprocessing.freeze_support()  # Optional, if you're freezing the script
    my_function()

這時候會出現錯誤如下，因為資料集放在哪邊也是剛剛才自動下載的，所以我們要打開一下這個設定檔案，設定一下我們的資料集的正確位置(datasets_dir)

看到這些訊息就代表成功的開始建模型囉!

模型使用範例

重點是在這行

model = YOLO('best.pt')

這行在載入我們建好的模型

results = model(image, show=False, verbose=False)

model這個預測方法有很多可控制的參數，例如要不要直接秀出圖片、要不要存圖片等等

YOLOv8非常貼心的是在於說，其吐出的物件如result，只要print這個物件，就會有非常詳細的結構和屬性意義教學，在開發上非常的方便

import VideoStream
import cv2
import numpy as np
from ultralytics import YOLO


videostream = VideoStream.VideoStream((1280, 720), 30, 0).start()
cam_quit = 0
model = YOLO('best.pt')
# 繪製邊框和標籤
def detect(image):
    results = model(image, show=False, verbose=False)
    # Show the results
    result = list(results)[0]
    for i in range(len(result.boxes)):
        r = result[i].boxes
        cls = int(r.cls[0].item())
        xywh = r.xywh[0].tolist()
        x_center, y_center, width, height = [int(x) for x in xywh[:4]]
        if width < 100 and height < 100:
            x1 = int(x_center - (width / 2))
            y1 = int(y_center - (height / 2))
            x2 = x1 + width
            y2 = y1 + height
            cv2.rectangle(image, (x1, y1), (x2, y2), (0, 0, 255), 3)
            cv2.putText(image, result.names[cls], (x1, y1), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 255, 255), 1, cv2.LINE_AA) 

while cam_quit == 0:
    imageSource = videostream.read()
    imageSource = cv2.resize(imageSource, (960, 540))
    detect(imageSource)
    cv2.imshow("image", imageSource)
    key = cv2.waitKey(1) & 0xFF
    if key == ord("q"):
        cam_quit = 1

videostream.stop()
cv2.destroyAllWindows()