一、介紹人工智慧
這邊主要是在說明人工智慧演進的過程,其實人工智慧的概念第一時間是在1950年時,由圖靈所提出,定義為一個人透過鍵盤和另一個對象溝通,如果施測者無法分辨與之對話的對象是人還是機器的話, 這個機器就被認為擁有「智慧」
但這個時候人工智慧的實作方式還比較以符號邏輯(類似統計學這樣以符號代表抽象的概念)為主,但很難清楚的釐清人類的思考邏輯。後來專家系統時代,人類會嘗試針對每個領域的知識去化作一條條的規則
但是,人類所能表達的,遠比人類所知道的少(博藍尼悖論),因此我們很難很完整的把我們所知道的化作規則或思考邏輯來打造人工智慧。
從2010年至今,我們進入的資料至上的時代,也就是我們開始直接丟資料給電腦,由電腦去歸納、找出電腦自己看得懂的規則,這也是為什麼ChatGPT等生成式AI的結果帶有部分的不可控、不可預測性。
了解AI的演進過程可以讓我們了解當我們要選擇AI技術時,可能可使用的選擇。雖然2010年後的機器學習技術能夠做到最廣泛的通用人工智能,但是若我們的需求範圍較為侷限,或者需要非常高的可解釋性、準確性時,仍然可以考慮符號邏輯或專家系統的方式來實做。
這些演進的歷程都是現在生成式AI能夠出現的重要基礎,每一代之間的關係不是淘汰,而是一層層的進化。
二、基礎模型帶來AI再一次的革命
在這邊我強調了在ChatGPT出現之前的AI應用,大多都用在中、大型企業內部或智能相關產品的應用。但是ChatGPT出現之後,AI從產業研發進入全民有感,並且掀起了非常大的AI風潮。
這是因為基礎模型的出現,所謂基礎模型就是類似ChatGPT這樣用途可以非常廣泛,並且可以透過詞嵌入的方式,以非常快速簡單的prompt方式,打造不同的產品。
例如下圖中的GitHub Copilot、智慧錄音卡、Notion AI、AI心理諮商,其實都是使用ChatGPT的模型,卻可以使用在多種非常不同的應用場景上(心理安慰、生活便利、程式開發等不同用途)
這樣的一個基礎模型的出現,帶來開發AI應用的革命性變革,過去,有些AI應用程式可能需要我花上六個月、甚至一年的時間來建立,現在許多團隊可能一週就能完成
以ChatGPT的自製一個聊天機器人為例,現在只需要上傳一些機器人需要知道的文件資料、並且使用對話的方式指導機器人該如何正確回應,就可以擁有一個專屬的客製對話機器人
三、生成式AI相關的應用
有興趣的可以自行去研究、了解現在AI可以做到那些事情
文本生成(LLM)
圖像生成 (text-to-image)
音樂 / 聲音生成
程式碼生成
四、多模態應用
基礎模型另一個強大之處,在於可以結合視覺、聽覺、文字的輸入,以及對不同型態輸入資料的交叉理解,能夠讓AI朝【通用型人工智慧】更加靠近
五、善用AI為生產力的新動能
- ChatGPT: https://chat.openai.com/
- Bing: https://www.bing.com/
- Bard: https://bard.google.com/chat
- Claude: https://claude.ai/login?returnTo=%2F
特點/模型 | Bard(Google) | ChatGPT (OpenAI) | ChatGPT Plus (OpenAI) | Bing (Microsoft) | Claude (Anthropic) |
上下文窗口長度(Token) | 32K | 4K | 8K | 8K | 100K |
推理能力 | 不錯 | 最佳 | 最佳 | 不明 | 不錯 |
網路連接功能 | 原生支持網路搜尋 | 無法讀取網頁 | 需連至Bing取得網頁內容 | 所有用戶可用的連接功能 | 無法讀取網頁 |
多模態能力 | 支持文字、圖像、語音輸入 | 無 | 支持圖像、語音及文字輸入,以及圖像、文字、檔案輸出 | 支持文字輸入,圖像、文字輸出 | 支持PDF等檔案的文字讀取 |
建議用途 | 圖像辨識 | 初次接觸者 | 皆可 | 資訊搜尋 | 長文PDF摘要 |
費用 | 免費 | 免費 | 每月$20美金 | 免費 | 免費 |
主要用途 | 研究、資料分析、聊天 | 程式碼開發、聊天 | 多模態及與其他服務的串接應用 | 網路搜尋、聊天 | 研究、分析 |
AI成為生產力的新動能,用戶在人工智慧輔助下完成工作的效率要高得多