您是否在想, “人工智慧能在沒有任何資料的情況下自行學習嗎?” 為了獲得最詳盡且合理的答案,讓我們與 INVIAI 一起深入探討這個主題。
首先,重要的是要了解 資料是所有現代機器學習人工智慧模型的核心元素。人工智慧無法在沒有輸入資料的情況下自行「建立」知識。
舉例來說,在 監督式學習中,人工智慧從人類標註的大量資料集(圖片、文字、音訊等)中學習,以辨識模式。
即使在 非監督式學習中,人工智慧仍需原始、未標註的資料,自行發掘資料中隱藏的結構或模式。
因此,不論方法為何,人工智慧必須以資料為「養分」——無論是標註資料、自我標註資料(自監督學習),或是來自真實環境的資料。沒有任何輸入資料,系統無法學習任何新知。
常見的人工智慧學習方法
現今,人工智慧模型主要透過以下方式學習:
- 監督式學習:
人工智慧從大量標註資料中學習。例如,要辨識圖片中的貓,需要數千張標註為「貓」或「非貓」的照片來訓練。此方法效果顯著,但需要大量標註工作。
- 非監督式學習:
人工智慧獲得未標註的原始資料,並在其中尋找模式或群集。例如,分群演算法會將具有相似特徵的資料集分組。此方法讓人工智慧能夠「自我學習」並在無人指導下發現模式。
- 自監督學習:
這是大型神經網路與大型語言模型(LLM)常用的變體,模型會自行為資料產生標籤(例如預測句子中的下一個字或重建缺失部分),然後從中學習。此方法使人工智慧能利用龐大的文字或圖片資料集,無需人工標註。
- 強化學習(RL):
人工智慧(稱為代理人)不使用靜態資料,而是與環境互動,根據獎勵訊號學習。維基百科定義強化學習為:“強化學習是教導軟體代理人如何在環境中行為,透過告知其行動結果來學習。”
換句話說,人工智慧採取行動,觀察結果(例如獎勵或懲罰),並調整策略以提升表現。
例如,DeepMind 的 AlphaZero 並非由人類教導下棋,而是透過與自己對弈數百萬局,藉由勝利訊號發掘新策略,無需依賴預先提供的專家資料集。
- 聯邦學習:
針對敏感資料,如個人醫療影像,聯邦學習允許多個裝置(或組織)共同訓練共享模型,而不需分享原始資料。
Google 解釋,聯邦學習中,全球模型會被送到各裝置,在本地資料上訓練,僅將模型更新回傳,原始資料永遠不會離開裝置。
如此一來,模型能從多地資料學習而不集中資料,但人工智慧仍需各裝置上的本地資料來學習。
- 零樣本學習:
這是人工智慧在沒有特定範例的情況下推論新概念的能力。IBM 定義零樣本學習為:“人工智慧模型被訓練以辨識或分類從未見過範例的物件或概念。”
零樣本學習依賴先前獲得的廣泛知識。例如,許多大型語言模型(如 GPT)在龐大文字語料庫上預訓練。憑藉這些先前知識,它們能在沒有明確範例的情況下推理新概念。
雖然看似人工智慧能「無需資料學習」,但實際上大型語言模型仍依賴大量初始資料來建立語言基礎能力。
總結來說,所有這些方法都顯示人工智慧無法在沒有任何形式資料的情況下學習。人工智慧或許能減少對人工標註資料的依賴,或從經驗中學習,但絕不可能從無中學習。
進階趨勢:從「經驗」而非靜態資料學習
研究人員正探索讓人工智慧減少依賴人類提供資料的方法。例如,DeepMind 最近提出一種「串流」模型,在「經驗型人工智慧」時代,人工智慧主要從自身與世界的互動中學習,而非人類設計的問題與題目。
VentureBeat 引述 DeepMind 研究:“我們可以讓代理人持續從自身經驗中學習——也就是代理人在與環境互動時自行產生的資料……經驗將成為主要的提升手段,超越現今人類提供資料的規模。”
換句話說,未來人工智慧將透過實驗、觀察與調整行動,自行產生資料,類似人類從真實經驗中學習的方式。
一個具體例子是 Absolute Zero Reasoner (AZR) 模型。AZR 完全透過 自我對弈訓練,無需人類提供輸入。它自行產生問題(如程式碼片段或數學題),解決問題,並利用結果(透過程式碼執行或環境回饋)作為獎勵訊號來學習。
值得注意的是,儘管未使用外部訓練資料,AZR 在數學與程式設計任務中表現卓越,甚至超越使用數萬標註範例訓練的模型。這證明人工智慧能透過持續提出與解決挑戰,自行產生「資料集」。
除了 AZR,許多研究也在探索能自主學習的人工智慧。智慧代理系統能與軟體及虛擬世界(工具、網站、模擬遊戲)互動,累積經驗資料。
人工智慧可被設計成設定自身目標與獎勵,類似人類養成習慣。雖然仍處於研究階段,這些想法強調一點:沒有任何人工智慧能真正在沒有資料的情況下學習,而所謂的「資料」來自人工智慧自身的經驗。
>>> 深入了解:
簡言之,現今的人工智慧仍需某種形式的資料來學習。並不存在真正的「無資料人工智慧」。
人工智慧可以透過使用未標註資料(非監督式學習)、從環境回饋中學習(強化學習),甚至自行創造挑戰(如 AZR 模型),來減少對人類提供資料的依賴。
許多專家相信,未來人工智慧將越來越多透過自身累積的經驗學習,使經驗成為幫助其進步的主要「資料」。
但無論如何,事實依然是:人工智慧無法從無中學習;「資料」來源可能更為複雜(如環境訊號、獎勵),但機器學習與進步始終需要某種形式的輸入。