你是否在想, 人工智能可以在沒有任何數據的情況下自行學習嗎?” 為了獲得最詳盡且合理的答案,讓我們與INVIAI一起深入探討這個話題。

首先,必須明白數據是所有現代機器學習人工智能模型的核心元素。人工智能無法在沒有輸入數據的情況下自行「建立」知識。

例如,在監督式學習中,人工智能從人類標註的大量數據集(圖片、文字、音頻等)中學習,以識別模式。

即使在非監督式學習中,人工智能仍需要原始未標註的數據,自行發掘數據中的隱藏結構或模式。

因此,無論使用哪種方法,人工智能都必須以數據為「養分」——無論是標註數據、自我標註數據(自監督)或來自真實環境的數據。沒有任何輸入數據,系統無法學習任何新知。

常見的人工智能學習方法

現時,人工智能模型主要透過以下方式學習:

  • 監督式學習:

人工智能從大量標註數據中學習。例如,要辨識圖片中的貓,需要數千張標註為「貓」或「非貓」的照片作訓練。此方法效果顯著,但需要大量標註工作。

  • 非監督式學習:

人工智能獲得未標註的原始數據,並在其中尋找模式或群組。例如,聚類算法會將具有相似特徵的數據集分組。此方法讓人工智能能夠「自我學習」並發現模式,無需人類指導。

  • 自監督學習:

這是大型神經網絡和大型語言模型(LLM)常用的變體,模型會自行為數據生成標籤(例如預測句子中的下一個詞或重建缺失部分),然後從中學習。此方法使人工智能能利用大量文本或圖片數據集,而無需人工標註。

  • 強化學習(RL):

人工智能(稱為代理)不依賴靜態數據,而是與環境互動,根據獎勵信號學習。維基百科定義強化學習為:“強化學習是教導軟件代理如何在環境中行為,通過告知其行動結果來實現學習。”

換言之,人工智能採取行動,觀察結果(如獎勵或懲罰),並調整策略以提升表現。

例如,DeepMind的AlphaZero並非由人類教導下棋,而是通過與自己對弈數百萬局,透過勝利信號發現新策略,無需依賴預先提供的專家數據集。

  • 聯邦學習:

針對敏感數據,如個人醫療影像,聯邦學習允許多個設備(或機構)協同訓練共享模型,而不需共享原始數據

Google解釋,聯邦學習中,全球模型會被發送到每個設備,在本地數據上訓練,然後只回傳模型更新——原始數據永遠不會離開設備。

如此一來,模型能從多地數據學習而無需集中數據,但人工智能仍需每台設備上的本地數據來學習。

  • 零樣本學習:

這是人工智能在沒有具體範例的情況下推斷新概念的能力。IBM定義零樣本學習為:“人工智能模型被訓練以識別或分類從未見過範例的物件或概念。”

零樣本學習依賴先前獲得的廣泛知識。例如,許多大型語言模型(如GPT)在龐大文本語料庫上預訓練。憑藉這些先驗知識,它們即使沒有明確範例,也能推理新概念。

雖然看似人工智能可以「無需數據學習」,但實際上大型語言模型仍依賴龐大的初始數據集來建立基礎語言能力。

總結來說,所有這些方法都表明人工智能無法在沒有任何形式數據的情況下學習。人工智能或許能減少對人工標註數據的依賴,或從經驗中學習,但絕不可能從無到有。

熱門人工智能學習方法

先進趨勢:從「經驗」而非靜態數據中學習

研究人員正探索讓人工智能減少依賴人類提供數據的方法。例如,DeepMind最近提出了「流」模型,在「經驗型人工智能」時代,人工智能主要從自身與世界的互動中學習,而非人類設計的問題和題目。

VentureBeat引述DeepMind的研究:“我們可以通過讓代理持續從自身經驗中學習——即代理在與環境互動時自行產生的數據……經驗將成為主要的提升手段,超越現今人類提供數據的規模。”

換句話說,未來人工智能將通過實驗、觀察和調整行動自行產生數據,類似人類從現實經驗中學習。

一個具體例子是Absolute Zero Reasoner (AZR)模型。AZR完全透過自我對弈訓練,無需人類輸入。它自行生成問題(如程式碼片段或數學題),解決問題,並利用結果(透過程式碼執行或環境反饋)作為獎勵信號來學習。

令人驚訝的是,儘管未使用外部訓練數據,AZR在數學和程式設計任務中表現卓越,甚至超越了使用數萬標註範例訓練的模型。這證明人工智能能透過不斷提出和解決挑戰,自行生成「數據集」。

除了AZR,還有許多研究探索人工智能的自主學習。智能代理系統能與軟件和虛擬世界(工具、網站、模擬遊戲)互動,累積經驗數據。

人工智能可被設計成自行設定目標和獎勵,類似人類養成習慣。雖然仍處於研究階段,但這些理念強調:沒有任何人工智能能真正在沒有數據的情況下學習,所謂的「數據」其實來自人工智能自身的經驗。

>>> 深入了解:

使用人工智能需要懂編程嗎?

人工智能會像人類一樣思考嗎?

前沿趨勢 - 從「經驗」而非靜態數據中學習


簡言之,現今的人工智能仍需依賴某種形式的數據來學習。不存在真正的「無數據人工智能」。

相反,人工智能可以減少對人類提供數據的依賴,例如使用未標註數據(非監督學習)、從環境反饋中學習(強化學習),甚至自行創造挑戰(如AZR模型)。

許多專家相信,未來人工智能將越來越多地通過自身收集的經驗來學習,使經驗成為幫助其提升的主要「數據」。

但無論如何,事實依然是:人工智能無法從無中學習;「數據」來源可能更複雜(如環境信號、獎勵),但始終需要某種形式的輸入,才能讓機器學習和進步。

外部參考資料
本文章內容參考以下外部資源整理而成: