甚麼是生成式人工智能?
生成式人工智能是人工智能的一個先進分支,使機器能夠創造新的原創內容,如文字、圖像、音樂甚至程式碼。
生成式人工智能是人工智能的一個分支,利用基於深度學習(神經網絡)的模型,經過龐大數據集訓練來創造新內容。這些模型學習文字、圖像、音頻或其他數據中的模式,從而能根據用戶提示產生原創輸出(如文章、圖像或音樂)。
換言之,生成式人工智能是從「零開始」生成媒體,而非僅僅分析或分類現有數據。此處的圖示說明生成模型(中間圓圈)如何位於神經網絡內部,而神經網絡是機器學習及更廣泛人工智能領域的一部分。
生成式人工智能是基於深度學習模型,「根據其訓練數據生成高質量的文字、圖像及其他內容」,並依賴複雜的神經算法,從龐大數據集中識別模式以產生新穎輸出。
— IBM 研究
生成式人工智能如何運作
建立生成式人工智能系統通常涉及三個主要階段:
訓練(基礎模型)
一個大型神經網絡(通常稱為基礎模型)會在大量原始、未標記的數據上進行訓練(例如數TB的網絡文字、圖像或程式碼)。訓練過程中,模型通過預測缺失部分(例如填寫數百萬句子中的下一個詞)來學習。經過多次迭代,模型調整自身以捕捉數據中的複雜模式和關係。結果是一個能根據輸入自主生成內容的神經網絡。
微調
初步訓練後,模型會針對特定任務進行微調。這可能包括在標記範例上進行額外訓練,或採用人類反饋強化學習(RLHF),由人類評價模型輸出,模型據此調整以提升質量。例如,聊天機器人模型可用一組客戶問題及理想答案進行微調,使其回應更準確和相關。
生成
訓練和微調完成後,模型會根據提示生成新內容。它通過從學習到的模式中抽樣來實現——例如文字逐字預測,或圖像逐像素優化。實際上,「模型通過識別現有數據中的模式來生成新內容」。根據用戶提示,AI逐步預測一系列標記或圖像以創造輸出。
檢索與優化(RAG)
許多系統還使用檢索增強生成來提升準確度。此時模型在生成時會調用外部資訊(如文件或數據庫),以基於最新事實支持其回答,補充訓練時學到的內容。

主要模型類型與架構
生成式人工智能採用多種現代神經架構,各自適合不同媒體:
大型語言模型(LLMs)/變壓器
擴散模型
生成對抗網絡(GANs)
變分自編碼器(VAEs)
這些架構共同驅動當今各類生成工具。

生成式人工智能的應用
生成式人工智能已廣泛應用於多個領域。主要用例包括:
市場營銷及客戶體驗
- 自動撰寫市場推廣文案(博客、廣告、電郵)及即時生成個人化內容
 - 驅動先進聊天機器人,能與客戶對話甚至執行操作(如協助訂單)
 - 市場團隊可即時生成多個廣告版本,並按人口統計或情境定制
 
業務自動化
- 起草及審核文件
 - 快速撰寫或修改合約、報告、發票及其他文書工作
 - 減少人力在HR、法律、財務等方面的重複工作
 - 幫助員工專注於複雜問題解決,而非例行起草
 
軟件開發
- 自動生成及補全程式碼
 - 如GitHub Copilot等工具利用LLMs建議程式碼片段、修復錯誤或跨語言轉換
 - 大幅加快重複性編碼任務
 - 協助應用現代化(如將舊代碼庫轉換至新平台)
 
研究及醫療保健
- 為複雜問題提出新解決方案
 - 在科學與工程領域,模型可設計新藥分子或材料
 - AI可生成合成分子結構或醫學影像,用於診斷系統訓練
 - 在真實數據稀缺時創造合成數據(如醫學掃描)
 
創意藝術及設計
- 協助或創作藝術品、圖形及媒體
 - 設計師利用生成式AI製作原創藝術、標誌、遊戲素材或特效
 - 如DALL·E、Midjourney或Stable Diffusion等模型可按需創建插圖或修改照片
 - 生成多個圖像變體以激發藝術靈感
 
媒體及娛樂
- 生成音頻及視頻內容
 - AI可作曲、生成自然語音,甚至製作短視頻
 - 按選定風格製作旁白或根據文字描述創作音樂曲目
 - 從文字提示創建動畫片段,質量迅速提升
 

生成式人工智能的優勢
生成式人工智能帶來多項優勢:
效率與自動化
它能自動化耗時任務。例如,能在數秒內起草電郵、程式碼或設計構思,大幅加快工作速度,讓人專注於更高層次任務。
- 顯著提升生產力
 - 更快生成內容
 - 專注策略性工作
 
增強創意
它能激發創意,通過腦力激盪和探索多種變體。作家或藝術家可一鍵生成多個草稿或設計方案。
- 克服創意瓶頸
 - 多樣設計變體
 - 創意夥伴能力
 
更佳決策支持
通過快速分析大量數據,生成式AI能揭示洞見或假設,助力人類決策。
- 複雜報告摘要
 - 統計模式識別
 - 數據驅動洞察
 
個人化
模型能根據個人偏好定制輸出。例如,生成個人化市場內容、推薦產品或調整介面。
- 實時定制
 - 提升用戶參與度
 - 情境感知回應
 
總結來說,生成式人工智能能節省時間、激發創新,並以速度與規模處理大規模創意或分析任務。

生成式人工智能的挑戰與風險
儘管強大,生成式人工智能仍存在重大限制與風險:
不準確或虛構輸出(「幻覺」)
模型可能產生聽起來合理但錯誤或無意義的答案。例如,法律研究AI可能自信地引用虛假案例。這些「幻覺」源於模型並非真正理解事實,而只是預測可能的延續。
偏見與公平性
由於AI從歷史數據學習,可能繼承數據中的社會偏見,導致不公平或冒犯性結果(如偏頗的職位推薦或刻板印象的圖像說明)。
私隱與知識產權問題
若用戶輸入敏感或受版權保護的資料,模型可能在輸出中無意洩露私隱細節或侵犯知識產權。模型亦可能被探查以洩露部分訓練數據。
深偽技術與錯誤資訊
生成式AI能製作高度逼真的假圖像、音頻或視頻(深偽)。這些可被惡意用於冒充個人、散播虛假資訊或詐騙受害者。
缺乏可解釋性
生成模型通常是「黑盒子」,難以理解其產生特定輸出的原因或審核決策過程。這種不透明性使保證可靠性或追蹤錯誤變得困難。

生成式人工智能的未來
生成式人工智能正以驚人速度發展。採用率快速增長:調查顯示約三分之一組織已在某種程度上使用生成式AI,分析師預測到2026年約80%公司將部署此技術。專家預計該技術將為全球經濟帶來數萬億美元增長並改變產業。
ChatGPT問世後,生成式人工智能「成為全球現象」,並「預計通過大幅提升生產力為經濟增添數萬億美元」。
— Oracle 研究
未來展望
- 更多專業且強大的模型(針對科學、法律、工程等)
 - 更佳技術以保持輸出準確(如先進的RAG及更優訓練數據)
 - 生成式AI整合入日常工具與服務
 

主要重點總結
總結來說,生成式人工智能指的是通過學習數據創造新穎原創內容的AI系統。依靠深度神經網絡及大型基礎模型,它能撰寫文字、生成圖像、作曲等,推動變革性應用。
巨大優勢
- 增強創意與效率
 - 全天候可用
 - 巨大生產力提升
 
關鍵風險
- 錯誤與偏見問題
 - 深偽與錯誤資訊
 - 私隱與知識產權疑慮
 
雖然在創意與效率方面帶來巨大好處,但也伴隨錯誤與偏見等挑戰,需用戶妥善應對。隨著技術成熟,生成式AI將成為各行業不可或缺的工具,但負責任的使用對安全發揮其潛力至關重要。