人工智能聊天機械人是軟件程式,能夠模擬人類對話。它們接收用戶以自然語言(文字或語音)輸入的內容,並嘗試提供有用的回應。根據微軟的定義,人工智能聊天機械人是能夠「模擬及理解人類對話」的應用程式。

例如,聊天機械人可以回答問題、提供建議,或自動化處理預約等任務。IBM 同樣解釋聊天機械人是「模擬人類對話」,並指出現代聊天機械人通常使用自然語言處理來解讀問題並構建答案。簡言之,人工智能聊天機械人讓人們能以日常語言與電腦互動,彌合人類語言與機器邏輯之間的鴻溝。

主要人工智能技術

人工智能聊天機械人結合了多項先進的人工智能技術:

  • 自然語言處理(NLP):使聊天機械人能夠解析及理解文字或語音輸入。例如,NLP 演算法會將句子拆解成詞元(單詞或短語),幫助機械人理解語法和語境。
  • 機器學習與深度學習:聊天機械人透過語言和對話範例學習,隨時間提升回應質素。系統通過訓練真實對話和書面文本,學習模式(例如常見問題及其回答方式)。
  • 大型語言模型(LLM):基於變壓器架構的大型神經網絡,訓練於龐大文本數據集。LLM 擁有數十億參數,能理解並生成類似人類的文字,有效捕捉跨語言及領域的語言模式。

這些技術結合起來,使聊天機械人能處理自由形式的問題並生成自然流暢的回答。

主要人工智能技術

聊天機械人如何理解用戶

當你發送訊息時,聊天機械人會應用自然語言理解(NLU)。它會將輸入拆解成詞元,並識別用戶的意圖(用戶想做什麼)及相關的實體(重要細節,如名稱、日期或地點)。

例如,若你問「明天巴黎的天氣如何?」,聊天機械人會識別意圖(天氣查詢)並提取實體(「巴黎」和「明天」)。現代人工智能聊天機械人利用深度學習,即使措辭非正式、含糊或有錯字,也能理解其含義。

聊天機械人如何理解用戶

訓練人工智能聊天機械人

人工智能聊天機械人由語言模型驅動,該模型在大量文本數據上訓練。訓練過程中,模型會處理數十億字詞,並根據上下文預測下一個詞

實際上,模型會讀取龐大的文本語料庫(例如整個維基百科或互聯網),從中學習語法、事實及常用短語。

訓練完成後,聊天機械人能透過逐字預測生成新回應,依據所學模式。重要的是,模型不會逐字記憶文本,而是將知識隱含於參數中。

因此,訓練良好的聊天機械人即使未曾見過特定問題,也能綜合所學模式給出答案。

訓練人工智能聊天機械人

變壓器與大型語言模型

圖示:變壓器網絡架構(左為編碼器,右為解碼器)。編碼器處理輸入,解碼器生成輸出。現代聊天機械人以變壓器作為核心架構。

變壓器網絡將詞語轉換為數值向量,並利用多頭注意力同時關聯句子中所有詞語,捕捉整體語境。

與舊有的序列模型(如 RNN)不同,變壓器能並行處理所有詞語,訓練速度更快。堆疊多層變壓器即形成大型語言模型(LLM),如 GPT-4 或 Google 的 PaLM。這些模型能在龐大規模上理解及生成語言,甚至能翻譯、摘要或回答問題,得益於其海量參數。

變壓器與大型語言模型

生成回應

聊天機械人回應時,可能採用以下兩種方法之一:

  • 基於檢索:聊天機械人從固定的回應庫(如常見問題資料庫)中選擇答案。早期聊天機械人多用此法。對於識別的問題,機械人直接返回預存答案。此方法對預期查詢快速且可靠,但無法處理資料庫外的問題。
  • 生成式(AI)模型:聊天機械人利用語言模型逐字生成新答案。每一步根據對話上下文預測最可能的下一個詞。此方法讓機械人能創造獨特回應,並回答從未見過的新問題。但由於依賴概率,偶爾會產生錯誤或無意義的答案。

生成回應

人類反饋與對話上下文

初步訓練後,聊天機械人常透過人類反饋進行微調。訓練者會審核機械人輸出,指導其改進——強化良好回答,修正錯誤。這個過程稱為「基於人類反饋的強化學習」(RLHF),幫助系統避免不當或偏頗內容。例如,人類可能標記某答案為「有害」或「離題」,讓模型學會避免此類回應。

人工智能聊天機械人亦會追蹤對話上下文,記住對話早期內容,令回應更連貫。例如,當你提出後續問題時,機械人能理解你指的是之前的話題並作出相應回答。這種狀態記憶支持多輪對話,令互動更自然。

人類反饋與對話上下文

人工智能聊天機械人範例

許多熟悉的虛擬助理都是人工智能聊天機械人。蘋果的Siri及亞馬遜的Alexa以語音指令回應,而谷歌的Gemini及 OpenAI 的ChatGPT則以文字對話。企業亦在網站和應用程式中部署聊天機械人,處理客戶查詢、安排預約或引導購物。所有這些系統均依賴相同的核心人工智能技術來處理語言並生成回應。

人工智能聊天機械人範例

挑戰與限制

人工智能聊天機械人功能強大,但並非完美。由於它們總是嘗試回答,有時會產生幻覺——自信地提供錯誤或誤導資訊。正如一位專家所言,聊天機械人本質上是「一台進行數學計算以產生文字的機器」,並不真正理解意義或意圖。

因此,聊天機械人可能在不同時間對同一問題給出不同答案,且可能誤解模糊或複雜的查詢。用戶應在重要情況下核實聊天機械人的輸出。

>>> 點擊了解更多:

什麼是機器學習?

甚麼是大型語言模型?

人工智能聊天機械人的挑戰與限制


人工智能聊天機械人結合自然語言處理、機器學習及大型語言模型運作。它們解析用戶輸入以偵測意圖,然後從固定答案中檢索或利用訓練模型生成新答案。

現代聊天機械人使用基於變壓器的大型語言模型,訓練於龐大文本數據集,使其能以類似人類的流暢度在廣泛主題上對話。隨著數據和訓練改進,人工智能聊天機械人將更強大,但本質上仍是統計工具,因此人類監督依然重要。

外部參考資料
本文章內容參考以下外部資源整理而成: