AI出現「幻覺」,目前主要是針對大型語言模型(LLM)。這種系統可以編寫出合理的複雜文字,並生成圖片、影像和電腦代碼等,也是聊天機器人ChatGPT、圖像生產軟件Midjourney的基礎。
大型語言模型的訓練原理,是系統經過海量文本訓練進行深度學習,從而預測不同詞彙可能出現的序列。大型語言模型出現「幻覺」,很可能是因為訓練數據和模型架構而產生,具體原因暫時未知,且難以追溯源頭。
目前的研究顯示,以下情況或導致「AI幻覺」產生:
1 過時、低質量、存在矛盾或傾向性的訓練數據在訓練過程中會誤導AI;
2 當AI模型與訓練數據過度匹配時,可能導致其無法適應新數據;
3 AI模型亦可能不能充分理解上下文,從而產生脫離情境的虛假結果。
目前科學界尚未完全了解「AI幻覺」,減少其出現的研究和改進仍在進行中。例如,通過採取保證訓練數據的時效性與高質量;根據人類反饋改進AI算法;引入自動糾錯機制等措施,可以緩解「AI幻覺」的出現。
领取专属 10元无门槛券
私享最新 技术干货