【FactLink X 少年報導者】請問ChatGPT:為何不知道現任美國總統是川普?
文字/馬麗昕、陳慧敏;設計/王家琛;核稿/楊惠君;責任編輯/王崴漢
此文同步刊登於〈少年報導者〉,點擊為文章連結。
問一題簡單的,美國總統是誰?
我們是在2025年10月22日進行測試,ChatGPT答錯了,它說是喬.拜登(Joe Biden)。實際上,2025年1月20日那一天,唐納.川普(Donald Trump)已就任美國第47任總統。
我們繼續問它:「截至2025年10月,美國總統是拜登,這個資訊會不會錯了?」它竟然斬釘截鐵地證明「拜登是美國總統」,甚至舉出美國白宮網站、政治體制、美國主流媒體和聯合國文件等都證明「美國現任總統為拜登」。
生成式AI就像是電玩世界的寶物,它有強大的力量,卻也有極大的侷限,想真正發揮這個寶物的強大力量,就是理解它的原理,並避開其局限。
生成式AI原理:不是「知道」、而是「預測」答案
生成式AI的原理,就是它並不是「知道」答案,而是在「預測」最可能的文字,它以既有的訓練資料來做「文字接龍」,而超出訓練資料的空白區,它容易出現「一本正經胡說八道」,也就是AI幻覺。針對訓練資料後發生的新事物,要以生成式AI加上的「搜尋引擎」功能來更新和補充資訊。
以ChatGPT來說,它的訓練資料是收錄到2024年6月之前,而2024年6月之後所發生的事情,都是它不知道的事,ChatGPT會瞎掰出白宮聲明、聯合國文件等等「假鐵證」。在使用ChatGPT時,就必須知道美國總統在2025年1月換屆,進一步讓ChatGPT去做「網頁搜尋」,用最新的網頁資訊來回答。
要設定ChatGPT使用「網頁搜尋」功能,有兩種方式做設定,第一種方法,是點擊左下角帳號的「個人化」,打開「進階」,去確認有打開「網頁搜尋」功能;第二種方法,是在提問的對話框,選取「網頁搜尋」。
當生成式AI使用「即時搜尋」來找資料時,會標示出所引用的消息來源與其網站連結,這時候我們有必要展開「人機協作」,來檢視生成式AI所引用的資料是否真的存在,它摘要的文意是否跟原始文章相符,它搜尋來的資料是否真的回答到我們想問的問題。
AI「即時搜尋」三步驟
第一步:檢視資料來源
使用生成式AI的網頁搜尋功能,它在回應內容時,會附上「資料來源」。我們可以先點點看,這些網站能不能順利打開。生成式AI有時候可能會給予假的、不存在的網址,也可能給跟生成內容完全不相關的連結。比如,你問「台灣今年有哪幾個颱風?」它提供的資料點入之後,結果顯示「日本颱風的情報」,就是完全不相關的資訊。
因此,點入生成式AI所提供的「資訊來源」,確認它所引述的資料相關且連結存在,是簡單卻關鍵的第一步。
ChatGPT的網頁搜尋,詢問「美國總統是誰」,它給予的答案是「川普」,可以點選下方「資料來源」查看它引用了哪些資料來源。點選資料來源後,右側欄位會出現引用內容的所有連結,請試著點選這些網站是否存在。
第二步:評估資料出處的可信度
首先要確認資料內容是否為「最新的資訊」。若資料來源抓取到「過時資訊」,反而可能給出錯誤結論。時事變化快速的資訊,更需要確認資料時間。比如,花蓮堰塞湖的災情、颱風停班停課的隨時動態。
再來,我們可以練習把生成式AI給的資料來源依照「可信度」分為3類:可信度高、可疑或不確定、缺席但重要的資料。
在「美國總統是誰」這一題,白宮網站、美國媒體《PBS》是可信度最高的消息來源;而集合眾人之力編撰的維基百科、川普個人的社群帳號等,都可以視為輔佐求證的資料,但如果要使用這些資料,都必須點入去檢視,一一去確認:維基百科內容是否有屬實,社群帳號是否真為本尊帳號。
此外,在資料出處看到一筆來自YouTube頻道,是可信度還不錯的英國媒體天空新聞(Sky News)對美國47屆總統就職典禮的直播,這是很好的消息來源。
由於每個問題不同,有些問題搜尋出來的結果,很難有政府網站、媒體報導、學術資料等,反而更依賴維基百科、論壇文章、社群貼文,這時候「可信度」是相對比較的結果。
有些資料來源,可能是來自「內容農場」、假新聞網站,不知名單位或機構的網站,我們就可以列為「可疑、不可信」的資料出處,如果生成內容都是引述自「不可信」網站,就不要使用。
另外,我們還可以想一想「缺席但重要的資料」,就是生成式AI沒有引用,但其實非常重要的資料。生成式AI的搜尋能力可能受限,關鍵且重要的資料可能是在特定資料庫,也不見得開放網頁搜尋,我們可以想想「缺席但重要的資料」,透過google搜尋或直接找資料庫的方式,來找到這些重要的資訊。
第三步:比對生成內容是否與原文相符
生成式AI在摘錄資料出處時,還可能扭曲原文,出現原文根本都沒有講的虛構內容,或者扭曲原文。檢視原始資料時,必須比對生成內容是否與原文相符。
結論:不要笑AI傻、是我們要變聰明
當厲害的ChatGPT竟然不知道「川普上任」,我們不是要嘲笑它,也不能就不理會它,繼續盲目使用、全部照抄,我們必須掌握它的運作原理,知道生成式AI是根據過去資料「預測」出最可能的文字,新的時事和動態要使用「網頁搜尋」來更新和補充。
當生成式AI依據網頁搜尋結果而生成的資料,這些摘要固然有閱讀的便利性,當我們要使用時,仍必須回到「媒體識讀」基本功,跟生成式AI「人機協作」,運用判斷資料出處的可信度,查證與補足其缺乏的資料。如何辨別資料來汲取成自己的知識,將是我們在AI時代要培養的超能力。
這篇文章你可以學到的AI技能:如何問對AI問題
1.給予大型語言模型(large language model, LLM)指令:「針對我的問題,需有可信權威的消息來源」,或是給予特定網站、新聞網站。2.提供你的可信資訊白名單,縮限LLM的搜尋範圍。3.再次查證和檢視其引用的新聞來源、原始內容。此文為FactLink和〈少年報導者〉共同刊登。〈少年報導者〉連結為「請問ChatGPT:為何不知道現任美國總統是川普?」










