肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

當(dāng)前位置: 首頁 ? 資訊 ? 產(chǎn)業(yè) ? 正文

人類正在被AI「幻覺」欺騙

作者:藍(lán)鯨科技 朱俊熹 來源:藍(lán)鯨TMT 83908/20

2025年,行至21世紀(jì)前四分之一,AI早已不是科幻電影中的概念,而是人人可用的工具。如果從一些機構(gòu)發(fā)布的統(tǒng)計報告來看,在全球超81億人口中,已有17億至18億人使用過AI工具,其中每天使用者約為5億至6億。特別是對25歲以下的年輕人而言,

標(biāo)簽: AI DeepSeek AI產(chǎn)品

2025年,行至21世紀(jì)前四分之一,AI早已不是科幻電影中的概念,而是人人可用的工具。如果從一些機構(gòu)發(fā)布的統(tǒng)計報告來看,在全球超81億人口中,已有17億至18億人使用過AI工具,其中每天使用者約為5億至6億。特別是對25歲以下的年輕人而言,AI聊天助手已成為獲取信息和新聞的重要渠道。

但你有被AI生成的虛假信息欺騙過嗎?又或者說,你意識到自己被騙了嗎?

譬如最近傳出的DeepSeek將在8月下旬發(fā)布R2模型的消息,雖然最終被證偽,但相關(guān)話題不僅登上社交平臺熱搜,還一度拉動了AI概念股的上漲。追溯其傳播過程,最初是部分媒體在報道中引述了和DeepSeek產(chǎn)品的對話記錄。隨后,這些未經(jīng)官方核實的內(nèi)容又被一些AI搜索產(chǎn)品作為可信信源收錄,最終呈現(xiàn)出似乎已被多方印證的假象。

圖片來源:媒體報道

類似的情況并非個案。從“DeepSeek向王一博道歉”的烏龍事件,到用AI炮制的“三層游船倒扣江中30人墜江”謠言,過去一段時間以來,AI引發(fā)的假新聞層出不窮。

美國西北大學(xué)計算機科學(xué)博士生陳燦宇曾發(fā)起過應(yīng)對大模型時代虛假信息的相關(guān)項目,其研究方向正是真實、安全、負(fù)責(zé)任的大語言模型及智能體。陳燦宇告訴藍(lán)鯨科技,這類虛假信息可大致分為兩種:一是用戶惡意利用大模型生成的,另一類則是模型自身的幻覺所致,往往是無意的,卻可能在不知不覺中誤導(dǎo)用戶。

大模型的幻覺指的是其生成的內(nèi)容看似合理流暢,實際卻是虛假的、不準(zhǔn)確或不存在的信息,就像是人類在自信地胡說八道。

幻覺問題由來已久,且成因復(fù)雜。主流大語言模型采用自回歸生成機制,即通過前面的內(nèi)容預(yù)測下一個最可能的詞,它的目標(biāo)并不是事實準(zhǔn)確,而是語言流暢、上下文合理。同時,大模型的訓(xùn)練數(shù)據(jù)存在時效性限制,難以實時獲取到最新的信息,其中還可能夾雜了來自互聯(lián)網(wǎng)的虛假信息。即使目前可以通過對齊技術(shù)(如RLHF)、檢索增強生成(RAG)等手段來緩解,幻覺問題依然難以被徹底根除。

學(xué)界此前曾認(rèn)為,推理模型能夠減少幻覺問題,但實測數(shù)據(jù)卻并非如此。OpenAI的推理模型o3和o4-mini的幻覺率不僅高于前代推理模型,也超過了GPT-4o等非推理模型。DeepSeek推理模型R1的幻覺率也顯著高于V3模型。在5月版本更新時,DeepSeek特別強調(diào)稱,新版R1模型針對幻覺問題進行了優(yōu)化,在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率較舊版降低了45-50%左右。

一位AI算法工程師對藍(lán)鯨科技解釋稱,推理模型提升了最終答案的精確度上限,但中間過程可能存在極大的幻覺。他將其歸因于以DeepSeek為代表所采用的強化學(xué)習(xí)方法,這類方法主要關(guān)注在數(shù)學(xué)、代碼等有明確正答的任務(wù)上,模型給出的最終結(jié)果是否正確,而不關(guān)注中間推理步驟是否合理。

DeepSeek在R1技術(shù)報告中提到,模型訓(xùn)練中采用了基于規(guī)則的獎勵系統(tǒng),主要包括兩類獎勵:一是準(zhǔn)確性獎勵,用于評估模型的回答是否正確;二是格式獎勵,看模型輸出內(nèi)容是否符合規(guī)定的格式規(guī)范。DeepSeek沒有選擇用神經(jīng)網(wǎng)絡(luò)來給模型的輸出或推理過程打分的獎勵機制,以避免訓(xùn)練復(fù)雜化和獎勵投機。

DeepSeek的橫空出世推動了AI的普及,也放大了幻覺可能帶來的虛假信息風(fēng)險。陳燦宇認(rèn)為,在大模型時代抗擊虛假信息需要多方合力,除了大模型廠商盡可能地降低幻覺率外,也要求平臺和用戶合理使用大模型。他建議,對于沒有相關(guān)技術(shù)背景的普通用戶,可以通過讓同一模型多次生成回答,或?qū)Ρ炔煌P偷慕Y(jié)果,來更好地辨別幻覺。

目前,許多C端AI產(chǎn)品還會在生成結(jié)果后附上參考來源,方便用戶進一步驗證。陳燦宇提醒道,引用來源也存在一定局限性。“因為現(xiàn)在大模型有嚴(yán)重的虛假引用問題,引用不準(zhǔn)確或者亂引用,可能會導(dǎo)致一些副作用,讓用戶更加盲從答案?!?/p>

前述AI算法工程師也表示,雖然可以通過調(diào)用搜索引擎或外部知識庫來緩解幻覺,但大模型降低了造假的成本,核心挑戰(zhàn)還是在于信息源和搜索引擎端的建設(shè)。

在科技社區(qū)中,另一種常用的減輕幻覺的方式是調(diào)節(jié)模型的溫度參數(shù)。具體而言,低溫度系數(shù)會讓模型生成更保守、確定性高的內(nèi)容,高溫度系數(shù)則會產(chǎn)生更隨機、富有創(chuàng)造性的輸出,同時也更容易出現(xiàn)幻覺。

多位受訪者均表示,在某些場景下,幻覺實際上是有利且必要的,它體現(xiàn)的是多樣性、發(fā)散性?!叭绻P筒徽f胡話,它的創(chuàng)造性很有可能就不那么強了,這存在一定的權(quán)衡?!?/p>

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機構(gòu)或其他網(wǎng)站的公開信息,并不意味著贊同其觀點或證實其內(nèi)容的真實性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財中網(wǎng)合作