肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

當(dāng)前位置: 首頁 ? 資訊 ? 產(chǎn)業(yè) ? 正文

人類正在被AI「幻覺」欺騙

作者:藍(lán)鯨科技 朱俊熹 來源:藍(lán)鯨TMT 75908/20

2025年,行至21世紀(jì)前四分之一,AI早已不是科幻電影中的概念,而是人人可用的工具。如果從一些機(jī)構(gòu)發(fā)布的統(tǒng)計(jì)報(bào)告來看,在全球超81億人口中,已有17億至18億人使用過AI工具,其中每天使用者約為5億至6億。特別是對(duì)25歲以下的年輕人而言,

標(biāo)簽: AI DeepSeek AI產(chǎn)品

2025年,行至21世紀(jì)前四分之一,AI早已不是科幻電影中的概念,而是人人可用的工具。如果從一些機(jī)構(gòu)發(fā)布的統(tǒng)計(jì)報(bào)告來看,在全球超81億人口中,已有17億至18億人使用過AI工具,其中每天使用者約為5億至6億。特別是對(duì)25歲以下的年輕人而言,AI聊天助手已成為獲取信息和新聞的重要渠道。

但你有被AI生成的虛假信息欺騙過嗎?又或者說,你意識(shí)到自己被騙了嗎?

譬如最近傳出的DeepSeek將在8月下旬發(fā)布R2模型的消息,雖然最終被證偽,但相關(guān)話題不僅登上社交平臺(tái)熱搜,還一度拉動(dòng)了AI概念股的上漲。追溯其傳播過程,最初是部分媒體在報(bào)道中引述了和DeepSeek產(chǎn)品的對(duì)話記錄。隨后,這些未經(jīng)官方核實(shí)的內(nèi)容又被一些AI搜索產(chǎn)品作為可信信源收錄,最終呈現(xiàn)出似乎已被多方印證的假象。

圖片來源:媒體報(bào)道

類似的情況并非個(gè)案。從“DeepSeek向王一博道歉”的烏龍事件,到用AI炮制的“三層游船倒扣江中30人墜江”謠言,過去一段時(shí)間以來,AI引發(fā)的假新聞層出不窮。

美國(guó)西北大學(xué)計(jì)算機(jī)科學(xué)博士生陳燦宇曾發(fā)起過應(yīng)對(duì)大模型時(shí)代虛假信息的相關(guān)項(xiàng)目,其研究方向正是真實(shí)、安全、負(fù)責(zé)任的大語言模型及智能體。陳燦宇告訴藍(lán)鯨科技,這類虛假信息可大致分為兩種:一是用戶惡意利用大模型生成的,另一類則是模型自身的幻覺所致,往往是無意的,卻可能在不知不覺中誤導(dǎo)用戶。

大模型的幻覺指的是其生成的內(nèi)容看似合理流暢,實(shí)際卻是虛假的、不準(zhǔn)確或不存在的信息,就像是人類在自信地胡說八道。

幻覺問題由來已久,且成因復(fù)雜。主流大語言模型采用自回歸生成機(jī)制,即通過前面的內(nèi)容預(yù)測(cè)下一個(gè)最可能的詞,它的目標(biāo)并不是事實(shí)準(zhǔn)確,而是語言流暢、上下文合理。同時(shí),大模型的訓(xùn)練數(shù)據(jù)存在時(shí)效性限制,難以實(shí)時(shí)獲取到最新的信息,其中還可能夾雜了來自互聯(lián)網(wǎng)的虛假信息。即使目前可以通過對(duì)齊技術(shù)(如RLHF)、檢索增強(qiáng)生成(RAG)等手段來緩解,幻覺問題依然難以被徹底根除。

學(xué)界此前曾認(rèn)為,推理模型能夠減少幻覺問題,但實(shí)測(cè)數(shù)據(jù)卻并非如此。OpenAI的推理模型o3和o4-mini的幻覺率不僅高于前代推理模型,也超過了GPT-4o等非推理模型。DeepSeek推理模型R1的幻覺率也顯著高于V3模型。在5月版本更新時(shí),DeepSeek特別強(qiáng)調(diào)稱,新版R1模型針對(duì)幻覺問題進(jìn)行了優(yōu)化,在改寫潤(rùn)色、總結(jié)摘要、閱讀理解等場(chǎng)景中,幻覺率較舊版降低了45-50%左右。

一位AI算法工程師對(duì)藍(lán)鯨科技解釋稱,推理模型提升了最終答案的精確度上限,但中間過程可能存在極大的幻覺。他將其歸因于以DeepSeek為代表所采用的強(qiáng)化學(xué)習(xí)方法,這類方法主要關(guān)注在數(shù)學(xué)、代碼等有明確正答的任務(wù)上,模型給出的最終結(jié)果是否正確,而不關(guān)注中間推理步驟是否合理。

DeepSeek在R1技術(shù)報(bào)告中提到,模型訓(xùn)練中采用了基于規(guī)則的獎(jiǎng)勵(lì)系統(tǒng),主要包括兩類獎(jiǎng)勵(lì):一是準(zhǔn)確性獎(jiǎng)勵(lì),用于評(píng)估模型的回答是否正確;二是格式獎(jiǎng)勵(lì),看模型輸出內(nèi)容是否符合規(guī)定的格式規(guī)范。DeepSeek沒有選擇用神經(jīng)網(wǎng)絡(luò)來給模型的輸出或推理過程打分的獎(jiǎng)勵(lì)機(jī)制,以避免訓(xùn)練復(fù)雜化和獎(jiǎng)勵(lì)投機(jī)。

DeepSeek的橫空出世推動(dòng)了AI的普及,也放大了幻覺可能帶來的虛假信息風(fēng)險(xiǎn)。陳燦宇認(rèn)為,在大模型時(shí)代抗擊虛假信息需要多方合力,除了大模型廠商盡可能地降低幻覺率外,也要求平臺(tái)和用戶合理使用大模型。他建議,對(duì)于沒有相關(guān)技術(shù)背景的普通用戶,可以通過讓同一模型多次生成回答,或?qū)Ρ炔煌P偷慕Y(jié)果,來更好地辨別幻覺。

目前,許多C端AI產(chǎn)品還會(huì)在生成結(jié)果后附上參考來源,方便用戶進(jìn)一步驗(yàn)證。陳燦宇提醒道,引用來源也存在一定局限性?!耙?yàn)楝F(xiàn)在大模型有嚴(yán)重的虛假引用問題,引用不準(zhǔn)確或者亂引用,可能會(huì)導(dǎo)致一些副作用,讓用戶更加盲從答案。”

前述AI算法工程師也表示,雖然可以通過調(diào)用搜索引擎或外部知識(shí)庫來緩解幻覺,但大模型降低了造假的成本,核心挑戰(zhàn)還是在于信息源和搜索引擎端的建設(shè)。

在科技社區(qū)中,另一種常用的減輕幻覺的方式是調(diào)節(jié)模型的溫度參數(shù)。具體而言,低溫度系數(shù)會(huì)讓模型生成更保守、確定性高的內(nèi)容,高溫度系數(shù)則會(huì)產(chǎn)生更隨機(jī)、富有創(chuàng)造性的輸出,同時(shí)也更容易出現(xiàn)幻覺。

多位受訪者均表示,在某些場(chǎng)景下,幻覺實(shí)際上是有利且必要的,它體現(xiàn)的是多樣性、發(fā)散性?!叭绻P筒徽f胡話,它的創(chuàng)造性很有可能就不那么強(qiáng)了,這存在一定的權(quán)衡?!?/p>

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開信息,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財(cái)中網(wǎng)合作