AI進(jìn)化成人的速度，可能比你想象的還慢

作者：江江來源：差評 55411/12

吹了這么久AI，到底嘛時候才能超越人類?。科鋵?，圈內(nèi)人對 AI 都有一個終極期望，就是實現(xiàn) AGI （通用人工智能），說白了，就是造出“和人一樣聰明的AI”。咱去馬斯克的社交平臺上逛一圈，會發(fā)現(xiàn)他三句不離AGI。OpenAI的奧特曼也在瘋

標(biāo)簽： OpenAI 谷歌 馬斯克 奧特曼 AGI AI

吹了這么久AI，到底嘛時候才能超越人類??？

其實，圈內(nèi)人對 AI 都有一個終極期望，就是實現(xiàn) AGI （通用人工智能），說白了，就是造出“和人一樣聰明的AI”。

咱去馬斯克的社交平臺上逛一圈，會發(fā)現(xiàn)他三句不離AGI。

OpenAI的奧特曼也在瘋狂預(yù)言，AGI即將到來，也就這三五年的事兒了。

但這玩意，到底咋衡量呢？俗話說得好，人和人的區(qū)別，比人和豬的區(qū)別還大。。到底啥水平，才能和人一樣聰明??？

就連天天為了AGI吵架的大佬們，也根本說不出來，AGI到底是個啥。

合著都在這虛空對線是吧。

所以最近，一幫頂尖大佬看不下去了，幾十號人聯(lián)手發(fā)了篇論文，作者還是全明星陣容，包括圖靈獎得主、谷歌前 CEO 等等，他們聯(lián)合起來，給出了目前為止第一個 AGI 的量化定義。

他們也順便用GPT模型做了個測試，結(jié)果顯示，如果AGI是100分，GPT-5只有58分，不及格的水平。

這幫大佬的核心觀點是：AGI，就是一種能達(dá)到“一個受過良好教育的成年人”的能力的人工智能。

他們把心理學(xué)中一個最權(quán)威的理論，CHC 理論，給AI搬過來了。

CHC 的觀點，簡單來說，就是智力這玩意，不是一個單一的標(biāo)準(zhǔn)能衡量的東西，需要多維度考察。

說白了，這就和高考差不多。一門課強(qiáng)根本不夠，你得門門都強(qiáng)，才證明你厲害。

所以，他們把 AI 的能力分成了 10 個核心能力，每個占了 10% 的分。它們分別是：

(K) 通識知識、(RW) 讀寫能力、(M) 數(shù)學(xué)能力、(R) 即時推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應(yīng)速度、(MS) 長期記憶存儲、 (MR) 長期記憶檢索。

這里面比較抽象的，可能就是工作記憶和長期記憶了。

工作記憶，其實就是短期記憶，就是說我剛剛提過的東西，你現(xiàn)在還能記得起來；而長期記憶就是，AI通過跟我的對話，永久性學(xué)到了新東西，就像你上過學(xué)，即使你畢業(yè)了，“奇變偶不變”還刻在你DNA里一樣。。

每一種能力，他們都會叫AI測試，也就是寫他們精心準(zhǔn)備的測試題。比如(R) 即時推理這一塊，他們就專門找了些略微燒腦的問題，比如：

“David認(rèn)識張先生的朋友Jack，Jack認(rèn)識David的朋友林女士。認(rèn)識Jack的人都有碩士學(xué)位，認(rèn)識林女士的人都是上海人。所以誰既是上海人又有碩士學(xué)位？”（測試你是不是AI的時候到了）

他們找了OpenAI的兩員大將，GPT-4（2023）和 GPT-5（2025）來考試。結(jié)果，GPT-4 總分 27。 GPT-5 總分 58，合計也沒達(dá)到100分。

而且，咱來看看這成績單，有拉滿的，也有拉褲兜的，純純嚴(yán)重偏科。

比如 GPT-5，在通識(K)、讀寫(RW)、數(shù)學(xué)(M)這幾項上，直奔 9 分 10 分。所以說目前來看，這幾項是AI的強(qiáng)項。

而 (MS) 長期記憶存儲這項，GPT-5純純大光頭，3-4分的也有一堆。而GPT-4更不用說，好幾項都是0分。

這一項其實考的是， AI 能不能持續(xù)學(xué)習(xí)獲得信息。因為論文發(fā)現(xiàn)，現(xiàn)在的 AI 根本就是個健忘癥，你今天教它的東西，明天它就忘得一干二凈。

他們做測試的方法，就是第一天跟AI講一些東西，然后第二天單開一個對話，再讓AI回想。都不用猜，包想不起來的，大伙用過都知道，新開窗口就會清空記憶，那得分不是0就怪了。

有的人會反駁，現(xiàn)在的AI早就有永久記憶了。但文章中其實譴責(zé)了這一點，現(xiàn)在AI的記憶，根本不是真正的記憶，他們只是在假裝自己有記憶。

作者們把這招叫做 “能力扭曲” ，即利用某些領(lǐng)域的優(yōu)勢來彌補(bǔ)其他領(lǐng)域的嚴(yán)重弱點，創(chuàng)造出一種“AI真有能力”的錯覺。像現(xiàn)在的AI記憶，其實就是在瘋狂卷上下文長度，或者通過知識庫來實現(xiàn)，實際上就是外掛，模型本身是一點記憶都沒有。

除了記憶力，長期記憶檢索ai們也很拉，說白了，就是檢測幻覺，別睜眼說瞎話。當(dāng)然，還有一項大伙都很拉的功能，(V) 視覺處理。 GPT-4是0分，而GPT-5進(jìn)化過后，也只來到4分。

它考的不是簡單的“這圖里有啥”，考的是視覺推理。這對大模型來說，可就難多了。比如說，咱來試一道：

“下面這 4 個 2D 展開圖里，哪一個不能折成左邊那個立方體？”

還真有點難度，但我們?nèi)祟惿约铀妓?，還是能做出來的。我也去求證了下Gemini，結(jié)果確實是無法戰(zhàn)勝。

這也說明，AI的眼睛和腦子，目前配合的不是很好，還沒有人類這種，邊看邊想就解決問題的能力。

當(dāng)然，這份報告，肯定還是不夠完美的。除了這十個維度，人腦還有聯(lián)想等其他難以名狀的能力，人類可太復(fù)雜了，不是幾道題就能測明白的。

但它最大的價值，是給當(dāng)下的 AI 做了一次全面診斷：AI現(xiàn)在還是瘸腿，在一些人類最基本的認(rèn)知能力上，仍然有嚴(yán)重的缺陷。

而且，現(xiàn)在的 AI 廠商會還用一些捷徑，來掩蓋這些弱點。因此，這篇文章也在給大家敲警鐘：這樣搞出來的 AI，是到不了 AGI 的。

但奧特曼在前一陣的直播里還說了，AGI在路上了，我只能說，走著瞧了。

當(dāng)然，俺覺得，這套標(biāo)準(zhǔn)本身也有不小的槽點。

人家AGI ，憑啥非要模仿人類??？它很可能是一種完全不同的智能。硬拿人類的 CHC 理論去套 AGI，是否有點刻舟求劍的意味了。

而且，這標(biāo)準(zhǔn)定得也有點高了。講實話，AI 要能達(dá)到一個“沒受過教育的小孩”的水平，就已經(jīng)無敵了。更別提有相當(dāng)一部分人類，自己都通不過這個測試。。不過，不管怎么吐槽，有人提出標(biāo)準(zhǔn)就是好事。

它最大的意義，是終于把 AGI 這個話題從玄學(xué)的范疇，拉回到了一個可以討論的具體問題上。

就算這個標(biāo)準(zhǔn)不完美，它也會逼著整個行業(yè)開始思考，我們到底在追求什么，以及我們到底缺了什么。

這總比大家都在吹牛，說自己快要實現(xiàn) AGI要強(qiáng)得多。

免責(zé)聲明：本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開信息，并不意味著贊同其觀點或證實其內(nèi)容的真實性，信息僅供參考，不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有，如有侵權(quán)或其它問題請及時告之，本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者，視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596，謝謝。

肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

首頁

資訊

財中號

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

熱點

國資

產(chǎn)業(yè)

券商

基金

金融

上市公司

財富

專題

AI進(jìn)化成人的速度，可能比你想象的還慢

從經(jīng)開區(qū)、高新區(qū)和港區(qū)擴(kuò)容，看鄭州與中牟、滎陽、新鄭糾結(jié)關(guān)系

首頁

資訊

財中號

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

AI進(jìn)化成人的速度，可能比你想象的還慢

您可能感興趣的文章