“大模型尺寸之爭(zhēng)正在加速……倒退!”
OpenAI的GPT-4o mini一登場(chǎng),又登上了大模型話題榜榜首。
并且這次話題焦點(diǎn),是OpenAI不僅再樹(shù)新標(biāo)桿,還一出手就把性價(jià)比卷爆了——直接把此前大受開(kāi)發(fā)者好評(píng)的Gemini 1.5 Flash和Claude 3 Haiku給碾壓了。
這不,大神Karpathy火速發(fā)了篇小作文,做出開(kāi)頭提到的這么一句判斷,并進(jìn)一步解釋?zhuān)?/p>
我敢打賭,我們會(huì)看到能夠可靠“思考”的“小”模型,它們的參數(shù)量甚至可能只有GPT-2那么大。
總之,開(kāi)發(fā)者們的心情be like:
兩年內(nèi)大模型成本直降99%,今天宜當(dāng)開(kāi)發(fā)者。
鑼鼓喧天的熱烈討論中,GPT-4o mini背后團(tuán)隊(duì)也沒(méi)藏著掖著,都在