肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

當(dāng)前位置: 首頁 ? 資訊 ? 產(chǎn)業(yè) ? 正文

人人都能做導(dǎo)演?Sora 2的幻象與真相

作者:程書書 來源:DoNews 141510/15

國慶假期,全球AI圈被一枚“重磅炸彈”炸醒。OpenAI發(fā)布新一代AI視頻模型Sora 2及其配套應(yīng)用Sora App,即使需要填寫邀請碼才能使用,也沒有減弱網(wǎng)友的熱情,社交平臺上充滿了尋求邀請碼的信息。短短四天內(nèi),這款A(yù)pp便空降美區(qū)Ap

標(biāo)簽: Sora AI 視頻

國慶假期,全球AI圈被一枚“重磅炸彈”炸醒。

OpenAI發(fā)布新一代AI視頻模型Sora 2及其配套應(yīng)用Sora App,即使需要填寫邀請碼才能使用,也沒有減弱網(wǎng)友的熱情,社交平臺上充滿了尋求邀請碼的信息。短短四天內(nèi),這款A(yù)pp便空降美區(qū)App Store免費榜榜首,力壓ChatGPT、Google Gemini等一眾頭部AI產(chǎn)品,迅速成為海外創(chuàng)作者、內(nèi)容營銷人和TikTok賣家的新寵。

社交平臺瞬間被AI生成的“同人宇宙”刷屏:動漫角色穿越現(xiàn)實街道,游戲角色在都市中穿行,甚至連OpenAI CEO山姆·奧爾特曼(Sam Altman)也被網(wǎng)友“玩出花”——他出現(xiàn)在東北炕頭吃飯、在阿里會議室講“閉環(huán)”“賦能”,甚至化身外賣騎手穿梭于城市街頭。

奧爾特曼本人將Sora 2稱為“創(chuàng)意領(lǐng)域的ChatGPT 3.5時刻”。從官方演示到網(wǎng)上用戶實測,Sora 2在物理邏輯、畫面連貫性、真實感和音畫同步等方面實現(xiàn)了質(zhì)的飛躍,被多家媒體譽為“將AI視頻生成推向新高度”。

DoNews在進行了體驗后認(rèn)為:Sora 2確實強大,但距離“現(xiàn)實不存在了”的預(yù)言,還是有一定距離。

01.

創(chuàng)造力炸裂,細(xì)節(jié)仍存“AI感”

Sora App以Sora 2為技術(shù)基礎(chǔ),Sora 2直接內(nèi)置了對話、音效和背景音樂的自動生成能力,可以實現(xiàn)音頻和視頻同步生成,改變了以往AI視頻生成工具沒有聲音的狀況。

進入Sora App后,主頁底部設(shè)有功能欄,從左到右依次為「視頻推薦」「靈感廣場」「生成器」「消息」「個人主頁」。很多人將其稱為“AI版抖音”,正是因為界面及首頁推薦邏輯與之相似——App主頁為垂直視頻流,用戶可上下滑動瀏覽其他用戶發(fā)布的內(nèi)容。

其中,靈感廣場用于展示熱門作品。由于Sora App生成視頻后,提示詞會默認(rèn)成為視頻配文,因此熱門視頻的提示詞可直接復(fù)制修改后使用。

生成器是用戶制作視頻的核心功能區(qū),有兩點值得注意:一是不支持上傳用戶自制視頻素材,僅能通過AI生成視頻;二是不支持單獨撰寫短視頻文案——用戶輸入的文案會默認(rèn)作為生成視頻的提示詞。

生成視頻時,有兩種特色方式可選:一是圖片生成視頻,二是Cameo出鏡秀。Cameo是每個賬號對應(yīng)的虛擬數(shù)字形象,相當(dāng)于用戶的“專屬Sora身份標(biāo)識”。創(chuàng)建Cameo需錄制一段個人臉部視頻,操作步驟類似支付寶、銀行類App的視頻認(rèn)證,驗證通過后即可用自己的虛擬形象生成并發(fā)布視頻。

此外,也可使用他人的虛擬數(shù)字形象,通過文生視頻或圖生視頻功能創(chuàng)作,但前提是對方將形象設(shè)為公開。具體操作是:撰寫提示詞時點擊他人頭像,其ID會自動填入提示詞;因此,使用他人形象發(fā)布視頻時,系統(tǒng)會自動@該用戶——這也意味著,形象設(shè)為公開即默認(rèn)允許App內(nèi)其他用戶使用。

DoNews以奧爾特曼的虛擬數(shù)字形象和一張圖片生成了一段視頻,提示詞為:“@sama在圖片場景里說集美們,耶斯莫拉?!?/p>

在生成的視頻中,Sora結(jié)合圖片背景為奧爾特曼豐富了臺詞,奧爾特曼指向后面的店鋪說:“集美們,今天帶大家來看看老姐妹的店,耶斯莫拉?!迸_詞的補充顯示出AI聯(lián)想的能力,與場景的配合較為自然,發(fā)音時,人物的口型也基本能對上。

不過,并非每次生成都能一次成功。DoNews再次嘗試生成奧爾特曼剝獼猴桃的視頻時,剝獼猴桃的細(xì)節(jié)就出現(xiàn)了錯誤,有明顯的AI痕跡。

DoNews又以奧爾特曼和另一用戶的數(shù)字形象創(chuàng)建了一段多角色視頻,提示詞是:“@sama@thomasdimson扮演《后宮甄嬛傳》里面的華妃娘娘和皇后娘娘,穿著清朝的妃嬪服制,用中文吵架?!毕到y(tǒng)檢測到版權(quán)問題無法生成,刪除提示詞中的《后宮甄嬛傳》后,生成就不再被拒絕。

在這段雙人互動視頻中,提示詞只提到“用中文吵架”,而Sora再次為角色添加了臺詞,二人的吵架內(nèi)容也符合清宮戲的背景。但細(xì)節(jié)仍有瑕疵,比如中間有一句臺詞的聲音沒有對口型,后面皇后的臺詞錯誤地對應(yīng)到了華妃的嘴型。

這種臺詞錯位的情況在多角色視頻中發(fā)生的概率似乎較高,在DoNews之后生成的另一段多人對話視頻中也出現(xiàn)了類似問題。

整體來看,Sora 2在物理世界理解方面確實表現(xiàn)不俗,用戶數(shù)字人的物理效果和唇型同步效果良好,基本的一致性做得不錯。但涉及到多元素的物體交互時,仍會出現(xiàn)多角色臺詞錯位、物體交互bug的問題,保留了明顯的“AI感”。

“AI配音”本身也存在缺陷:語氣生硬、情感適配度低,若提示詞未明確語調(diào),生成的對話會顯得機械。同時,“構(gòu)思提示詞”的門檻依然存在——普通用戶可能因描述不細(xì)致(比如沒說清場景氛圍、人物動作),導(dǎo)致生成的視頻偏離預(yù)期,而專業(yè)創(chuàng)作者則需花費時間優(yōu)化提示詞,才能彌補AI的細(xì)節(jié)不足。

02.

創(chuàng)意ChatGPT時刻未到,娛樂版抖音還差口氣

OpenAI在官方聲明中,將Sora 2定位為“*進的視頻和音頻生成模型”,更明確對比:2024年2月發(fā)布的初代Sora是視頻領(lǐng)域的“GPT-1時刻”,而Sora 2直接邁入了“GPT-3.5時刻”。

從音畫同步、人物ID一致性(如Cameo形象復(fù)用)到多鏡頭敘事的技術(shù)突破來看,Sora 2確實刷新了AI視頻生成的上限,但距離“重塑創(chuàng)意領(lǐng)域”和“成為新一代娛樂社交平臺”,它顯然還差點火候。

“Sora 2生成的音頻真實感、清晰度,把之前的AI音效工具甩開好幾條街,甚至比谷歌Veo 3還略勝一籌?!毙⌒褚魳穭?chuàng)始人兼CEO、AIGC藝術(shù)家小旭的評價,點出了Sora 2的核心優(yōu)勢——易用性。它把復(fù)雜的視頻生成流程簡化成“輸入提示詞+選形象”,尤其是Cameo功能,用戶錄幾秒臉部視頻就能克隆專屬虛擬形象和聲音,門檻低到普通用戶也能上手。

但優(yōu)勢之外,硬傷同樣明顯?!澳壳吧傻囊曨l時長比較短,只有10秒鐘,這個在正規(guī)的創(chuàng)作中還是顯得略短了一些?!贝送?,分辨率也不太行,App里沒法調(diào)畫質(zhì),默認(rèn)只有480P或360P,橫版還得用PC端才能生成。在小旭看來,Sora2是瞄準(zhǔn)AI社交去的,并不是一個純粹的AI工具。

Sora App目前采用的邀請制也可以驗證他的看法,當(dāng)一個邀請碼注冊成功后,可以再生出4個邀請碼,分享給其他用戶后,這些用戶激活賬號又能獲得4個新的邀請碼,如此形成裂變循環(huán)。而且一旦使用他人的邀請碼,系統(tǒng)會自動關(guān)注邀請方,逐步構(gòu)建起好友社交網(wǎng)絡(luò)。

用戶車車體驗后認(rèn)為,其娛樂性“遠不如抖音”:“Sora上的內(nèi)容更像‘自娛自樂’——每個人生成的視頻都是圍繞自己的虛擬形象或簡單場景,沒有抖音那樣的話題挑戰(zhàn)、達人生態(tài),也缺乏能引發(fā)大眾共鳴的內(nèi)容,刷幾條就會覺得單調(diào)?!?/p>

這種“娛樂性短板”,和Sora 2嚴(yán)格的限制掛鉤。為規(guī)避版權(quán)、肖像權(quán)風(fēng)險,它會直接拒絕生成多數(shù)真實名人、影視角色(比如前文提及《后宮甄嬛傳》觸發(fā)版權(quán)攔截),甚至普通人物形象的創(chuàng)作也有諸多約束。用戶能發(fā)揮的題材空間被壓縮,自然難以產(chǎn)出多樣化、有傳播力的內(nèi)容——反觀抖音,從生活記錄到創(chuàng)意短劇,內(nèi)容邊界寬泛,再加上評論互動、合拍、話題榜等功能,社交粘性遠非Sora2可比。

綜上,Sora 2無疑是一次技術(shù)飛躍,它顯著降低了AI視頻創(chuàng)作的門檻,將此前分散的視頻、音頻生成步驟整合,讓普通用戶也能輕松體驗創(chuàng)作的樂趣。

然而,無論是從其有限的畫質(zhì)與時長、純AI生成內(nèi)容導(dǎo)致的同質(zhì)化傾向,還是技術(shù)上尚未克服的細(xì)節(jié)瑕疵來看,它距離成為引發(fā)創(chuàng)意領(lǐng)域革命的“ChatGPT時刻”以及媲美抖音的娛樂平臺,仍差一口氣。

對于普通用戶,Sora 2是一款有趣、易上手的新玩具;但對于追求高質(zhì)量、長序列和強一致性的專業(yè)創(chuàng)作者而言,它仍不是一個成熟可靠的生產(chǎn)力工具。OpenAI的這枚“炸場”新星,優(yōu)點與缺點同樣突出,它的真正成熟,或許還需要等待下一個版本的迭代。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機構(gòu)或其他網(wǎng)站的公開信息,并不意味著贊同其觀點或證實其內(nèi)容的真實性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財中網(wǎng)合作