Sora新視頻,變成“抖音獨占”了。
悄無聲息,OpenAI正式殺入TikTok,加上洗腦配樂直接讓人刷到停不下來,瘋狂引流吸粉中:
短短4天,漲粉10萬,50萬贊——這還是不打槍不宣傳的情況下。
這以后,人類創(chuàng)作者還怎么玩?
Sore新視頻,只發(fā)TikTok
在OpenAI剛開的TikTok認證帳號上,悄然更新了不少全新生成視頻。
每一個都很有特點,同樣引發(fā)各路熱議。
來感受一下:
a16z合伙人驚呼,如果這是在信息流里刷出來的,*分不出真假。
我看過很多AI視頻了,但這一條感覺到了轉(zhuǎn)折點。
來到真實的短視頻消費場景中,就更顯Sora與競品代差明顯:太逼真,以至于要特別聲明不是真的。
OpenAI可太擔(dān)心AI視頻被當(dāng)真引起不好影響了,不遺余力的以各種方式提醒“這是假的!這是假的!”。
網(wǎng)友開始發(fā)出這樣的預(yù)警:
從現(xiàn)在開始,你在網(wǎng)上看到的一切都是值得懷疑的,不要相信你的眼睛。
有句老話叫“互聯(lián)網(wǎng)時代,沒有人知道你是一條狗”。
現(xiàn)在正式升級成“Sora時代,沒有人知道你是一條不存在的狗”。
下面再來欣賞幾個“抖音獨占”版Sora視頻:
超微距追蹤蟻群,效果堪比紀錄片。
以前DALL·E 3畫的靜態(tài)圖也可以拿出來重復(fù)利用,Sora加工一下再配上電音,就成了爆款舞蹈視頻。
還特意用一條長達1分24秒的視頻,展示了類似抖音*的AI視頻編輯能力。
直接搞得不少短視頻創(chuàng)作者心態(tài)爆炸,要退坑了。
甚至連平臺本身都被降維打擊。
全球估值*的獨角獸字節(jié)跳動,與剛剛躍升第三位的OpenAI之間,似乎正醞釀著一場對決。
UGC*和AIGC新貴之間,終有一戰(zhàn)。
“字節(jié)版Sora”也在研發(fā)
實際上,在Sora一夜爆火之前,字節(jié)內(nèi)部并不缺乏AI視頻技術(shù)。
甚至其中一款Boximator還被傳成是“中國版Sora”。
在Sora發(fā)布之前Boximator的論文就已經(jīng)公布,由字節(jié)AI實驗室總監(jiān)李航領(lǐng)銜。
其實Boximator的功能并非根據(jù)純文字生成視頻,而是按照文字提示將靜態(tài)圖片動態(tài)化。
它以字節(jié)去年11月推出的PixelDance為基礎(chǔ)模型,加入了新的動作設(shè)定方式——
從圖像中框選物體,然后設(shè)置運動終點或直接繪制軌跡,就能對動態(tài)效果進行精細控制。
形式上,Boximator作為一個插件,與現(xiàn)有的視頻擴散模型結(jié)合使用,通過凍結(jié)基礎(chǔ)模型的權(quán)重,僅訓(xùn)練控制模塊來實現(xiàn)這一功能。
比如,通過框框畫畫,讓小哈基米按照一定的軌跡追著球跑。
效果上,雖然也有bug(飄走的雨傘沒有傘柄),但與Pika 1.0(中)和Gen-2(右)相比,Boximator的動畫明顯更加完整,也更接近文字提示。
從材質(zhì)和物理效果上看,也是Boximator更勝一籌。
技術(shù)層面,從架構(gòu)上看,Boximator在視頻擴散模型的每個空間注意力塊中增加了一個新的自注意力層,用于處理由對象ID、硬/軟標(biāo)志和邊界框坐標(biāo)編碼的控制token。
為了簡化學(xué)習(xí)“框-對象”關(guān)聯(lián)的挑戰(zhàn),Boximator在訓(xùn)練過程中還采用了一種稱為自跟蹤(self-tracking)的技術(shù)。
那么Boximator到底算不算“字節(jié)版Sora”?
字節(jié)對此傳聞,以辟謠的姿態(tài)來回應(yīng):
Boximator是視頻生成領(lǐng)域控制對象運動的技術(shù)方法研究項目,目前還無法作為完善的產(chǎn)品落地,距離國外*的視頻生成模型在畫面質(zhì)量、保真率、視頻時長等方面還有很大差距。
Boximator建立在之前PixelDance(基礎(chǔ)研究)、MagicAnimate(專注于人體動作)等更多字節(jié)團隊研究基礎(chǔ)之上的最新成果。
總的來說,這些技術(shù)并非針對Sora特意開發(fā),但在AIGC大戰(zhàn)如火如荼的背景之下,仍不失為一種“戰(zhàn)備”。
再加上年前原抖音CEO張楠卸任,專注于剪映,奔赴AIGC風(fēng)口。
可以說雖然Sora的發(fā)布很突然,但字節(jié)并不是毫無準(zhǔn)備,或者說早就在業(yè)務(wù)推進中感知到了技術(shù)趨勢。
而相比OpenAI與字節(jié)這樣早晚要有的對決,視頻行業(yè)上下游其他選手,更像是遭遇了一場飛來橫禍。
視頻編輯、素材站遭殃
Sora的*刀,其實砍向了Adobe。
5天過去了,股價跌跌不休,市值蒸發(fā)過百億美元。
危機時刻,Adobe剛剛緊急宣布,組建了一個50人的AI研究團隊。
但是這投入的力度,沒讓大家看出誠意。
29945員工中的50人,只占0.16%。
Adobe代表的是沿用近30年的視頻生產(chǎn)、編輯工具,服務(wù)于內(nèi)容創(chuàng)作者。
不轉(zhuǎn)型就會變成下一個柯達、諾基亞,但轉(zhuǎn)型也被認為面臨很大挑戰(zhàn)。
比如有人指出,Adobe坐擁大量數(shù)據(jù),但要用過去創(chuàng)作者的成果去訓(xùn)練AI,就會與這些用戶關(guān)系緊張。
也正是因此,Adobe的AI生圖工具Firefly并沒有在自家創(chuàng)意作品社區(qū)Behance的數(shù)據(jù)上訓(xùn)練,有些束手束腳。
又比如從過去Adobe在AI生圖的表現(xiàn)來看,效果比Midjourney尚且很大差距,如今在AI視頻上又該如何面對OpenAI的技術(shù)代差。
Adobe之外,受沖擊第二大的就是素材供應(yīng)商了,代表公司Shutterstock的日子也不好過。
連馬斯克都認同“這個行業(yè)可能消亡”的觀點。
不過Shutterstock也給自己找好了退路,早早與OpenAI簽訂了合作協(xié)議,從素材供應(yīng)商開始轉(zhuǎn)型訓(xùn)練數(shù)據(jù)供應(yīng)商。
這幾天不斷刷屏的Sora視頻中,就有不少Shutterstock圖片的影子。
還有人開玩笑說,Sora名字四個字母不會就是代表“Shutterstock原創(chuàng),AI攪拌”吧。
參考鏈接:
[1]https://www.tiktok.com/@openai
[2]https://boximator.github.io/
[3]https://twitter.com/bilawalsidhu/status/1760076742679552273