肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

當前位置: 首頁 ? 資訊 ? 熱點 ? 正文

抖音、優(yōu)酷的Sora在哪里?

作者:文/何伊然 編輯/劉宇翔 來源: 最話FunTalk 298305/14

OpenAI又一次震撼了科技圈。當?shù)貢r間 2 月 15 日,OpenAI 推出旗下*視頻生成模型Sora。官方介紹寫道:“我們打造了一種名為Sora的文本到視頻模型。Sora能夠生成長達一分鐘的視頻,同時保持視覺質量和對用戶提示的遵循?!盨

標簽: AI 視頻 Sora

OpenAI又一次震撼了科技圈。

當?shù)貢r間 2 月 15 日,OpenAI 推出旗下*視頻生成模型Sora。官方介紹寫道:“我們打造了一種名為Sora的文本到視頻模型。Sora能夠生成長達一分鐘的視頻,同時保持視覺質量和對用戶提示的遵循?!?/p>

Sora是日語“天空”的羅馬音字母,在英語里則有小鳥在空中詠唱的意思。它像是OpenAI此前推出的圖像生產系統(tǒng)DALL·E與AI聊天機器人ChatGPT的混合升級視頻版本。

過去一年,生成式AI視頻創(chuàng)業(yè)已是一條熱門創(chuàng)業(yè)賽道,涌現(xiàn)出了一批備受矚目的獨角獸,也給出了不少有創(chuàng)意的作品。但外界普遍仍抱有AI生成視頻和實拍差距明顯,全面推廣商用并不會在短期內實現(xiàn)的想法,然而Sora的演示樣片徹底顛覆了大眾的認知。

通過OpenAI給出的案例演示來看,用戶只需要輸入簡短的文字描述,Sora就可以將文本內容轉化為一分鐘的高清視頻。

年輕的東亞女性走在充滿霓虹燈的東京街頭、兩艘戰(zhàn)船在咖啡杯里斡旋、黑人小伙在云端聽歌、古鎮(zhèn)巷子里迎接龍燈的男女老少……畫面不僅包含高度詳細的場景、神態(tài)動作機器逼真的人物形象,更是呈現(xiàn)出如同電影效果的攝影機運動曲線和同一場景多景別取景。

不僅如此,Sora還可以根據(jù)靜態(tài)圖像制作動畫,立體平面多種風格都可以實現(xiàn),說是動畫工作室出品的最新短片也不為過。

如果不仔細觀察,視頻畫面基本沒有AI制作的違和感,甚至可以抵得上好萊塢嫻熟的現(xiàn)場實拍和龐大的后期團隊合在一起數(shù)月的工作量。

Sora的進化速度,連《流浪地球》的導演郭帆都發(fā)朋友圈感慨,“太快了”,并配上了“哭泣”的表情。

不止大佬郭帆,整個影視行業(yè)都在密切關注Sora?!癝ora大幅提高了影視工業(yè)的生產力。”資深影視從業(yè)者老邱對《最話》說,“人人都可以成為導演的時代快來了?!?/p>

01

視頻行業(yè)的iPhone時刻?

從樣片來看,Sora呈現(xiàn)的效果遠超Pika、Runway。之前的文生視頻模型基本上是生成單鏡頭,一旦輸入新的提示語,畫面主體會出現(xiàn)明顯變化。Sora生成的視頻在視角轉換、鏡頭景別切換后,可以保持主體的一致性,這讓一個人足不出戶制作獨立完整的視頻作品變?yōu)榭赡堋?/p>

Sora正式上線后,專業(yè)短視頻制作成本或將大幅度降低。

“用AI工具開發(fā)一個小說IP,前期開發(fā)的文字和圖片成本可能是以前的十分之一,做一條30秒預告片demo的成本,成本可能是以前的二十分之一?!崩锨裾J為,“有好多故事和題材,一個人用Sora就能做一條片子?!?/p>

但Sora的高效率會不會沖擊到影視行業(yè)從業(yè)者的飯碗?

以短視頻團隊為例,短視頻平臺上1秒種長度的專業(yè)內容基本就對應著1個小時的專業(yè)工作量,一個賬號基礎配置包括出境博主、攝影師、剪輯師的3人團隊。一個日更30秒視頻的賬號需要小團隊每日的高頻產出來維持更新頻率。

使用AI生成視頻后,不僅可以省去實地拍攝的所有成本,攝影師和剪輯師可有可無,甚至連博主都不需要了。只需一個人闡述文本內容就能運作多個賬號,且每個賬號的主角還能不一樣。

據(jù)美媒報道,好萊塢正在擔心AI將導致舞美、后期、*等崗位出現(xiàn)大面積失業(yè)。有統(tǒng)計稱,美國的創(chuàng)意行業(yè)未來三年將有近20.4萬個崗位受到AI的沖擊。

去年5月2日,美國編劇工會(WGA)宣布罷工。7月13日,代表16萬演藝人員的美國演員工會及廣播電視藝人聯(lián)合工會(SAG-AFTRA)也宣布與制片公司的談判破裂,從即日起進行罷工。兩次大罷工,原因除了演員、編劇與資方的薪資矛盾外,人工智能可能取代演員和編劇的威脅成為主要原因。

據(jù)中國僑網(wǎng)消息,參與談判的人表示,通貨膨脹和流媒體生態(tài)系統(tǒng)、福利以及不受監(jiān)管地使用人工智能的威脅削弱了他們的基本工資。

但也有業(yè)內人士對此抱有不一樣的態(tài)度。樂觀主義者將Sora視作是“視頻行業(yè)的iPhone時刻”,將它視作輔助創(chuàng)意執(zhí)行的工具?!癝ora的魅力在于能夠培養(yǎng)創(chuàng)造力。導演可以嘗試不同的美學或場景,而無需承擔與傳統(tǒng)制作相關的財務風險,為以前僅限于想象力的敘事和視覺風格打開了大門?!?/p>

老邱也是類似的觀點,“AI將大幅提升影視作品的產量,更多元的品類和商業(yè)玩法,從而抵消專業(yè)從業(yè)者被AI替崗的沖擊。

AI生成工具需要大量內容進行訓練,而這些內容都是此前創(chuàng)意行業(yè)從業(yè)者辛勤工作得出的成果,所以有創(chuàng)意工作者在質疑大模型訓練是否侵權,AI生成的內容是否可以商用,甚至一些編劇拒絕將其作品用于AI訓練和創(chuàng)作素材。

客觀來說,版權保護、就業(yè)崗位與生成式AI發(fā)展存在相互制約的。目前,各國司法機構都沒有給出明確的界定,短期內相關方還會處于博弈狀態(tài)。

而相比起國外創(chuàng)意工作者擔憂版權被侵權,國內從業(yè)者則看淡許多。目前,影視行業(yè)在研究如何引導AI制作電影短片。老邱認為,“在摸索如何用好AI工具方面,中國影視人非常卷,國外的影視人遠遠沒有中國同行瘋狂。”

02

“中國版的Sora”在哪?

受Sora影響的不止影視、創(chuàng)意、廣告等行業(yè)?!癝ora生成的視頻質量之高,會讓現(xiàn)有視頻生成公司立即感受到威脅?!?/p>

Sora發(fā)布后,此前宣布全面擁抱AI的圖片軟件公司Adobe股價應聲下跌7%,哪怕其去年推出的主打文生圖的FireflyImage2、矢量圖模型FireflyVectorModel以及設計模版生成模型FireflyDesignModel已經(jīng)令人驚艷。

讓人驚訝的是,Sora背后團隊的核心成員僅有13人, 2位負責人也不過剛博士畢業(yè)。Tim Brooks是DALL-E 3作者之一,在英偉達實習時負責過視頻生成研究項目;William Peebles則與CV行業(yè)大神級人物謝賽寧合作發(fā)表了DiT模型,首次將Transformer與擴散模型結合到了一起。

從時間線來看,Sora并非是醞釀多年的項目,就是這支年輕的團隊在一年內搞出來的成果。Tim Brooks稱:“我們認為建立能夠理解視頻的模型,并理解我們世界中所有這些非常復雜的交互,對于人工智能系統(tǒng)而言是非常重要的一步?!?/p>

Sora一出,OpenAI在生成式AI領域的領軍地位再次得到了鞏固,市場立刻給出了積極反饋。早已和奧爾特曼分道揚鑣的馬斯克在個人賬號發(fā)出了“gg humans(人類服輸)”的感嘆。

從meta離職加入紐約大學的謝賽寧盛贊Sora將改變行業(yè),并在社交賬號拆解起OpenAI構建大模型的邏輯。他分析稱,Sora應該是建立在帶有Transformer主干的擴散模型DiT之上的。Sora可能不需要龐大的GPU來訓練,目前大約30億個參數(shù),仍有快速迭代空間。

面對外界的驚嘆,OpenAI一如既往以退為進,用謙虛的言辭炫耀著實力。

OpenAI稱,Sora存在難以準確模擬復雜場景的物理特性、無法理解因果關系的具體實例和混淆提示空間細節(jié)的缺陷,目前還處在測試階段。公司將會給視覺藝術家、創(chuàng)意工作者提供訪問權限,以便收集專業(yè)人士的改進建議,進一步完善模型。

如果說國內影視圈、創(chuàng)意圈是在研究如何用Sora降本增效,自媒體圈是在研究如何以Sora為噱頭賣課,那么Sora的驚艷亮相無疑讓科技公司重燃激情,文本生成視頻賽道成為新戰(zhàn)場。

今年2月7日,抖音集團CEO張楠宣布已辭去集團CEO一職,未來將把精力聚焦在剪映的發(fā)展上。據(jù)媒體報道,過去一年,張楠把絕大多數(shù)精力傾斜到剪映相關業(yè)務上,并親自帶隊尋求在AI輔助創(chuàng)作上有所突破,即將推出一個AI生圖和視頻的產品。

八天后,Sora的火爆讓外界猜測張楠的調崗是否是字節(jié)在做更深的布局。近日更是有傳言稱,字節(jié)跳動已經(jīng)在研發(fā)一款名為Boximator的創(chuàng)新性視頻模型,有人因此認為“中國版的Sora”即將來了。

對此,字節(jié)跳動相關人士也向《最話》回應稱,“Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產品落地,距離國外*的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。”

根據(jù)公開信息顯示,截至2021年,剪映的月活用戶已經(jīng)突破1億,是國內*的移動視頻編輯產品,其已內置了多項 AI 功能。

而從字節(jié)對媒體的回應來看,Boximator模型仍然處于研發(fā)階段,預計將在2-3個月內發(fā)布測試網(wǎng)站。到時才能獲悉其對視頻創(chuàng)作的影響,以及是否會與剪映進行融合。

除了字節(jié)的剪映,還有不少互聯(lián)網(wǎng)公司都推出了自家剪輯工具產品,例如快手推出的快影,B站交出的必剪,但均未公開是否有類Sora產品的計劃。

視頻制作成本高,而各大影視平臺自制劇越來越多,以愛奇藝為例,每年的內容成本就需要上百億。使用AI生成視頻技術將極大降低成本,提高*。據(jù)介紹, 愛奇藝已率先開始在內容策劃、開發(fā)、制作、宣發(fā)等核心環(huán)節(jié)落地生成式AI的應用,并在文本、圖片、聲音、視頻四大應用場景形成了一定生產力。

而另一個視頻平臺優(yōu)酷最近上線的《大唐狄公案》是其首部AI輔助生成*畫面的劇集。相比傳統(tǒng)*方式,阿里大文娛的AI技術,可以用更短時間完成各類虛擬場景的搭建,生成超高精度的*畫面。據(jù)《最話》了解,優(yōu)酷目前正在研究Open AI的產品,而此前火爆一時的AI生成寫真應用“妙鴨相機”就是優(yōu)酷內部創(chuàng)業(yè)項目。

除了視頻平臺,還有不少AI企業(yè)正密切關注著Sora,今年或推出類似的應用?!癝ora給中國科技公司們趟出了條路,指出了方向?!币晃豢萍计髽I(yè)技術人員對《最話》說,“當然,我們的人才、算法比人家還是差得遠?!?/p>

03

進擊的巨頭

接連不斷的顛覆性產品讓OpenAI的影響力與日俱增。盡管還保持著獨特的股權結構,但OpenAI確實越來越商業(yè)化了。據(jù)報道,OpenAI與風險投資公司Thrive capital達成最新股票出售協(xié)議,公司估值突破800億美元,是僅次于字節(jié)跳動和SpaceX的第三大獨角獸。

有起就必然有落。

一夜之間,Sora成為行業(yè)投資人議論的焦點。OpenAI的每一次突破都會讓資本對它的想象空間進一步擴大,同行競爭者能夠拿到的資源也會變少。

不少小型初創(chuàng)公司創(chuàng)始人在看到Sora呈現(xiàn)的效果不得不思考新的發(fā)展方向。有分析人士甚至悲觀地表示,ChatGPT終結了AI文本生成創(chuàng)業(yè),Sora要終結AI視頻生成創(chuàng)業(yè)了。

前阿里技術副總裁,正在進行AI創(chuàng)業(yè)的賈揚清認為:“從算法小廠的角度,要不就算法上媲美OpenAI,要不就垂直領域深耕應用,要不就選擇開源。

OpenAI的遙遙*使得其越發(fā)向著壟斷巨頭的趨勢進化,讓諸多AI領域的創(chuàng)業(yè)公司如坐針氈。

除了AI創(chuàng)業(yè)者,作為大模型的根基,芯片制造領域和OpenAI的關系也在變得微妙。

ChatGPT爆火后,從*數(shù)值來看,英偉達顯然是比OpenAI更大的受益者。2月,英偉達市值飆升至1.8萬億美元,趕超谷歌、亞馬遜,成為美股第三大上市公司。

如果能擁有算力芯片的研發(fā)、制造和生產能力,OpenAI就可以串聯(lián)起整個產業(yè)鏈,奧爾特曼越發(fā)想介入上游。

2月,OpenAI創(chuàng)始人奧爾特曼被爆在跟中東投資人兜售旨在提高全球芯片制造能力的大項目。知情人士透露,奧爾特曼認為現(xiàn)有的AI芯片供應量跟不上AI的高速發(fā)展,芯片會成為實現(xiàn)通用人工智能障礙,他希望籌集5至7萬億美元來建立新的AI芯片企業(yè)。

奧爾特曼的表述顯然言過其實。根據(jù)市場調研機構IC Insights報告,2023年全球整體芯片市場的收入預計提高24%,史上首次突破5000億美元。按現(xiàn)在的增長速度,2030年芯片業(yè)收入才有望突破1萬億美元。

“如果你只是假設計算機不會變得更快,你可能會得出這樣的結論:我們需要 14 個行星、三個星系和四個太陽來為這一切提供燃料,但計算機架構仍在不斷進步?!?/p>

同為輿論焦點人物,英偉達首席執(zhí)行官黃仁勛雖然認為各國都需要建設獨立的AI基礎設施,但是并不認可奧爾特曼的夸張性表達。他認為,芯片業(yè)的擴張并不意味著數(shù)量爆發(fā),而是要提升AI計算的效率,過去十年算力成本已經(jīng)下降了100萬倍。一味地擴大產能將導致供需失衡,沖擊芯片的價值。

OpenAI展現(xiàn)出的實力越大,外界對它的擔憂和爭議也會越多。自ChatGPT爆火,輿論對AI的邊界應該設在哪里的爭議就沒有停下來。從文字到圖片、從圖片到視頻……AI以假亂真變得越來越難以識別。按照現(xiàn)在的進度,AI生成從二維進入三維世界大概率只是時間上的早晚問題。

新的一片天空已然拉開大幕,AI行業(yè)思考如何在激烈的市場競爭中占據(jù)一席之地固然重要,但更重要的是得處理好人類和AI的倫理規(guī)范。

AI可以生成虛幻的數(shù)字影像世界,但監(jiān)管它的規(guī)則,還是由人類來制定的。

免責聲明:本網(wǎng)轉載合作媒體、機構或其他網(wǎng)站的公開信息,并不意味著贊同其觀點或證實其內容的真實性,信息僅供參考,不作為交易和服務的根據(jù)。轉載文章版權歸原作者所有,如有侵權或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財中網(wǎng)合作