国产精品综合av_日韩精品偷拍一区二区_久草视频资源在线_亚洲视频 中文字幕_亚洲电影AV一区春药高潮_小×导航福利在线导航_欧美性爱一级短视频_人成视频免费在线观看不卡_国产九色在线播放_国产高清无码一区二区

藍海情報網(wǎng)

文生視頻大模型,短視頻的過彎點?

藍海情報網(wǎng) 341

文生視頻大模型,短視頻的過彎點?

來源 | 伯虎財經(jīng)(bohuFN)

作者 | 楷楷

隨著今年初Sora的橫空出世,這個可以創(chuàng)建長達一分鐘視頻的文生視頻模型就成為了國內(nèi)廠商追逐的焦點。

6月初,快手自研的視頻生成大模型可靈正式上線。可靈AI采用了與Sora相似的技術(shù)路線,能夠生成具有合理運動和模擬物理世界特性的視頻。

截至目前,已有超百萬人排隊申請內(nèi)測資格,其中超30萬人已獲得試用資格,累計生成超700萬條短視頻。近日,可靈AI終于宣布全面開放內(nèi)測,同時上線付費會員體系。

其他廠商也在迅速跟進。7月,智譜AI 推出AI生成視頻模型智譜清言,用戶可在30秒內(nèi)免費生成6秒視頻。

目前來看,被稱為國產(chǎn)版Sora的可靈AI不僅熱度頗高,用戶對其評價也不錯,在Sora橫空出世卻遲遲未有完善產(chǎn)品落地的背景下,可靈AI甚至被視為業(yè)內(nèi)最佳。

文生視頻大模型目前效果如何?為什么廠商們紛紛開始卷文生視頻大模型?對于短視頻的競爭格局會有哪些影響?

1、劍走偏鋒,可靈大力出奇跡

可靈AI上線至今還不夠兩個月,已經(jīng)經(jīng)歷了三次迭代更新,從最開始的文生視頻,到現(xiàn)在已可支持圖生視頻、視頻續(xù)寫、多尺寸選擇,在生成細節(jié)、構(gòu)圖、運鏡美觀性、光影方面都有很大改善。

據(jù)快手視覺生成與互動中心負責人萬鵬飛表示, 可靈AI生成的視頻分辨率高達1080p,時長最高可達2分鐘(幀率30fps),單次文生視頻時長已增至10秒,這一指標已超越了目前市場上大多數(shù)視頻生成工具。

當下,布局文生視頻賽道的大廠和創(chuàng)業(yè)公司并不少,不過大部分都沒有公布文生視頻模型的參數(shù)量級,快手也表示不便透露。因此,各企業(yè)均主要圍繞生成視頻的時長、視頻的分辨率等指標展開比拼。

目前來看,能實現(xiàn)分鐘級內(nèi)容生產(chǎn)能力的,之前僅有Sora一顆獨苗,能夠生成長達60秒的高清視頻,現(xiàn)在可靈AI則刷新了這一指標,將生成視頻時長拉長至2分鐘。

縱觀其它同類競品,騰訊宣布旗下文生視頻模型生成時長達到了16秒,預(yù)計在三季度達到20秒;字節(jié)旗即夢最長支持生成12秒視頻;美國創(chuàng)企Runway支持生成10秒左右的視頻,最多可延長至18秒,但大部分文生視頻產(chǎn)品的生成時長都在10秒左右。

所以,光看時長這一點,可靈AI確實暫時處于領(lǐng)先狀態(tài);而從生成內(nèi)容這點來看,大部分用戶的評價均是遠超預(yù)期。

比如跟Runway的Gen-3相比,其只有文生視頻功能,但沒有圖生視頻功能;而可靈AI通過迭代新增的運鏡控制、首尾幀自定義等功能,也獲得了用戶的一致好評。

當然,可靈AI也還稱不上完美,有用戶認為其對藝術(shù)風格、攝影語言容易把握不準確,但在吃東西這一領(lǐng)域,可靈AI的表現(xiàn)要比其他產(chǎn)品更優(yōu)秀,這可能也跟快手短視頻更擅長真實畫風有關(guān)。

雖然,目前還不能說可靈AI已經(jīng)能在業(yè)內(nèi)一騎絕塵,但至少已做到了一鳴驚人,這樣的成績背后,則是快手版的大力出奇跡。

程序員出身的快手CEO程一笑,早在去年初快手就啟動新的AI戰(zhàn)略,聚焦大語言模型、視覺生成模型、多模態(tài)模型等方向。

去年10月,快手重啟了一個名為噗嘰的項目,是一款將靜態(tài)圖片生成Gif表情包的工具軟件,這也是可靈AI的前身。

真正的變量則是今年初Sora的重磅發(fā)布,這讓萬鵬看到了DiT(新型視頻生成架構(gòu))的可行性,快手才開始探索打造中國版Sora。

據(jù)自媒體硅星人Pro報道,可靈項目開始后不到一個月,就獲得了程一笑的支持,上升為公司戰(zhàn)略級項目??伸`團隊也很清楚,項目就是要趕在前面,搶先市場,否則就沒有意義。

可靈AI從3月立項到6月上線,僅僅花了3個月的時間,除了快手內(nèi)部的資金、資源向其傾斜之外,技術(shù)大牛的加入也加速了可靈項目的研發(fā)創(chuàng)新,比如曾任騰訊AI實驗室高級研究員的王鑫濤加入了快手視覺生成與互動中心。

引用知乎用戶小林不加班的回答,可靈AI采用了類Sora的技術(shù)路線,并結(jié)合了多項自研創(chuàng)新技術(shù),對視頻處理、生成能力以及空間壓縮,這三個問題進行優(yōu)化,使得模型效率和性能提高、能夠捕捉到更寬廣的特征范圍,模型對細節(jié)的識別能力也隨之增強。

文生視頻大模型,短視頻的過彎點?

2、大廠加速,押注下一個爆款

想做中國版Sora的可不止快手,據(jù)晚點LatePost報道,今年一季度,字節(jié) AI 研發(fā)團隊將視頻生成模型的優(yōu)先級排在了前面;百度在年初推出的視頻生成模型UniVG,也被業(yè)內(nèi)視為與Runway Gen-2相當。

另外,文生視頻領(lǐng)域開源產(chǎn)品的能力也在提升。今年3月,潞晨科技開源了旗下Open-Sora 1.0視頻生成模型,目前能單次生成大概20秒的視頻,隨著開源平臺的普及和能力提升,未來或許還會有更多文生視頻應(yīng)用落地。當然,還有業(yè)內(nèi)公認最強的對手Sora。

廠商們之所以紛紛下注,一方面是因為行業(yè)內(nèi)確實存在海量的需求。相比于語言,視頻和圖片更接近文字,國內(nèi)一些企業(yè)包括美圖等,早已支持一鍵AI美顏的功能。

另一方面,隨著百模大戰(zhàn)逐漸退燒,當下的大模型企業(yè)已經(jīng)不再盲目追求通用大模型的規(guī)模,而是更傾向?qū)⒋竽P图傻疆a(chǎn)品和服務(wù),解決實際問題并創(chuàng)造真正的商業(yè)價值。

而快手之所以能夠先拔頭籌,首先是因為快手作為頭部短視頻平臺,積累了大量的視頻內(nèi)容,同時還通過智能算法對這些內(nèi)容進行細致的分類和標注,這些視頻數(shù)據(jù)已經(jīng)被清洗干凈,可以直接供可靈AI使用。

而在硬件儲備方面,一直以來,快手與英偉達就基于視頻處理有著深度合作。早在2019年,快手便聯(lián)手英偉達部署GPU計算基礎(chǔ)架構(gòu),能讓業(yè)務(wù)性能平均增長了2倍,成本較之前節(jié)省了 30% 以上??焓衷谒懔Ψ矫娴奈从昃I繆,也為可靈項目的快速推進打下了基礎(chǔ)。

最后,當然是快手給了可靈項目最大的資源協(xié)調(diào),有別于字節(jié)、阿里、騰訊等大廠,它們不僅要投入通用大模型的研發(fā),旗下也有不止一個AIGC項目,桃子那么多,哪個最先成熟,似乎還得看時機。

不過,即便可靈AI已經(jīng)先跑一步,也并不意味著其就能安枕無憂。一來,目前在文生視頻領(lǐng)域并不存在斷層式的技術(shù)領(lǐng)先。

愛詩科技創(chuàng)始人王長虎表示,Sora最重要的貢獻是驗證了視頻生成的規(guī)模定律。今年以來,文生視頻領(lǐng)域之所以能夠快速發(fā)展,正是因為Sora的出現(xiàn)驗證出了一條技術(shù)可行性的道路。

但既然文生視頻在技術(shù)上沒有秘密,接下來類似產(chǎn)品拼的無非是算力規(guī)模、訓練數(shù)據(jù)等。業(yè)內(nèi)人士預(yù)計,目前各家大模型廠商都具備了視頻生成能力,只是礙于算力成本以及視頻效果而未有全面鋪開,但這也不過是時間的問題。

二來,若只論算力,快手在國內(nèi)只算是第二梯隊。中信證券曾簡單估算,生成一個60幀的視頻(約6至8秒),Sora要生成至少約120萬個token,推理算力需求遠大于文生文。

如果可靈AI持續(xù)迭代,將會對快手提出更高的算力要求,在全面公測以后,快手還能否繼續(xù)向用戶增加生成視頻的時間,等待時間會否越來越長,其算力天花板到底在哪里,恐怕只有快手自己知道了。

事實上,包括快手在內(nèi),國內(nèi)同行在文生視頻領(lǐng)域均采取較為現(xiàn)實的推進方式,即保持研發(fā)進度,階段性地產(chǎn)出落地。簡單來說,就是先做產(chǎn)品再優(yōu)化,趕進度先拿下市場。

3、快手試水商業(yè)化,意在生態(tài)

Similarweb數(shù)據(jù)顯示,可靈AI在6月初開放之后,網(wǎng)站用戶流量呈現(xiàn)上升態(tài)勢,7月用戶峰值接近10萬DAU水平。月狐iApp數(shù)據(jù)顯示,接入可靈AI的快影App,7月后周均DAU較6月初提升了100萬左右。

可靈AI用戶快速增長背后,一方面是因為用戶對文生視頻的好奇。月狐數(shù)據(jù)對與可靈AI相關(guān)的社交媒體用戶評論數(shù)據(jù)進行了分析,用戶情緒主要表現(xiàn)為好奇、興奮、期待和滿意。

文生視頻大模型,短視頻的過彎點?

另一方面也少不了快手的助推。比如在快手平臺中,帶#可靈#相關(guān)話題標簽的作品會獲得更多流量扶持;可靈AI也推出了AI相關(guān)的內(nèi)容創(chuàng)作活動,包括可靈AI x 快影視頻創(chuàng)作大賽、復(fù)活古畫定向話題投稿活動。

用戶規(guī)模是產(chǎn)品商業(yè)化的土壤,基于此,外界對于可靈商業(yè)化的想象空間也被進一步打開。目前,可靈AI已經(jīng)上線了付費會員體系,分為黃金、鉑金、鉆石三個級別,月卡價格分別為66元、266元和666元,對應(yīng)生成約66個、300個或800個標準視頻。

對比Runway Gen-3 Alpha最低12美元/月;Luma Dream Machine標準版29.99 美元/120次的價格,可靈AI的定價并不算高。而且,據(jù)接近快手人士透露,可靈AI暫無商業(yè)化計劃。

這就意味著通過會員模式來盈利,還不是可靈的首要目的。萬鵬曾公開表示,(可靈出現(xiàn)以后),視頻創(chuàng)作的門檻和效果的ROI大幅度提升,視頻創(chuàng)作者和消費者界限逐漸模糊,越來越多消費者變成創(chuàng)作者,對于視頻創(chuàng)作生態(tài)的繁榮是非常有價值的。

以最近的《山海奇鏡之劈波斬浪》和《三星堆:未來啟示錄》為例,前者是抖音和博納合作的AI科幻短劇,后者則是快手原創(chuàng)的AI奇幻短劇。毫無疑問,AI技術(shù)可以極大程度的豐富平臺內(nèi)容。

因此,爭奪更多內(nèi)容創(chuàng)作者,繁榮快手平臺生態(tài),才是可靈AI的當務(wù)之急。據(jù)快手2024年一季度財報顯示,快手實際月活人數(shù)為6.97億,較上一季度環(huán)比下降0.4%,呈現(xiàn)流失趨勢。

通過引入可靈AI,不僅能幫助創(chuàng)作者降低創(chuàng)作門檻,提升短視頻制作質(zhì)量和效率,也能為快手的內(nèi)容生態(tài)注入新鮮能量。比如在B站等內(nèi)容平臺中,用AI二創(chuàng)視頻就成為了熱門話題,在快手平臺也有不少關(guān)于影視的梗圖創(chuàng)作。

但在幫助內(nèi)容創(chuàng)作者變現(xiàn)的同時,快手也打好了提前量。今年6月,快手電商發(fā)布了使用AIGC能力直播的倡議公告,鼓勵商家/達人和老鐵們進行良好互動,但對于使用AIGC能力輔助創(chuàng)作的內(nèi)容相較于其他實時直播內(nèi)容,平臺不會給予特殊的流量扶持,避免商家濫用AIGC帶來大量低質(zhì)量視頻內(nèi)容。

或許,可靈AI不是快手內(nèi)容生態(tài)的靈丹妙藥,但有噱頭就有熱度,目前快手需要的正是這份繁榮。

近年,快手的直播收入出現(xiàn)了下滑的趨勢,但今年一季度其廣告、電商業(yè)務(wù)都有雙位數(shù)的增長,這意味著快手從去年底開始放開泛貨架場景流量入口的策略已經(jīng)起效。但貨架電商的核心是搜索,這就驅(qū)使快手不得不將內(nèi)容繁榮放在第一位,只有更多的人氣,才會有更多的搜索。

接下來,探索新的內(nèi)容形態(tài)將會是AIGC時代下的短視頻發(fā)展的必經(jīng)之路,而快手的一小步,將是整個短視頻行業(yè)的起步。

雖然快手似乎無意加速商業(yè)化,但可靈AI卻一定需要商業(yè)化,畢竟燒錢以億級起算的大模型是個無底洞的吞金猛獸,快手也不能無限地提供子彈。

將目光從C端轉(zhuǎn)移到B端或更有可能,據(jù)內(nèi)部人士透露,可靈AI將部分內(nèi)測名額給了電商合作比較頻繁的MCN機構(gòu)如遙望科技和大品牌,或許也有測試電商行業(yè)素材的考慮。

有業(yè)內(nèi)人士表示,拍攝一條高質(zhì)量3D動畫視頻,成本要按秒來計算,幾十萬成本也下不來,而可靈、Sora的出現(xiàn)可以起到增強作用,比如視頻某個鏡頭不行就用AI視頻來填充。

當然,要實現(xiàn)這樣的效果,整個視頻生產(chǎn)大模型行業(yè)還需要持續(xù)進化,但對于可靈們來說,這樣的路徑才更為現(xiàn)實,不僅能夠改變短視頻生態(tài),還可以賦能產(chǎn)業(yè)端,比如通過學習爆款視頻的文本結(jié)構(gòu),一鍵生成與商家產(chǎn)品素材匹配的視頻。

目前,各大廠都在卷大模型,但誠如百度李彥宏所言,應(yīng)用才是大模型落地的根本。可靈們的第一步是繁榮內(nèi)容生態(tài),但更關(guān)鍵的卻是第二步,如何讓大模型賦能生態(tài),為平臺帶來增量效益,才是可靈們要思考的問題。

看完覺得寫得好的,不防打賞一元,以支持藍海情報網(wǎng)揭秘更多好的項目。

標簽:

ad2

推薦內(nèi)容