文:互聯(lián)網(wǎng)江湖
作者:劉致呈
有一陣子沒聊AI了,趁著最有時(shí)間,有點(diǎn)看法想跟大家交流。
DeepSeek誕生之后,各個(gè)行業(yè)朝氣蓬勃,百度把DeepSeek做進(jìn)了搜索,騰訊把大模型做進(jìn)了微信,各種行業(yè),各種產(chǎn)品都用上了語(yǔ)言大模型。
一場(chǎng)AI革命,已然發(fā)生了。
前十年,移動(dòng)互聯(lián)網(wǎng)時(shí)代掀起的流量革命,一開始是圖文,然后就是視頻。十年之后的今天,快手、抖音成了全網(wǎng)最大的注意力黑洞,虹吸著流量和以流量為生的業(yè)態(tài)。
往后看十年,AI亦如是。
DeepSeek改變了圖文交互、語(yǔ)言交互,今天的AI正在改變視頻交互。
從AI生文、AI生圖再到大模型生成視頻,這一進(jìn)化符合邏輯,也順應(yīng)歷史周期。問(wèn)題是,新的周期之下,這場(chǎng)AI革命將由誰(shuí)主導(dǎo)?
快手、抖音:天下英雄惟使君與操耳今天的視頻大模型玩家,大概有這么幾類:
第一類是巨頭。
比如,騰訊混元視頻大模型、阿里通義萬(wàn)相。
巨頭布局文生視頻,本質(zhì)上是布局入口,同時(shí)為未來(lái)業(yè)務(wù)端的需求做技術(shù)儲(chǔ)備。
騰訊做文生視頻,可以給視頻號(hào)做能力儲(chǔ)備,一旦有了真正需求,現(xiàn)成的模型就能拿來(lái)用,阿里也是一樣,淘寶越來(lái)越內(nèi)容化,文生視頻這個(gè)能力是留個(gè)后手。
符合大廠一貫的做派,我可以不用,但每個(gè)入口都要布局,每個(gè)能力都要面面俱到。如果賽道里有人跑通了,那就砸資源跟進(jìn)。
語(yǔ)言大模型上,騰訊不也是觀望了很久,直到DeepSeek出世,直接整合進(jìn)微信,摘了最大的果子。
第二類,是AI公司。
比如,商湯科技的V-ME,科大訊飛的訊飛繪鏡。
這些AI公司,囿于自身的實(shí)力以及資源限制,能夠在文生視頻上投入的資源并不多,更多的精力其實(shí)還是在自身業(yè)務(wù)。做大主營(yíng)業(yè)務(wù)是核心KPI。做視頻大模型,陪跑的概率很大。
第三:短視頻平臺(tái)。
短視頻平臺(tái)核心就兩家:快手、抖音。
先來(lái)說(shuō)快手。
最近,市面上有這么一則消息:快手成立了可靈 AI 事業(yè)部??焓指呒?jí)副總裁蓋坤擔(dān)任可靈 AI 事業(yè)部負(fù)責(zé)人,AI戰(zhàn)略在快手內(nèi)部提升至最高級(jí)別。
這動(dòng)作是什么意思呢?
槍擦完了子彈上膛,玩兒真的了。
快手可靈AI增長(zhǎng)是很猛的。今年2月份可靈 AI 累計(jì)營(yíng)業(yè)收入已超過(guò) 1 億元,今年前三個(gè)月,可靈AI營(yíng)收超過(guò)了2024年總和。商業(yè)化這塊兒,可靈AI很有爆發(fā)力。
快手可靈AI生成的視頻質(zhì)量很高,可靈AI2.0的產(chǎn)品能力已經(jīng)追平甚至部分超過(guò)Sora。目前定位于生產(chǎn)力工具。
生產(chǎn)力技術(shù)是最容易變現(xiàn)的。
AI的路線上,快手走的是當(dāng)年微軟走過(guò)的路子。
AI這樣的技術(shù),就是新時(shí)代的office,當(dāng)年微軟靠著office 、Windows掙得盆滿缽滿,就是因?yàn)檐浖鳛樯a(chǎn)力是一種剛需。
視頻大模型,只有先把生產(chǎn)力變現(xiàn)的邏輯跑通了,才能支撐后續(xù)源源不斷迭代。所以,快手內(nèi)部會(huì)上,蓋坤也提到要優(yōu)先保證模型效果,聚焦professional creators。
好產(chǎn)品是不缺用戶的。
可靈AI這一億的營(yíng)收背后是 2200 萬(wàn)用戶,1.5 萬(wàn)開發(fā)者和企業(yè)客戶貢獻(xiàn)的。后續(xù)還會(huì)有多少付費(fèi)用戶,且看快手后續(xù)財(cái)報(bào)。
只是,這一個(gè)億就像是一個(gè)標(biāo)桿,后續(xù)視頻大模型能不能觸及商業(yè)化這個(gè)條線,一個(gè)小目標(biāo)就是個(gè)重要的參考系。
與快手不同,抖音走的是另一條路。
最近,豆包大模型團(tuán)隊(duì)組建了AGI 長(zhǎng)期研究團(tuán)隊(duì),還發(fā)布 Seaweed-7B 模型,號(hào)稱能在25秒內(nèi)生成高質(zhì)量視頻??梢娫谝曨l大模型上,抖音還是聚焦技術(shù)。
相比快手可靈AI,字節(jié)即夢(mèng)在視頻生成效果上略顯粗糙,但體驗(yàn)門檻低。這反映出團(tuán)隊(duì)還在繼續(xù)打磨技術(shù)產(chǎn)品,并希望通過(guò)降低門檻,來(lái)把流量池做起來(lái)。
字節(jié)的優(yōu)勢(shì)是用戶流量池很大,做AI也是復(fù)制過(guò)去成功的路徑。當(dāng)年抖音做起來(lái),也是走的這個(gè)路子。
如今APP工廠的優(yōu)勢(shì)還在延續(xù)。
說(shuō)穿了,字節(jié)做即夢(mèng),重點(diǎn)是鋪量,內(nèi)核其實(shí)還是互聯(lián)網(wǎng)產(chǎn)品,并非生產(chǎn)力邏輯,而是游戲運(yùn)營(yíng)邏輯。
策略上即夢(mèng)先免費(fèi),讓99%的輕度用戶免費(fèi)爽,然后反饋數(shù)據(jù)優(yōu)化版本,用1%的重度用戶買單。
是不是跟某些游戲策劃的腦回路很像?
這個(gè)策略最大的一個(gè)好處是,一方面版本可以繼續(xù)升級(jí),又有足夠的用戶交互反饋數(shù)據(jù)樣本來(lái)優(yōu)化模型,另一方面也能留一點(diǎn)商業(yè)化的火種。
但游戲運(yùn)營(yíng),本質(zhì)是個(gè) UGC的路子。這個(gè)策略能不能走下去,關(guān)鍵就在于用戶活躍度能不能維持下去。
維持用戶活躍度,其實(shí)還是得靠產(chǎn)品,產(chǎn)品好用自然就不缺用戶。所以怎么提升技術(shù),產(chǎn)品能力,是即夢(mèng)眼下最需要解決的問(wèn)題。
生產(chǎn)力邏輯也好,游戲運(yùn)營(yíng)邏輯也罷,兩家路線各有優(yōu)劣,就看誰(shuí)先能跑出來(lái)了。
生成式AI對(duì)于短視頻的意義,如同自動(dòng)駕駛對(duì)于網(wǎng)約車平臺(tái)的意義。這個(gè)業(yè)務(wù)做好了,與快手、抖音主業(yè)是有強(qiáng)大的協(xié)同效應(yīng)的。
這種協(xié)同效應(yīng),可能會(huì)進(jìn)一步改寫流量商業(yè)的底層規(guī)則。
視頻大模型,能不能革流量成本的命?
除了短視頻平臺(tái)本身,視頻大模型,還能顛覆很多。
從落地的角度來(lái)看,未來(lái)視頻大模型的確有兩個(gè)重要的方向。
一個(gè)是專業(yè)化方向。
視頻大模型,最直接的一個(gè)價(jià)值就是降低影視的生產(chǎn)成本。
Sora當(dāng)初之所以備受關(guān)注,是因?yàn)槿藗冾嵏擦巳藗儗?duì)于視覺生產(chǎn)力的認(rèn)知,覺得它能夠顛覆很多行業(yè)的生產(chǎn)方式。
比如,Sora會(huì)改變整個(gè)好萊塢的成本結(jié)構(gòu)。
一項(xiàng)新的技術(shù)、產(chǎn)品,先打透專業(yè)領(lǐng)域是一種普遍的規(guī)律。歷史上,很多偉大的互聯(lián)網(wǎng)產(chǎn)品,都是從B端到C端,比如最早的聊天軟件MSN就是應(yīng)用在商務(wù)端,到后來(lái)的QQ、微信普及,才擴(kuò)散到C端。
當(dāng)文生視頻大模型強(qiáng)到一定程度,就變成了魔法,就像魔幻小說(shuō)里寫的,人人都有了言出法隨的能力。
一句話變成了一個(gè)鏡頭、一段視頻,這會(huì)革了攝影師的命。
比特幣有個(gè)口號(hào):code is law。代碼即法律。換到視頻生成大模型上就是:word is movie。
所述即所見。
放在影視行業(yè)里,所述即所見是很有價(jià)值的。
愛奇藝的自制劇有聲有色,但問(wèn)題就是自制劇相當(dāng)耗費(fèi)資源,所以成本一直是個(gè)問(wèn)題。
你看愛奇藝年報(bào),2024年愛奇藝總成本為219.5億,內(nèi)容成本就有157.1億。同年凈利潤(rùn)同比暴跌60%。天眼查APP融資信息顯示,愛奇藝2018年上市,直到2023年度凈利潤(rùn)才轉(zhuǎn)正。
這充分說(shuō)明一個(gè)問(wèn)題:好內(nèi)容,是要花很多成本打磨的。
《哪吒2》,比如《流浪地球》系列,成本都不低。原因就在于整個(gè)電影工業(yè)化成本的問(wèn)題。我們的電影行業(yè)缺乏工業(yè)基礎(chǔ),好內(nèi)容的制作成本還是太高了。能解決這個(gè)問(wèn)題的,目前看來(lái)只有AI。
在內(nèi)容行業(yè),降本這件事兒,是能解放創(chuàng)造力的。
人類歷史中,鐵器的大規(guī)模使用降低了農(nóng)業(yè)生產(chǎn)成本,人活著的成本降低了,才有了諸子百家、才會(huì)有文藝復(fù)興。
這幾年,影視行業(yè)很慘,大的影視公司都在降本,從降本來(lái)看,視頻大模型是個(gè)不錯(cuò)的方案。成本降下去了,好內(nèi)容多了,影視消費(fèi)也才能起得來(lái)。大家周末更愿意進(jìn)電影院了,也能帶動(dòng)其他服務(wù)消費(fèi)。
至此,服務(wù)消費(fèi)的正循環(huán)就有了。
專業(yè)化方向之外,視頻大模型的另一個(gè)方向是大眾化。
百度有一個(gè)產(chǎn)品叫秒噠,這個(gè)產(chǎn)品可以通過(guò)自然語(yǔ)言描述需求快速生成應(yīng)用程序,門檻很低。這個(gè)產(chǎn)品對(duì)于編程來(lái)說(shuō)是劃時(shí)代的,有了這個(gè)產(chǎn)品,普通也能變成了程序員。
對(duì)于今天的內(nèi)容行業(yè)而言,文生視頻大模型也是劃時(shí)代的。這意味未來(lái)的內(nèi)容創(chuàng)作者數(shù)量可能再次井噴,流量基礎(chǔ)設(shè)施發(fā)生改變。
做內(nèi)容行業(yè)這么多年,我有這么一個(gè)感覺:內(nèi)容這個(gè)東西,本質(zhì)上是一種注意力貨幣,是會(huì)發(fā)生通縮的。也因此內(nèi)容越繁榮,供給越多,實(shí)際的單流量成本越低。
從圖文、到視頻,各種各樣的內(nèi)容暴增,單位流量成本是在一直降低的。
比如說(shuō),公眾號(hào)時(shí)代,圖文單位流量比搜索流量便宜。于是,微商崛起。短視頻時(shí)代,視頻平臺(tái)單位流量比圖文要便宜。然后直播帶貨崛起。
大模型時(shí)代,內(nèi)容供給成本降低,創(chuàng)作數(shù)量一定會(huì)再次暴增,到那時(shí)候,生成視頻的單位流量會(huì)不會(huì)更便宜?在此基礎(chǔ)上會(huì)不會(huì)有新商業(yè)形態(tài)?
我認(rèn)為這些都是可以期待的。
視頻大模型的價(jià)值,一方面在于改變成本,另一方面也在于改變?nèi)藗儎?chuàng)造信息世界的方式。
人們創(chuàng)造信息世界,主要靠三種方式:碼字,代碼,拍攝。
前兩種已經(jīng)被大模型顛覆,現(xiàn)在正經(jīng)歷的是第三種。
現(xiàn)在的互聯(lián)網(wǎng)上的大部分視覺內(nèi)容,要么拍照片,要么拍視頻上傳,太沒有效率了。不符合互聯(lián)網(wǎng)的基本邏輯:極致的效率。
AI天生就是效率機(jī)器。
幻方量化為什么能孵化出DeepSeek,因?yàn)榻鹑诒旧碜非髽O致效率,這與AI的基因是相契合的。
不能否認(rèn),內(nèi)容創(chuàng)作是需要?jiǎng)?chuàng)意的,創(chuàng)意這個(gè)東西,AI還不能完全替代人類,但有了這個(gè)效率工具,我們一定能加速進(jìn)入下一個(gè)視覺互聯(lián)網(wǎng)時(shí)代。
大模型生成視頻,只是推動(dòng)互聯(lián)網(wǎng)向下個(gè)時(shí)代變革的第一步,走出了這一步,也許離真正的元宇宙互聯(lián)網(wǎng)就不遠(yuǎn)了。
最后,行業(yè)格局未定,視頻大模型仍有變數(shù)。今天的可靈AI、即夢(mèng)、通義萬(wàn)相,一如當(dāng)年的微信、飛信、來(lái)往。
圖文AI領(lǐng)域,過(guò)去以為大家都以為最后的王者會(huì)是文心一言、會(huì)是ChatGPT,誰(shuí)承想最后跑出來(lái)了DeepSeek。
DeepSeek顛覆了很多人的認(rèn)知,證明大模型賽道,小而精的路線跑得通。那么問(wèn)題來(lái)了,未來(lái)視頻大模型,會(huì)不會(huì)出現(xiàn)像DeepSeek一樣的Gamechanger?
最終,一切都要交給時(shí)間去驗(yàn)證。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。