從AI視頻生成到生成式AI,
它的想象空間不止如此
@港股研究社原創(chuàng)
作者丨土耳其熱氣球
現(xiàn)任谷歌CEO桑達(dá)爾·皮查伊曾說(shuō)到,人工智能是我們?nèi)祟愓趶氖碌淖顬樯羁痰难芯糠较蛑?,甚至要比火與電還更加深刻。
正如,Sora誕生時(shí),在官方表述中被稱為世界模擬器,它理解真實(shí)的規(guī)則,并在此基礎(chǔ)上生成世界,AI視頻生成,乃至生成式AI本身都是意義非凡的。而在國(guó)內(nèi)堪稱封神之作的快手可靈AI一直在努力接近并超越這一目標(biāo)。
近日,快手正式在App Store上線了可靈AI獨(dú)立APP。天眼查數(shù)據(jù)顯示,就在同一日,快手關(guān)聯(lián)公司北京達(dá)佳互聯(lián)信息技術(shù)有限公司申請(qǐng)的圖生視頻模型生成方法、視頻生成方法及裝置專利也正式對(duì)外公布。
此前,在產(chǎn)品側(cè),快手可靈AI已形成了網(wǎng)頁(yè)版、APP、小程序、海外版等多端跨平臺(tái)的產(chǎn)品矩陣。如今,獨(dú)立App的正式亮相又預(yù)示著什么呢?
自6月正式發(fā)布以來(lái),從1.0版本到1.5版本,可靈AI已經(jīng)完成超9次的升級(jí)迭代,新增多項(xiàng)實(shí)用功能,比如運(yùn)動(dòng)筆刷、對(duì)口型功能、1080P高清畫質(zhì)等。而且,1.5版本的可靈AI,其生成的視頻在清晰度、運(yùn)動(dòng)流暢度和畫面美感上都擁有了質(zhì)的飛躍。
圖源來(lái)自可靈AI
升級(jí)后的可靈AI,不僅清晰度提高了,還可以一次性生成多條視頻,圖生視頻時(shí)長(zhǎng)擴(kuò)展到10秒。最重要的是生成價(jià)格保持不變,加量不加價(jià)的背景下,視頻工作生成效率顯著提高。
而這一次正式落地的可靈AI獨(dú)立APP,從官方描述中,我們會(huì)發(fā)現(xiàn)其定位為新一代創(chuàng)意生產(chǎn)力平臺(tái),基于快手自研的可靈大模型和可圖大模型,提供視頻、圖片生成與編輯能力。
以快手首部AI短劇《山海奇鏡》為例,其由可靈AI提供深度技術(shù)支持,畫面展示從逐幀卡頓,到擺脫動(dòng)態(tài)PPT既視感,畫面一致性、動(dòng)作流暢度、視覺效果等各方面都大受好評(píng),該短劇上線短短數(shù)日,播放量就突破了5000萬(wàn)。
內(nèi)容制作效率提高,內(nèi)容制作方式更多樣化,此時(shí)最先歡呼的就是內(nèi)容創(chuàng)作者們。據(jù)快手副總裁、大模型團(tuán)隊(duì)負(fù)責(zé)人張迪透露,可靈AI上線4個(gè)月多以來(lái),已擁有超過(guò)360萬(wàn)用戶,累計(jì)生成3700萬(wàn)個(gè)視頻和超過(guò)一億張圖片,并在上線次月沖上了全球AI產(chǎn)品增長(zhǎng)排行榜首。
顯而易見的是,可靈AI從孵化到成型,一直在強(qiáng)化自身的AI基因,這一些系列動(dòng)作托舉的正是內(nèi)容輸出能力。
最重要的一點(diǎn)是,在視頻內(nèi)容創(chuàng)作上提質(zhì)提效后,全鏈條的最終落點(diǎn)還是回到了短視頻平臺(tái)。一方面,快手加速布局短劇賽道,可靈AI的快速成長(zhǎng)無(wú)疑是快手短劇提質(zhì)鋪量的關(guān)鍵工具。另一方面,原本就出身短視頻賽道的快手,其平臺(tái)用戶們也因此被激活。
2024年上半年,近2萬(wàn)名商家在快手借助AI矩陣優(yōu)化經(jīng)營(yíng)。另外,第二季度來(lái)自營(yíng)銷客戶的AIGC營(yíng)銷素材消耗單日峰值達(dá)2000萬(wàn)元。而在電商領(lǐng)域,在大模型加持下搜索GMV同比提升超80%。
此外,在短視頻平臺(tái)激烈的競(jìng)爭(zhēng)之下,快手的用戶活躍也并沒未受到影響。QuestMobile最新發(fā)布的數(shù)據(jù)顯示,截至2024年9月,該行業(yè)的月活躍用戶規(guī)模已經(jīng)突破10億大關(guān),達(dá)到了前所未有的10.26億人次。
如此一來(lái),快手借助AI賦能內(nèi)容創(chuàng)作,不僅使用戶基本盤穩(wěn)中有進(jìn),也盤活了自身業(yè)務(wù)保持長(zhǎng)期增長(zhǎng)的潛力。
快手上線可靈AI獨(dú)立APP的同一天,字節(jié)跳動(dòng)旗下大模型AI助手豆包也正式推出了視頻生成內(nèi)測(cè)。據(jù)豆包官網(wǎng)介紹,豆包視頻生成支持圖片文字一鍵成片,能將信息轉(zhuǎn)化為生動(dòng)逼真的視頻內(nèi)容。
此外,今年2月,阿里也上線了一款A(yù)I圖片-音頻-視頻模型技術(shù)EMO,用戶只需要提供一張照片和一段任意音頻文件,EMO即可生成會(huì)說(shuō)話唱歌的AI視頻,以及實(shí)現(xiàn)無(wú)縫對(duì)接的動(dòng)態(tài)小視頻,最長(zhǎng)時(shí)間可達(dá)1分30秒左右。
由于視頻是移動(dòng)互聯(lián)網(wǎng)最大的內(nèi)容消費(fèi)形式,AI視頻生成領(lǐng)域也瞬間成了各大互聯(lián)網(wǎng)巨頭眼中的香餑餑,大家紛紛不約而同的冒頭。
目前,DiT和語(yǔ)言模型是目前AI視頻生成領(lǐng)域最受關(guān)注的兩條技術(shù)路徑。其中,語(yǔ)言模型在國(guó)內(nèi)更占主導(dǎo)地位,主要是通過(guò)文字、圖片、視頻作為提示詞來(lái)進(jìn)行憑空生產(chǎn)。
受算力、數(shù)據(jù)、算法的限制,盡管創(chuàng)意空間無(wú)限,所有的元素都是全新的,但現(xiàn)階段最大的阻礙仍然是成本。因此,在這一條件下,產(chǎn)品側(cè)的各位均處于統(tǒng)一起跑線,漫漫長(zhǎng)路在前方,難分孰強(qiáng)孰弱。
但隨著推理成本持續(xù)下降,生成速度相應(yīng)提高,應(yīng)用層和商業(yè)化的發(fā)展進(jìn)一步明朗。視頻生成內(nèi)容逐漸滲透到各內(nèi)容種類式,比如本土TVC視頻、動(dòng)畫動(dòng)漫、流水線短劇、本土動(dòng)畫電影等。
由此可見,AI視頻生成賦能傳統(tǒng)視頻工作時(shí),其主要價(jià)值就在于素材生成環(huán)節(jié)。而電影等長(zhǎng)視頻題材受累于高昂的制作成本,并不是現(xiàn)階段AI視頻生成的優(yōu)勢(shì)賽段,由此短劇的獨(dú)特性再次被凸顯。
快手可靈AI有《山海奇鏡》,抖音的即夢(mèng)AI有《三星堆:未來(lái)啟示錄》。此外,井英科技也針對(duì)性的自研了短劇視頻生成模型Reel Diffusion,其推出的AI短片《M.A.D》已經(jīng)可以媲美傳統(tǒng)動(dòng)畫短片。
相較之下,快手雖有明顯的先發(fā)優(yōu)勢(shì),但也不得不提防后來(lái)者的窮追不舍。技術(shù)硬實(shí)力是一方面,落地的制作效果也是觸達(dá)用戶的關(guān)鍵一環(huán),兩者皆不可失。雖然快手無(wú)需如臨大敵,但也需時(shí)刻謹(jǐn)慎。
盡管,現(xiàn)階段的AI視頻生成賽道開始日漸擁堵,但回看AI視頻生成應(yīng)用,其本質(zhì)是生成式AI,最大的特點(diǎn)就是從無(wú)到有的去創(chuàng)造。
從ChatGPT的顛覆到Sora的驚艷,再到國(guó)產(chǎn)Sora——可靈AI的面世,這一切歸功于生成式AI的可塑性。正如Sora官方所說(shuō),它是世界模擬器,它理解真實(shí)的規(guī)則,并由此生成世界。
因此,無(wú)論是文生圖,還是文生視頻,生成式AI的潛力都不可估量。這好比汽車行業(yè)正在發(fā)生的變革。以前的自動(dòng)駕駛,需要靠人力來(lái)堆砌算法,窮盡盡可能多的駕駛場(chǎng)景,而到今天,采用端到端的大模型技術(shù)訓(xùn)練后,AI模型先自學(xué)在運(yùn)用,已經(jīng)強(qiáng)于不少真人駕駛,也跳出了最早的印象。
當(dāng)探討當(dāng)今生成式AI所帶來(lái)的變革性機(jī)遇時(shí),互聯(lián)網(wǎng)這一詞匯頻繁被提及,它既是參照物,也是AI實(shí)現(xiàn)顛覆性創(chuàng)新的基礎(chǔ)。
圖源來(lái)自Pixabay
就像在過(guò)去的三十年里,互聯(lián)網(wǎng)浪潮的核心在于連接,它緊密地將人、信息、商業(yè)及工廠相互聯(lián)結(jié),同時(shí)涵蓋海量信息,并通過(guò)增進(jìn)全球協(xié)作效率,催生了難以估量的價(jià)值,由此深刻重塑了人類的生活方式。
盡管過(guò)去AI的發(fā)展重心更多聚焦于模擬人類的感知能力,諸如對(duì)海量信息進(jìn)行自然語(yǔ)言理解、語(yǔ)音識(shí)別以及視覺識(shí)別等。但隨著大模型技術(shù)的逐漸成熟,生成式AI已不再局限于感知層面的,更是首次展現(xiàn)出在思考推理與創(chuàng)造性方面的強(qiáng)大潛力。
基于此,生成式AI從創(chuàng)造相對(duì)已知,到創(chuàng)造絕對(duì)未知,或許不無(wú)可能。此時(shí),生成式AI創(chuàng)造的內(nèi)容價(jià)值將更勝?gòu)那?,甚至于與真實(shí)的物理世界產(chǎn)生關(guān)聯(lián),幫助人們完成實(shí)際的業(yè)務(wù)、工作與學(xué)習(xí)。
這也正是變革的關(guān)鍵。
一年以前,大部分企業(yè)或許對(duì)于生成式AI如何賦能市場(chǎng)尚存疑問,各類細(xì)分賽道尚未分化,專供各個(gè)行業(yè)的垂直應(yīng)用也并不成熟,但在一年后的今天,隨著算力、推理等成本的逐漸下降,以及大量實(shí)踐和試錯(cuò),端到端模型、行業(yè)大模型、文生圖應(yīng)用、文生視頻應(yīng)用接踵而來(lái)。
長(zhǎng)遠(yuǎn)來(lái)看,生成式AI的當(dāng)下是清晰的,未來(lái)更是明朗的。而對(duì)手握佳作可靈AI的快手來(lái)說(shuō),盡管去闖,盡管去放飛想象,未來(lái)始終會(huì)有你的一席之地。
看完覺得寫得好的,不防打賞一元,以支持藍(lán)海情報(bào)網(wǎng)揭秘更多好的項(xiàng)目。